Treebank Statistics: UD_Arabic-PUD: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
12295 tokens (59%) have a non-empty value of Number
.
6332 types (93%) occur at least once with a non-empty value of Number
.
4380 lemmas (92%) occur at least once with a non-empty value of Number
.
The feature is used with 7 part-of-speech tags: NOUN (5450; 26% instances), ADJ (1943; 9% instances), VERB (1746; 8% instances), PROPN (1658; 8% instances), PRON (1226; 6% instances), AUX (184; 1% instances), NUM (88; 0% instances).
NOUN
5450 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Definite=Def (4216; 77%), Case=Gen (3779; 69%), Gender=Masc (3635; 67%).
NOUN
tokens may have the following values of Number
:
Dual
(73; 1% of non-emptyNumber
): سنتين، عامي، أسبوعين، الاثنين، عينا، قسمين، ألبومين، إدارتي، الأدبيتين، الاعتدالينPlur
(1390; 26% of non-emptyNumber
): الدول، الناس، الأراضي، سنوات، الشركات، المناطق، أراضي، الجزر، الذكور، السنواتSing
(3987; 73% of non-emptyNumber
): عام، شكلٍ، الوقت، اسم، القرن، الأمر، أجل، العالم، النسبة، شأنEMPTY
(128): العديد، الكثير، وفقاً، بدءاً، بدلاً، م، نظراً، البعض، القليل، علاوةً
Paradigm مِنطَقَة | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Definite=Def | منطقة, المنطقة | المناطق | |
Case=Gen|Definite=Def | المنطقة, منطقة, لمنطقة, منطقت | المناطق, مناطق | |
Case=Gen|Definite=Ind | منطقة | ||
Case=Nom|Definite=Def | المنطقة, منطقة | منطقتا |
ADJ
1943 ADJ tokens (96% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Definite=Def (1216; 63%), Case=Gen (1184; 61%), Gender=Fem (1017; 52%).
ADJ
tokens may have the following values of Number
:
Dual
(14; 1% of non-emptyNumber
): أستراليان، ألحقا، إضافيتين، إضافيين، الثاني، الشمسيين، الماضيين، المتخاصمين، المعروضتان، طبيعيتانPlur
(62; 3% of non-emptyNumber
): الأصليين، الحمر، الست، السياسيين، اللاتينيين، آخرين، أستراليون، أصليون، ألمانيين، أوائلSing
(1867; 96% of non-emptyNumber
): الأول، الخاصة، المتحدة، كبيرة، الثاني، الأولى، أخرى، الجديدة، أكثر، إسترلينيEMPTY
(83): أكثر، أول، أفضل، أقصى، الأكثر، أقل، الأقل، أطول، أكبر، أبرز
Paradigm أُستُرالِيّ | Sing | Dual | Plur |
---|---|---|---|
Case=Gen|Definite=Def|Gender=Fem | الأسترالية | ||
Case=Nom|Definite=Def|Gender=Masc | الأستراليون | ||
Case=Nom|Definite=Def|Gender=Fem | الأسترالية | ||
Case=Nom|Definite=Ind|Gender=Masc | أستراليان | أستراليون |
Number
seems to be lexical feature of ADJ
. 96% lemmas (792) occur only with one value of Number
.
VERB
1746 VERB tokens (100% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Person=3 (1657; 95%), Voice=Act (1560; 89%), Gender=Masc (1039; 60%), Aspect=Imp (903; 52%), Tense=Past (883; 51%).
VERB
tokens may have the following values of Number
:
Dual
(21; 1% of non-emptyNumber
): أنجبا، انتهيا، تجوبان، تحدثان، تغنيان، تقيسان، زرعا، شاركا، صنفتا، غمراPlur
(120; 7% of non-emptyNumber
): يحملون، حصلوا، قرروا، كانوا، نحتاج، نرى، يتمتعون، يعانون، أثاروا، أجبرواSing
(1605; 92% of non-emptyNumber
): يمكن، كان، قال، كانت، يكون، تم، بدأت، قالت، يكن، بدأEMPTY
(4): أملاً، إلباس، اعتبار، جعل
Paradigm كَان | Sing | Dual | Plur |
---|---|---|---|
Aspect=Imp|Gender=Masc|Mood=Ind|Tense=Fut | يكون | ||
Aspect=Imp|Gender=Masc|Mood=Ind|Tense=Pres | يكون, يكن | ||
Aspect=Imp|Gender=Masc|Mood=Jus|Tense=Past | يكن | ||
Aspect=Imp|Gender=Masc|Mood=Sub|Tense=Fut | يكون | ||
Aspect=Imp|Gender=Masc|Mood=Sub|Tense=Pres | يكون | ||
Aspect=Imp|Gender=Fem|Mood=Ind|Tense=Pres | تكن | ||
Aspect=Perf|Gender=Masc|Tense=Past | كان | كانوا | |
Aspect=Perf|Gender=Fem|Tense=Past | كانت | كانتا |
Number
seems to be lexical feature of VERB
. 90% lemmas (568) occur only with one value of Number
.
PROPN
1658 PROPN tokens (96% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Definite=EMPTY (1335; 81%), Case=EMPTY (1170; 71%), Gender=Masc (837; 50%).
PROPN
tokens may have the following values of Number
:
Dual
(4; 0% of non-emptyNumber
): الأمريكيتين، البحرين، القديسين، لأمريكيتينPlur
(57; 3% of non-emptyNumber
): الولايات، الألعاب، الشيوخ، لولايات، الألب، الأمم، المايا، جزر، أخبار، أشياءSing
(1597; 96% of non-emptyNumber
): تشرين، البحر، الصين، ترامب، هونغ، كانون، دي، كونغ، نيسان، الاتحادEMPTY
(70): سي، بي، إن، إس، جي، آي، إف، إم، إي، إيه
Paradigm وِلايَة | Sing | Plur |
---|---|---|
Case=Acc | الولايات | |
Case=Gen | ولاية | الولايات, لولايات |
Case=Nom | الولايات |
Number
seems to be lexical feature of PROPN
. 99% lemmas (1035) occur only with one value of Number
.
PRON
1226 PRON tokens (94% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Case=Gen (820; 67%), Person=3 (756; 62%), Gender=Masc (681; 56%).
PRON
tokens may have the following values of Number
:
Dual
(23; 2% of non-emptyNumber
): هما، اللذان، اللذين، هذان، هذينPlur
(165; 13% of non-emptyNumber
): هم، نا، الذين، أولئك، هن، كم، نحن، هؤلاءSing
(1038; 85% of non-emptyNumber
): ه، ها، التي، ذلك، هذا، الذي، هذه، هو، هي، تلكEMPTY
(73): ما، من، ه، ماذا، ك، م، ها
Paradigm هُوَ | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Gender=Masc|Person=2 | ك | ||
Case=Acc|Gender=Masc|Person=3 | ه | هم | |
Case=Acc|Gender=Fem|Person=3 | ها | ||
Case=Acc|Person=1 | ني | نا | |
Case=Acc|Person=2 | ك | ||
Case=Acc|Person=3 | هما | ||
Case=Gen|Gender=Masc|Person=2 | ك | ||
Case=Gen|Gender=Masc|Person=3 | ه | هم | |
Case=Gen|Gender=Fem|Person=3 | ها | هن, هم | |
Case=Gen|Person=1 | ي, نا | نا | |
Case=Gen|Person=2 | ك | هما | كم |
Case=Gen|Person=3 | هما | هم | |
Case=Nom|Gender=Masc|Person=3 | هو | هم | |
Case=Nom|Gender=Fem|Person=3 | هي | ||
Case=Nom|Person=1 | أنا | نحن | |
Gender=Masc|Person=3 | هو, ه | ||
Gender=Fem|Person=3 | هي | ||
Person=3 | هما |
AUX
184 AUX tokens (99% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Voice=Act (184; 100%), Person=3 (178; 97%), Tense=Past (161; 88%), Mood=EMPTY (152; 83%), Aspect=Perf (151; 82%), Gender=Masc (114; 62%).
AUX
tokens may have the following values of Number
:
Plur
(12; 7% of non-emptyNumber
): كانوا، كناSing
(172; 93% of non-emptyNumber
): كان، كانت، يكون، تكن، تكون، كنت، ليس، ليست، يكن، أكنEMPTY
(2): كون
Paradigm كَان | Sing | Plur |
---|---|---|
Aspect=Imp|Gender=Masc|Mood=Ind|Person=3|Tense=Fut | يكون | |
Aspect=Imp|Gender=Masc|Mood=Ind|Person=3|Tense=Pres | يكون | |
Aspect=Imp|Gender=Masc|Mood=Jus|Person=3|Tense=Past | يكن | |
Aspect=Imp|Gender=Masc|Mood=Sub|Person=3|Tense=Pres | يكون | |
Aspect=Imp|Gender=Fem|Mood=Ind|Person=3|Tense=Pres | تكون | |
Aspect=Imp|Gender=Fem|Mood=Jus|Person=3|Tense=Past | تكن | |
Aspect=Imp|Gender=Fem|Mood=Sub|Person=3|Tense=Pres | تكون | |
Aspect=Imp|Mood=Jus|Person=3|Tense=Past | أكن | |
Aspect=Perf|Gender=Masc|Person=2|Tense=Past | كنت | |
Aspect=Perf|Gender=Masc|Person=3|Tense=Past | كان | كانوا |
Aspect=Perf|Gender=Fem|Person=3|Tense=Past | كانت | |
Aspect=Perf|Person=1|Tense=Past | كنت | كنا |
NUM
88 NUM tokens (24% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: Case=Gen (51; 58%), Gender=Masc (47; 53%).
NUM
tokens may have the following values of Number
:
Dual
(2; 2% of non-emptyNumber
): ألفي، ملياريPlur
(82; 93% of non-emptyNumber
): ثلاث، عشر، مليون، أربعة، عشرة، مليار، أربع، ثلاثة، ثمانية، خمسةSing
(4; 5% of non-emptyNumber
): عشر، مليونEMPTY
(283): 1، 10، 3، 2014، 2015، 100، 1492، 2010، 2012، 2013
Paradigm عشر | Sing | Plur |
---|---|---|
Case=Acc | عشر | |
Case=Gen | عشر | عشر |
Number
seems to be lexical feature of NUM
. 94% lemmas (30) occur only with one value of Number
.
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[nmod]–> NOUN (1177; 62%),
NOUN –[amod]–> ADJ (914; 67%),
VERB –[obl]–> NOUN (818; 75%),
VERB –[nsubj]–> NOUN (442; 70%),
NOUN –[nmod]–> PROPN (366; 70%),
VERB –[obj]–> NOUN (278; 65%),
NOUN –[nmod]–> PRON (276; 66%),
PROPN –[flat]–> PROPN (232; 96%),
PROPN –[amod]–> ADJ (206; 85%),
NOUN –[conj]–> NOUN (200; 76%).