Treebank Statistics: UD_Arabic: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
158849 tokens (56%) have a non-empty value of Number
.
18696 types (71%) occur at least once with a non-empty value of Number
.
7799 lemmas (46%) occur at least once with a non-empty value of Number
.
The feature is used with 7 part-of-speech tags: NOUN (92051; 33% instances), ADJ (29221; 10% instances), VERB (20901; 7% instances), PRON (9991; 4% instances), DET (4562; 2% instances), NUM (1442; 1% instances), AUX (681; 0% instances).
NOUN
92051 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Case=Gen (66159; 72%).
NOUN
tokens may have the following values of Number
:
Dual
(903; 1% of non-emptyNumber
): البلدين، الجانبين، الطرفين، اسبوعين، الدولتين، يومين، وزيري، سنتين، الجانبان، عامينPlur
(20294; 22% of non-emptyNumber
): الولايات، الدول، الشركات، دول، الوزراء، شركات، أسعار، العلاقات، البنوك، مصادرSing
(70854; 77% of non-emptyNumber
): مصر، اليوم، رئيس، دولار، الحكومة، العراق، وزير، كل، الرئيس، غير
Paradigm يَوم | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Definite=Cons | يوم | يومي, يومى | ايام, أيام |
Case=Acc|Definite=Def | اليوم | الأيام, الايام | |
Case=Acc|Definite=Ind | يوما, يوماً | يومين | اياما |
Case=Gen|Definite=Cons | يوم | أيام | |
Case=Gen|Definite=Def | اليوم | اليومين | الايام, الأيام |
Case=Gen|Definite=Ind | يوم | يومين | أيام, ايام |
Case=Nom|Definite=Cons | يوم | أيام | |
Case=Nom|Definite=Def | اليوم | الايام, الأيام | |
Case=Nom|Definite=Ind | يوم |
ADJ
29221 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Case=Gen (19101; 65%), Definite=Def (18902; 65%), Gender=Masc (15039; 51%).
ADJ
tokens may have the following values of Number
:
Dual
(218; 1% of non-emptyNumber
): الماضيين، الكوريتين، القادمين، المقبلين، جافتين، قديمتين، الفنلنديين، قادمين، آخران، آخرينPlur
(1508; 5% of non-emptyNumber
): المصريين، اليهود، العرب، كبار، الفلسطينيين، المسلمين، العراقيين، آخرين، الأجانب، المصابينSing
(27495; 94% of non-emptyNumber
): المصرية، المتحدة، المصري، الماضي، العربية، أي، الحالي، جديدة، الدولية، الفلسطينية
Paradigm مِصرِيّ | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Definite=Def|Gender=Masc | المصري | المصريين | |
Case=Acc|Definite=Def|Gender=Fem | المصرية, المصـــرية | ||
Case=Acc|Definite=Ind|Gender=Masc | مصرياً | مصريين | مصريين |
Case=Acc|Definite=Ind|Gender=Fem | مصرية | ||
Case=Gen|Definite=Def|Gender=Masc | المصري, المصرى | المصريين | |
Case=Gen|Definite=Def|Gender=Fem | المصرية, المصريةـ | المصريتين | |
Case=Gen|Definite=Ind|Gender=Masc | مصري | مصريين | |
Case=Gen|Definite=Ind|Gender=Fem | مصرية | مصريات | |
Case=Nom|Definite=Cons|Gender=Masc | مصري | ||
Case=Nom|Definite=Def|Gender=Masc | المصري, المصرى | المصريون | |
Case=Nom|Definite=Def|Gender=Fem | المصرية | ||
Case=Nom|Definite=Ind|Gender=Masc | مصري | مصريون | |
Case=Nom|Definite=Ind|Gender=Fem | مصرية | مصريتان |
VERB
20901 VERB tokens (100% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Person=3 (20629; 99%), Voice=Act (19687; 94%), Gender=Masc (13172; 63%), Aspect=Perf (11091; 53%), Mood=EMPTY (11091; 53%), VerbForm=EMPTY (11091; 53%).
VERB
tokens may have the following values of Number
:
Dual
(209; 1% of non-emptyNumber
): اتفقا، قتلا، أكدا، بحثا، كانا، عقدا، قدما، كانتا، يشيران، يلتقيانPlur
(1145; 5% of non-emptyNumber
): كانوا، قتلوا، يريدون، يعملون، يعيشون، دعوا، يطالبون، طالبوا، فروا، قالواSing
(19547; 94% of non-emptyNumber
): قال، كان، أضاف، كانت، تم، أكد، يتم، يمكن، أشار، أوضح
Paradigm قَال | Sing | Dual | Plur |
---|---|---|---|
Aspect=Imp|Gender=Masc|Mood=Ind|Person=1|VerbForm=Fin|Voice=Act | نقول | ||
Aspect=Imp|Gender=Masc|Mood=Ind|Person=3|VerbForm=Fin|Voice=Act | يقول | يقولون | |
Aspect=Imp|Gender=Masc|Mood=Ind|Person=3|VerbForm=Fin|Voice=Pass | يقال | ||
Aspect=Imp|Gender=Masc|Mood=Sub|Person=1|VerbForm=Fin|Voice=Act | أقول | ||
Aspect=Imp|Gender=Masc|Mood=Sub|Person=3|VerbForm=Fin|Voice=Act | يقول | ||
Aspect=Imp|Gender=Fem|Mood=Ind|Person=3|VerbForm=Fin|Voice=Act | تقول | ||
Aspect=Perf|Gender=Masc|Person=1|Voice=Act | قلت | ||
Aspect=Perf|Gender=Masc|Person=3|Voice=Act | قال | قالا | قالوا |
Aspect=Perf|Gender=Masc|Person=3|Voice=Pass | قيل | ||
Aspect=Perf|Gender=Fem|Person=3|Voice=Act | قالت |
PRON
9991 PRON tokens (100% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: PronType=Prs (9991; 100%), Person=3 (9693; 97%), Case=Gen (6743; 67%), Gender=Masc (5866; 59%).
PRON
tokens may have the following values of Number
:
Dual
(89; 1% of non-emptyNumber
): هماPlur
(1260; 13% of non-emptyNumber
): هم، نا، هن، كم، نحن، انتم، أنتم، استبعادهم، بأنفسهم، بلادهمSing
(8642; 86% of non-emptyNumber
): ه، ها، هو، هي، ك، هى، ي، ني، أنت، أنا
Paradigm هُوَ | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Gender=Masc|Person=1 | ني | نا | |
Case=Acc|Gender=Masc|Person=2 | ك | كم | |
Case=Acc|Gender=Masc|Person=3 | ه | هما | هم |
Case=Acc|Gender=Fem|Person=3 | ها | هما | هن |
Case=Gen|Gender=Masc|Person=1 | ي | نا, لمساعدتنا | |
Case=Gen|Gender=Masc|Person=2 | ك | كم | |
Case=Gen|Gender=Masc|Person=3 | ه, حكومته, لاراضيه, إدانته, طائرته, وغربه, والده, استعداداته, زنزانته, انتشاره, مستقبله, تجهيزه, بلاده | هما | هم, استبعادهم, بلادهم, لهم, شفائهم, بأنفسهم, بهم |
Case=Gen|Gender=Fem|Person=2 | ك | ||
Case=Gen|Gender=Fem|Person=3 | ها, تخصيصها, بفقدانها, مستشفياتها, أعضائها, أهدافها, بهويتها, مواجهتها, تجميدها, إليها, تجارتها, بضمانها, نهايتها | هما | هن |
Case=Nom|Gender=Masc|Person=1 | أنا, انا | نحن | |
Case=Nom|Gender=Masc|Person=2 | أنت | انتم, أنتم | |
Case=Nom|Gender=Masc|Person=3 | هو | هما | هم |
Case=Nom|Gender=Fem|Person=3 | هي, هى, وهي | هما | هن |
DET
4562 DET tokens (79% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Case=Gen (3096; 68%), PronType=Rel (2513; 55%), Gender=Fem (2397; 53%).
DET
tokens may have the following values of Number
:
Dual
(39; 1% of non-emptyNumber
): اللذين، اللتين، هذين، كلا، اللتان، اللذان، هاتين، ذاتا، هاتان، هٰذانPlur
(242; 5% of non-emptyNumber
): الذين، هؤلاء، اللواتي، هٰؤلاء، اولئك، أولٰئك، اللاتى، أولئك، اللاتيSing
(4281; 94% of non-emptyNumber
): التي، الذي، هذه، هذا، ذلك، التى، ذٰلك، هٰذا، تلك، هٰذهEMPTY
(1207): ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
Paradigm اَلَّذِي | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Gender=Masc | الذي, الذى | اللذين | الذين |
Case=Acc|Gender=Fem | التي, التى | اللتين | |
Case=Gen|Gender=Masc | الذي, الذى | اللذين | الذين |
Case=Gen|Gender=Fem | التي, التى | اللتين | اللواتي, اللاتى, اللاتي |
Case=Nom|Gender=Masc | الذي, الذى | اللذان | الذين |
Case=Nom|Gender=Fem | التي, التى | اللتان |
NUM
1442 NUM tokens (19% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumForm=Word (1442; 100%), Definite=Cons (1117; 77%), Case=Gen (747; 52%).
NUM
tokens may have the following values of Number
:
Dual
(40; 3% of non-emptyNumber
): مليوني، مئتي، ملياري، الفي، بليوني، ألفي، الفى، مليارى، ألفين، الفينPlur
(247; 17% of non-emptyNumber
): ملايين، آلاف، الاف، مليارات، عشرات، بلايين، مئات، العشرات، الملايين، الآلافSing
(1155; 80% of non-emptyNumber
): مليون، مليار، ألف، المئة، بليون، الف، المائة، مليوناً، ملياراً، مليوناEMPTY
(6314): 15، 3، 6، 2، 8، 7، 4، 11، 10، ثلاثة
Paradigm مِليُون | Sing | Dual | Plur |
---|---|---|---|
Case=Acc|Definite=Cons | مليون, ملـيون | مليوني | ملايين |
Case=Acc|Definite=Def | المليون | ||
Case=Acc|Definite=Ind | مليوناً, مليونا | ||
Case=Acc|Polarity=Neg | مليون | ||
Case=Gen|Definite=Cons | مليون | مليوني | ملايين |
Case=Gen|Definite=Def | المليون | الملايين | |
Case=Gen|Definite=Ind | مليون, ملــيون | ملايين | |
Case=Nom|Definite=Cons | مليون | مليونا | ملايين |
Case=Nom|Definite=Def | الملايين |
AUX
681 AUX tokens (100% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Person=3 (670; 98%), Voice=Act (624; 92%), Gender=Masc (429; 63%), Aspect=Perf (389; 57%), Mood=EMPTY (389; 57%), VerbForm=EMPTY (389; 57%).
AUX
tokens may have the following values of Number
:
Dual
(3; 0% of non-emptyNumber
): تعودا، قتلا، يكوناPlur
(21; 3% of non-emptyNumber
): كانوا، زالوا، تكونون، أصيبوا، اعتبروا، اعتقدوا، باتوا، قتلوا، لسنا، ليسواSing
(657; 96% of non-emptyNumber
): كان، يكون، ليس، تكون، كانت، ليست، تعد، قال، يكن، يعتبر
Paradigm كَان | Sing | Dual | Plur |
---|---|---|---|
Aspect=Imp|Gender=Masc|Mood=Ind|Person=2|VerbForm=Fin|Voice=Act | تكون | تكونون | |
Aspect=Imp|Gender=Masc|Mood=Ind|Person=3|VerbForm=Fin|Voice=Act | يكون | ||
Aspect=Imp|Gender=Masc|Mood=Jus|Person=3|VerbForm=Fin|Voice=Act | يكن | ||
Aspect=Imp|Gender=Masc|Mood=Sub|Person=1|VerbForm=Fin|Voice=Act | اكون | نكون | |
Aspect=Imp|Gender=Masc|Mood=Sub|Person=3|VerbForm=Fin|Voice=Act | يكون | يكونا | |
Aspect=Imp|Gender=Fem|Mood=Ind|Person=3|VerbForm=Fin|Voice=Act | تكون | ||
Aspect=Imp|Gender=Fem|Mood=Jus|Person=3|VerbForm=Fin|Voice=Act | تكن | ||
Aspect=Imp|Gender=Fem|Mood=Sub|Person=3|VerbForm=Fin|Voice=Act | تكون | ||
Aspect=Perf|Gender=Masc|Person=1|Voice=Act | كنت | ||
Aspect=Perf|Gender=Masc|Person=3|Voice=Act | كان | كانوا | |
Aspect=Perf|Gender=Fem|Person=3|Voice=Act | كانت | ||
Gender=Masc|Mood=Imp|VerbForm=Fin | كن |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[nmod]–> NOUN (23451; 63%),
NOUN –[amod]–> ADJ (15655; 69%),
VERB –[nsubj]–> NOUN (7033; 77%),
VERB –[obl]–> NOUN (6691; 83%),
NOUN –[conj]–> NOUN (4369; 83%),
VERB –[obj]–> NOUN (3603; 74%),
VERB –[obl:arg]–> NOUN (3597; 77%),
NOUN –[nmod]–> PRON (3426; 72%),
NOUN –[acl]–> VERB (2710; 67%),
VERB –[conj]–> VERB (2288; 92%).