Treebank Statistics: UD_Arabic-PUD: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem, Masc.
12010 tokens (58%) have a non-empty value of Gender.
6148 types (90%) occur at least once with a non-empty value of Gender.
4243 lemmas (89%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (5492; 26% instances), ADJ (1940; 9% instances), VERB (1677; 8% instances), PROPN (1496; 7% instances), PRON (1145; 6% instances), AUX (181; 1% instances), NUM (78; 0% instances), DET (1; 0% instances).
NOUN
5492 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Definite=Def (4233; 77%), Number=Sing (3966; 72%), Case=Gen (3795; 69%).
NOUN tokens may have the following values of Gender:
Fem(1799; 33% of non-emptyGender): النسبة، شركة، منطقة، المنطقة، نهاية، ذات، الحرب، المدينة، فترة، الدولMasc(3693; 67% of non-emptyGender): عام، شكلٍ، الوقت، اسم، القرن، الأمر، أجل، العالم، شأن، سببEMPTY(83): العديد، الكثير، م، البعض، القليل، كلاً، كلٌ، كلٍ، الكثيرون، كثير
| Paradigm رَئِيس | Masc | Fem |
|---|---|---|
| Case=Acc|Definite=Ind|Number=Sing | رئيساً | |
| Case=Gen|Definite=Def|Number=Sing | الرئيس, رئيس | |
| Case=Gen|Definite=Def|Number=Dual | الرئيسين | |
| Case=Gen|Definite=Ind|Number=Sing | رئيسٍ, رئيس | رئيسةٍ |
| Case=Nom|Definite=Def|Number=Sing | رئيس, الرئيس | |
| Case=Nom|Definite=Ind|Number=Plur | رؤساء |
Gender seems to be lexical feature of NOUN. 98% lemmas (2055) occur only with one value of Gender.
ADJ
1940 ADJ tokens (96% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (1865; 96%), Definite=Def (1215; 63%), Case=Gen (1183; 61%).
ADJ tokens may have the following values of Gender:
Fem(1017; 52% of non-emptyGender): الخاصة، المتحدة، كبيرة، الأولى، أخرى، الجديدة، البريطانية، جديدة، الأمريكية، الشماليةMasc(923; 48% of non-emptyGender): الأول، الثاني، أكثر، إسترليني، كبير، الثالث، كبيراً، آخر، أكبر، المتوسطEMPTY(85): أكثر، أول، أفضل، أقصى، الأكثر، أقل، الأقل، أطول، أكبر، أبرز
| Paradigm أَوَّل | Masc | Fem |
|---|---|---|
| Case=Acc|Definite=Def|Number=Sing | الأول | الأولى |
| Case=Acc|Definite=Ind|Number=Sing | أول | أولى |
| Case=Gen|Definite=Def|Number=Sing | الأول | الأولى |
| Case=Gen|Definite=Def|Number=Plur | أوائل | |
| Case=Gen|Definite=Ind|Number=Sing | أول | أولى |
| Case=Nom|Definite=Def|Number=Sing | الأول, أول | أولى, الأولى |
| Case=Nom|Definite=Ind|Number=Plur | أولى |
VERB
1677 VERB tokens (96% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=3 (1657; 99%), Number=Sing (1566; 93%), Voice=Act (1488; 89%), Tense=Past (862; 51%), Aspect=Imp (850; 51%), VerbForm=Fin (848; 51%).
VERB tokens may have the following values of Gender:
Fem(634; 38% of non-emptyGender): كانت، بدأت، قالت، تكون، تظهر، تضم، تقول، ظهرت، تبدأ، تعدMasc(1043; 62% of non-emptyGender): يمكن، كان، قال، يكون، تم، يكن، بدأ، يقول، بات، أصبحEMPTY(77): أعرف، أحب، أعتقد، ألعب، بحثت، نحتاج، نرى، آمل، أبحث، أتحدث
| Paradigm كَان | Masc | Fem |
|---|---|---|
| Aspect=Imp|Mood=Ind|Number=Sing|Tense=Fut|VerbForm=Fin | يكون | |
| Aspect=Imp|Mood=Ind|Number=Sing|Tense=Pres|VerbForm=Fin | يكون, يكن | تكن |
| Aspect=Imp|Mood=Jus|Number=Sing|Tense=Past|VerbForm=Fin | يكن | |
| Aspect=Imp|Mood=Sub|Number=Sing|Tense=Fut|VerbForm=Fin | يكون | |
| Aspect=Imp|Mood=Sub|Number=Sing|Tense=Pres|VerbForm=Fin | يكون | |
| Aspect=Perf|Number=Sing|Tense=Past | كان | كانت |
| Aspect=Perf|Number=Dual|Tense=Past | كانتا | |
| Aspect=Perf|Number=Plur|Tense=Past | كانوا |
PROPN
1496 PROPN tokens (87% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (1433; 96%), Definite=EMPTY (1177; 79%), Case=EMPTY (1008; 67%).
PROPN tokens may have the following values of Gender:
Fem(656; 44% of non-emptyGender): الصين، الولايات، فرنسا، أفريقيا، بريطانيا، روسيا، أستراليا، ألبانيا، أمريكا، أوروباMasc(840; 56% of non-emptyGender): تشرين، البحر، كانون، ترامب، نيسان، الاتحاد، جوزيف، دي، مجلس، نهرEMPTY(232): سي، بي، إن، إس، هونغ، كونغ، جي، آي، إف، إم
| Paradigm بِكِين | Masc | Fem |
|---|---|---|
| بكين | بكين |
Gender seems to be lexical feature of PROPN. 97% lemmas (892) occur only with one value of Gender.
PRON
1145 PRON tokens (88% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (1012; 88%), Case=Gen (765; 67%), PronType=Prs (744; 65%), Person=3 (736; 64%).
PRON tokens may have the following values of Gender:
Fem(464; 41% of non-emptyGender): ها، التي، هذه، هي، تلك، هن، غالبيت، هذا، هم، ينتورMasc(681; 59% of non-emptyGender): ه، هم، ذلك، هذا، الذي، هو، الذين، ك، أولئك، آخرEMPTY(154): ما، نا، هما، ي، من، ه، أنا، ك، ماذا، ني
| Paradigm هُوَ | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing|Person=2 | ك | |
| Case=Acc|Number=Sing|Person=3 | ه | ها |
| Case=Acc|Number=Plur|Person=3 | هم | |
| Case=Gen|Number=Sing|Person=2 | ك | |
| Case=Gen|Number=Sing|Person=3 | ه | ها |
| Case=Gen|Number=Plur|Person=3 | هم | هن, هم |
| Case=Nom|Number=Sing|Person=3 | هو | هي |
| Case=Nom|Number=Plur|Person=3 | هم | |
| Number=Sing|Person=3 | هو, ه | هي |
AUX
181 AUX tokens (97% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Voice=Act (179; 99%), Person=3 (177; 98%), Number=Sing (168; 93%), Tense=Past (156; 86%), Mood=EMPTY (150; 83%), VerbForm=EMPTY (150; 83%), Aspect=Perf (147; 81%).
AUX tokens may have the following values of Gender:
Fem(65; 36% of non-emptyGender): كانت، تكن، تكون، ليستMasc(116; 64% of non-emptyGender): كان، يكون، كانوا، كنت، كون، ليس، يكنEMPTY(5): كنت، أكن، كنا
| Paradigm كَان | Masc | Fem |
|---|---|---|
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | يكون | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | يكون | تكون |
| Aspect=Imp|Mood=Jus|Number=Sing|Person=3|Tense=Past|VerbForm=Fin|Voice=Act | يكن | تكن |
| Aspect=Imp|Mood=Sub|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | يكون | تكون |
| Aspect=Perf|Number=Sing|Person=2|Tense=Past|Voice=Act | كنت | |
| Aspect=Perf|Number=Sing|Person=3|Tense=Past|Voice=Act | كان | كانت |
| Aspect=Perf|Number=Plur|Person=3|Tense=Past|Voice=Act | كانوا | |
| Case=Gen|Definite=Def | كون |
NUM
78 NUM tokens (21% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Number=Plur (73; 94%), Case=Gen (44; 56%).
NUM tokens may have the following values of Gender:
Fem(31; 40% of non-emptyGender): عشرة، أربعة، ثلاثة، ثمانية، خمسة، سبعة، المئة، ستة، الثلاثة، الثلاثينMasc(47; 60% of non-emptyGender): عشر، ثلاث، مليون، أربع، مليار، ست، آلاف، أربعة، أربعين، ألفيEMPTY(293): 1، 10، 3، 2014، 2015، 100، 1492، 2010، 2012، 2013
| Paradigm أربعة | Masc | Fem |
|---|---|---|
| Case=Acc | أربعة | |
| Case=Nom | أربعة | أربعة |
Gender seems to be lexical feature of NUM. 97% lemmas (28) occur only with one value of Gender.
DET
1 DET tokens (1% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Case=EMPTY (1; 100%), PronType=Art (1; 100%).
DET tokens may have the following values of Gender:
Masc(1; 100% of non-emptyGender): لوEMPTY(165): كل، أحد، بعض، إحدى، أي، عدة، آخر، معظم، جميع، شبه
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (1110; 81%),
NOUN –[nmod]–> NOUN (1053; 55%),
VERB –[nsubj]–> NOUN (539; 85%),
PROPN –[amod]–> ADJ (235; 98%),
VERB –[obj]–> NOUN (218; 51%),
VERB –[nsubj]–> PRON (177; 98%),
NOUN –[conj]–> NOUN (173; 66%),
VERB –[nsubj]–> PROPN (173; 90%),
NOUN –[acl:relcl]–> VERB (157; 71%),
PROPN –[flat]–> PROPN (138; 75%).