Treebank Statistics: UD_Arabic-PADT: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem, Masc.
67429 tokens (24%) have a non-empty value of Gender.
9336 types (37%) occur at least once with a non-empty value of Gender.
3447 lemmas (23%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: ADJ (29351; 10% instances), VERB (21296; 8% instances), PRON (10877; 4% instances), DET (4668; 2% instances), NUM (702; 0% instances), AUX (505; 0% instances), NOUN (27; 0% instances), PROPN (3; 0% instances).
ADJ
29351 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (27614; 94%), Case=Gen (19121; 65%), Definite=Def (18961; 65%).
ADJ tokens may have the following values of Gender:
Fem(14229; 48% of non-emptyGender): المصرية، المتحدة، العربية، جديدة، الدولية، الفلسطينية، خاصة، أخرى، الأمريكية، العامةMasc(15122; 52% of non-emptyGender): المصري، الماضي، أي، الحالي، العام، المقبل، المركزي، أكثر، الدولي، الاول
| Paradigm مِصرِيّ | Masc | Fem |
|---|---|---|
| Case=Acc|Definite=Def|Number=Sing | المصري | المصرية, المصـــرية |
| Case=Acc|Definite=Def|Number=Plur | المصريين | |
| Case=Acc|Definite=Ind|Number=Sing | مصرياً | مصرية |
| Case=Acc|Definite=Ind|Number=Dual | مصريين | |
| Case=Acc|Definite=Ind|Number=Plur | مصريين | |
| Case=Gen|Definite=Def|Number=Sing | المصري, المصرى | المصرية, المصريةـ |
| Case=Gen|Definite=Def|Number=Dual | المصريتين | |
| Case=Gen|Definite=Def|Number=Plur | المصريين | |
| Case=Gen|Definite=Ind|Number=Sing | مصري | مصرية |
| Case=Gen|Definite=Ind|Number=Plur | مصريين | مصريات |
| Case=Nom|Definite=Cons|Number=Sing | مصري | |
| Case=Nom|Definite=Def|Number=Sing | المصري, المصرى | المصرية |
| Case=Nom|Definite=Def|Number=Plur | المصريون | |
| Case=Nom|Definite=Ind|Number=Sing | مصري | مصرية |
| Case=Nom|Definite=Ind|Number=Dual | مصريتان | |
| Case=Nom|Definite=Ind|Number=Plur | مصريون |
VERB
21296 VERB tokens (100% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=3 (20900; 98%), Voice=Act (20020; 94%), Number=Sing (19849; 93%), Aspect=Perf (11215; 53%), Mood=EMPTY (11215; 53%), VerbForm=EMPTY (11215; 53%).
VERB tokens may have the following values of Gender:
Fem(7836; 37% of non-emptyGender): كانت، قالت، ذكرت، بلغت، تصل، تكون، بدأت، تقوم، أكدت، نقلتMasc(13460; 63% of non-emptyGender): قال، كان، أضاف، تم، أكد، يتم، يمكن، أشار، أوضح، أعلن
| Paradigm قَال | Masc | Fem |
|---|---|---|
| Aspect=Imp|Mood=Ind|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | أقول | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يقول | تقول |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Pass | يقال | |
| Aspect=Imp|Mood=Ind|Number=Plur|Person=1|VerbForm=Fin|Voice=Act | نقول | |
| Aspect=Imp|Mood=Ind|Number=Plur|Person=3|VerbForm=Fin|Voice=Act | يقولون | |
| Aspect=Imp|Mood=Sub|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | أقول | |
| Aspect=Imp|Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يقول | |
| Aspect=Perf|Number=Sing|Person=1|Voice=Act | قلت | |
| Aspect=Perf|Number=Sing|Person=3|Voice=Act | قال | قالت |
| Aspect=Perf|Number=Sing|Person=3|Voice=Pass | قيل | |
| Aspect=Perf|Number=Dual|Person=3|Voice=Act | قالا | |
| Aspect=Perf|Number=Plur|Person=3|Voice=Act | قالوا |
PRON
10877 PRON tokens (100% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: PronType=Prs (10850; 100%), Person=3 (10131; 93%), Number=Sing (9002; 83%), Case=Gen (7425; 68%).
PRON tokens may have the following values of Gender:
Fem(4238; 39% of non-emptyGender): ها، هي، هما، هن، هى، ك، أعضائها، أهدافها، إليها، بضمانهاMasc(6639; 61% of non-emptyGender): ه، هم، هو، نا، هما، ك، ي، ني، نحن، كم
| Paradigm هُوَ | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing|Person=1|PronType=Prs | ني | |
| Case=Acc|Number=Sing|Person=2|PronType=Prs | ك | |
| Case=Acc|Number=Sing|Person=3|PronType=Prs | ه | ها |
| Case=Acc|Number=Dual|Person=3|PronType=Prs | هما | هما |
| Case=Acc|Number=Plur|Person=1|PronType=Prs | نا | |
| Case=Acc|Number=Plur|Person=2|PronType=Int | كم | |
| Case=Acc|Number=Plur|Person=3|PronType=Prs | هم | هن |
| Case=Gen|Number=Sing|Person=1|PronType=Prs | ي, ني | |
| Case=Gen|Number=Sing|Person=2|PronType=Prs | ك | ك |
| Case=Gen|Number=Sing|Person=3|PronType=Prs | ه, إدانته, استعداداته, انتشاره, بلاده, تجهيزه, حكومته, زنزانته, طائرته, لاراضيه, مستقبله, والده, وغربه | ها, أعضائها, أهدافها, إليها, بضمانها, بفقدانها, بهويتها, تجارتها, تجميدها, تخصيصها, مستشفياتها, مواجهتها, نهايتها |
| Case=Gen|Number=Dual|Person=2|PronType=Prs | كما | |
| Case=Gen|Number=Dual|Person=3|PronType=Prs | هما | هما |
| Case=Gen|Number=Plur|Person=1|PronType=Prs | نا, لمساعدتنا | |
| Case=Gen|Number=Plur|Person=2|PronType=Int | كم | |
| Case=Gen|Number=Plur|Person=3|PronType=Prs | هم, استبعادهم, بأنفسهم, بلادهم, بهم, شفائهم, لهم | هن |
| Case=Nom|Number=Sing|Person=1|PronType=Prs | أنا, انا | |
| Case=Nom|Number=Sing|Person=2|PronType=Prs | أنت | |
| Case=Nom|Number=Sing|Person=3|PronType=Prs | هو | هي, هى, وهي |
| Case=Nom|Number=Dual|Person=3|PronType=Prs | هما | هما |
| Case=Nom|Number=Plur|Person=1|PronType=Prs | نحن | |
| Case=Nom|Number=Plur|Person=2|PronType=Prs | انتم, أنتم | |
| Case=Nom|Number=Plur|Person=3|PronType=Prs | هم | هن |
DET
4668 DET tokens (79% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (4383; 94%), Case=Gen (3107; 67%), PronType=Rel (2532; 54%).
DET tokens may have the following values of Gender:
Fem(2417; 52% of non-emptyGender): التي، هذه، التى، تلك، هٰذه، اللتين، اللواتي، ها، اللتان، اللاتىMasc(2251; 48% of non-emptyGender): الذي، هذا، ذلك، الذين، ذٰلك، هٰذا، الذى، هؤلاء، اللذين، هEMPTY(1228): ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
| Paradigm اَلَّذِي | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing | الذي, الذى | التي, التى |
| Case=Acc|Number=Dual | اللذين | اللتين |
| Case=Acc|Number=Plur | الذين | |
| Case=Gen|Number=Sing | الذي, الذى | التي, التى |
| Case=Gen|Number=Dual | اللذين | اللتين |
| Case=Gen|Number=Plur | الذين | اللواتي, اللاتى, اللاتي |
| Case=Nom|Number=Sing | الذي, الذى | التي, التى |
| Case=Nom|Number=Dual | اللذان | اللتان |
| Case=Nom|Number=Plur | الذين |
NUM
702 NUM tokens (9% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (702; 100%), Number=EMPTY (702; 100%), Case=Gen (411; 59%), Definite=Cons (401; 57%).
NUM tokens may have the following values of Gender:
Fem(210; 30% of non-emptyGender): ثلاث، عشر، الثلاث، خمس، ست، عشرة، اربع، الخمس، الثماني، العشرMasc(492; 70% of non-emptyGender): ثلاثة، خمسة، ستة، عشرة، الثلاثة، اربعة، اثنين، أربعة، سبعة، واحدEMPTY(7056): مليون، 15، 3، 6، 2، 8، 7، مليار، ألف، 4
| Paradigm ثَلَاثَة | Masc | Fem |
|---|---|---|
| Case=Acc|Definite=Cons | ثلاثة | ثلاث |
| Case=Acc|Definite=Def | الثلاثة, الثلاثـــــة | الثلاث |
| Case=Acc|Definite=Ind | ثلاثة | ثلاثا |
| Case=Gen|Definite=Com | الثلاثة | |
| Case=Gen|Definite=Cons | ثلاثة | ثلاث |
| Case=Gen|Definite=Def | الثلاثة | الثلاث |
| Case=Gen|Definite=Ind | ثلاثة | ثلاث |
| Case=Nom|Definite=Cons | ثلاثة | ثلاث |
| Case=Nom|Definite=Def | الثلاثة | الثلاث |
| Case=Nom|Definite=Ind | ثلاثة | ثلاث |
AUX
505 AUX tokens (23% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Voice=Act (503; 100%), Person=3 (492; 97%), Number=Sing (490; 97%), Aspect=Perf (308; 61%).
AUX tokens may have the following values of Gender:
Fem(177; 35% of non-emptyGender): تكون، كانت، ليست، تكن، تعدMasc(328; 65% of non-emptyGender): كان، يكون، ليس، يكن، كانوا، كنت، تكونون، كن، لسنا، أكونEMPTY(1649): س، قد، سوف، ما، هل، ربما، أ، علّ، لقد
| Paradigm كَان | Masc | Fem |
|---|---|---|
| Aspect=Imp|Mood=Ind|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | أكون | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=2|VerbForm=Fin|Voice=Act | تكون | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكون | تكون |
| Aspect=Imp|Mood=Ind|Number=Plur|Person=2|VerbForm=Fin|Voice=Act | تكونون | |
| Aspect=Imp|Mood=Jus|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكن | تكن |
| Aspect=Imp|Mood=Sub|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | اكون | |
| Aspect=Imp|Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكون | تكون |
| Aspect=Imp|Mood=Sub|Number=Dual|Person=3|VerbForm=Fin|Voice=Act | يكونا | |
| Aspect=Imp|Mood=Sub|Number=Plur|Person=1|VerbForm=Fin|Voice=Act | نكون | |
| Aspect=Perf|Number=Sing|Person=1|Voice=Act | كنت | |
| Aspect=Perf|Number=Sing|Person=3|Voice=Act | كان | كانت |
| Aspect=Perf|Number=Plur|Person=3|Voice=Act | كانوا | |
| Mood=Imp|Number=Sing|VerbForm=Fin | كن |
NOUN
27 NOUN tokens (0% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Case=Gen (22; 81%), Number=Plur (21; 78%).
NOUN tokens may have the following values of Gender:
Fem(26; 96% of non-emptyGender): الحاصلات، البويات، بدايات، عداءة، الآفات، التليفونات، الخضروات، الكابلات، المداهمات، بضعةMasc(1; 4% of non-emptyGender): المعتمرينEMPTY(93678): مصر، اليوم، رئيس، دولار، الحكومة، العراق، وزير، كل، الرئيس، غير
Gender seems to be lexical feature of NOUN. 100% lemmas (21) occur only with one value of Gender.
PROPN
3 PROPN tokens (1% of all PROPN tokens) have a non-empty value of Gender.
PROPN tokens may have the following values of Gender:
Fem(3; 100% of non-emptyGender): العمارة، اللطيفية، الوكرةEMPTY(242): بن، عبدالله، عبدالعزيز، طه، بورسعيد، أبو، النروج، عبدالمنعم، يومبلغاز، أبوردينة
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
VERB –[conj]–> VERB (1943; 75%),
VERB –[nsubj]–> DET (1569; 74%),
VERB –[ccomp]–> VERB (1520; 58%),
ADJ –[conj]–> ADJ (890; 99%),
VERB –[advcl]–> VERB (760; 68%),
VERB –[obj]–> PRON (738; 54%),
VERB –[nsubj]–> PRON (637; 99%),
VERB –[advcl:pred]–> VERB (634; 98%),
VERB –[advcl:pred]–> ADJ (501; 95%),
VERB –[obl]–> ADJ (432; 59%).