Treebank Statistics: UD_Arabic-PADT: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
67429 tokens (24%) have a non-empty value of Gender
.
9336 types (37%) occur at least once with a non-empty value of Gender
.
3447 lemmas (23%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: ADJ (29351; 10% instances), VERB (21296; 8% instances), PRON (10877; 4% instances), DET (4668; 2% instances), NUM (702; 0% instances), AUX (505; 0% instances), NOUN (27; 0% instances), PROPN (3; 0% instances).
ADJ
29351 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (27614; 94%), Case=Gen (19121; 65%), Definite=Def (18961; 65%).
ADJ
tokens may have the following values of Gender
:
Fem
(14229; 48% of non-emptyGender
): المصرية، المتحدة، العربية، جديدة، الدولية، الفلسطينية، خاصة، أخرى، الأمريكية، العامةMasc
(15122; 52% of non-emptyGender
): المصري، الماضي، أي، الحالي، العام، المقبل، المركزي، أكثر، الدولي، الاول
Paradigm مِصرِيّ | Masc | Fem |
---|---|---|
Case=Acc|Definite=Def|Number=Sing | المصري | المصرية, المصـــرية |
Case=Acc|Definite=Def|Number=Plur | المصريين | |
Case=Acc|Definite=Ind|Number=Sing | مصرياً | مصرية |
Case=Acc|Definite=Ind|Number=Dual | مصريين | |
Case=Acc|Definite=Ind|Number=Plur | مصريين | |
Case=Gen|Definite=Def|Number=Sing | المصري, المصرى | المصرية, المصريةـ |
Case=Gen|Definite=Def|Number=Dual | المصريتين | |
Case=Gen|Definite=Def|Number=Plur | المصريين | |
Case=Gen|Definite=Ind|Number=Sing | مصري | مصرية |
Case=Gen|Definite=Ind|Number=Plur | مصريين | مصريات |
Case=Nom|Definite=Cons|Number=Sing | مصري | |
Case=Nom|Definite=Def|Number=Sing | المصري, المصرى | المصرية |
Case=Nom|Definite=Def|Number=Plur | المصريون | |
Case=Nom|Definite=Ind|Number=Sing | مصري | مصرية |
Case=Nom|Definite=Ind|Number=Dual | مصريتان | |
Case=Nom|Definite=Ind|Number=Plur | مصريون |
VERB
21296 VERB tokens (100% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=3 (20900; 98%), Voice=Act (20020; 94%), Number=Sing (19849; 93%), Aspect=Perf (11215; 53%), Mood=EMPTY (11215; 53%), VerbForm=EMPTY (11215; 53%).
VERB
tokens may have the following values of Gender
:
Fem
(7836; 37% of non-emptyGender
): كانت، قالت، ذكرت، بلغت، تصل، تكون، بدأت، تقوم، أكدت، نقلتMasc
(13460; 63% of non-emptyGender
): قال، كان، أضاف، تم، أكد، يتم، يمكن، أشار، أوضح، أعلن
Paradigm قَال | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Ind|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | أقول | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يقول | تقول |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Pass | يقال | |
Aspect=Imp|Mood=Ind|Number=Plur|Person=1|VerbForm=Fin|Voice=Act | نقول | |
Aspect=Imp|Mood=Ind|Number=Plur|Person=3|VerbForm=Fin|Voice=Act | يقولون | |
Aspect=Imp|Mood=Sub|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | أقول | |
Aspect=Imp|Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يقول | |
Aspect=Perf|Number=Sing|Person=1|Voice=Act | قلت | |
Aspect=Perf|Number=Sing|Person=3|Voice=Act | قال | قالت |
Aspect=Perf|Number=Sing|Person=3|Voice=Pass | قيل | |
Aspect=Perf|Number=Dual|Person=3|Voice=Act | قالا | |
Aspect=Perf|Number=Plur|Person=3|Voice=Act | قالوا |
PRON
10877 PRON tokens (100% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=Prs (10877; 100%), Person=3 (10131; 93%), Number=Sing (9002; 83%), Case=Gen (7425; 68%).
PRON
tokens may have the following values of Gender
:
Fem
(4238; 39% of non-emptyGender
): ها، هي، هما، هن، هى، ك، أعضائها، أهدافها، إليها، بضمانهاMasc
(6639; 61% of non-emptyGender
): ه، هم، هو، نا، هما، ك، ي، ني، نحن، كم
Paradigm هُوَ | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing|Person=1 | ني | |
Case=Acc|Number=Sing|Person=2 | ك | |
Case=Acc|Number=Sing|Person=3 | ه | ها |
Case=Acc|Number=Dual|Person=3 | هما | هما |
Case=Acc|Number=Plur|Person=1 | نا | |
Case=Acc|Number=Plur|Person=2 | كم | |
Case=Acc|Number=Plur|Person=3 | هم | هن |
Case=Gen|Number=Sing|Person=1 | ي, ني | |
Case=Gen|Number=Sing|Person=2 | ك | ك |
Case=Gen|Number=Sing|Person=3 | ه, إدانته, استعداداته, انتشاره, بلاده, تجهيزه, حكومته, زنزانته, طائرته, لاراضيه, مستقبله, والده, وغربه | ها, أعضائها, أهدافها, إليها, بضمانها, بفقدانها, بهويتها, تجارتها, تجميدها, تخصيصها, مستشفياتها, مواجهتها, نهايتها |
Case=Gen|Number=Dual|Person=2 | كما | |
Case=Gen|Number=Dual|Person=3 | هما | هما |
Case=Gen|Number=Plur|Person=1 | نا, لمساعدتنا | |
Case=Gen|Number=Plur|Person=2 | كم | |
Case=Gen|Number=Plur|Person=3 | هم, استبعادهم, بأنفسهم, بلادهم, بهم, شفائهم, لهم | هن |
Case=Nom|Number=Sing|Person=1 | أنا, انا | |
Case=Nom|Number=Sing|Person=2 | أنت | |
Case=Nom|Number=Sing|Person=3 | هو | هي, هى, وهي |
Case=Nom|Number=Dual|Person=3 | هما | هما |
Case=Nom|Number=Plur|Person=1 | نحن | |
Case=Nom|Number=Plur|Person=2 | انتم, أنتم | |
Case=Nom|Number=Plur|Person=3 | هم | هن |
DET
4668 DET tokens (79% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (4383; 94%), Case=Gen (3107; 67%), PronType=Rel (2532; 54%).
DET
tokens may have the following values of Gender
:
Fem
(2417; 52% of non-emptyGender
): التي، هذه، التى، تلك، هٰذه، اللتين، اللواتي، ها، اللتان، اللاتىMasc
(2251; 48% of non-emptyGender
): الذي، هذا، ذلك، الذين، ذٰلك، هٰذا، الذى، هؤلاء، اللذين، هEMPTY
(1228): ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
Paradigm اَلَّذِي | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | الذي, الذى | التي, التى |
Case=Acc|Number=Dual | اللذين | اللتين |
Case=Acc|Number=Plur | الذين | |
Case=Gen|Number=Sing | الذي, الذى | التي, التى |
Case=Gen|Number=Dual | اللذين | اللتين |
Case=Gen|Number=Plur | الذين | اللواتي, اللاتى, اللاتي |
Case=Nom|Number=Sing | الذي, الذى | التي, التى |
Case=Nom|Number=Dual | اللذان | اللتان |
Case=Nom|Number=Plur | الذين |
NUM
702 NUM tokens (9% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (702; 100%), Number=EMPTY (702; 100%), Case=Gen (411; 59%), Definite=Cons (401; 57%).
NUM
tokens may have the following values of Gender
:
Fem
(210; 30% of non-emptyGender
): ثلاث، عشر، الثلاث، خمس، ست، عشرة، اربع، الخمس، الثماني، العشرMasc
(492; 70% of non-emptyGender
): ثلاثة، خمسة، ستة، عشرة، الثلاثة، اربعة، اثنين، أربعة، سبعة، واحدEMPTY
(7056): مليون، 15، 3، 6، 2، 8، 7، مليار، ألف، 4
Paradigm ثَلَاثَة | Masc | Fem |
---|---|---|
Case=Acc|Definite=Cons | ثلاثة | ثلاث |
Case=Acc|Definite=Def | الثلاثة, الثلاثـــــة | الثلاث |
Case=Acc|Definite=Ind | ثلاثة | ثلاثا |
Case=Gen|Definite=Com | الثلاثة | |
Case=Gen|Definite=Cons | ثلاثة | ثلاث |
Case=Gen|Definite=Def | الثلاثة | الثلاث |
Case=Gen|Definite=Ind | ثلاثة | ثلاث |
Case=Nom|Definite=Cons | ثلاثة | ثلاث |
Case=Nom|Definite=Def | الثلاثة | الثلاث |
Case=Nom|Definite=Ind | ثلاثة | ثلاث |
AUX
505 AUX tokens (23% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Voice=Act (503; 100%), Person=3 (492; 97%), Number=Sing (490; 97%), Aspect=Perf (308; 61%).
AUX
tokens may have the following values of Gender
:
Fem
(177; 35% of non-emptyGender
): تكون، كانت، ليست، تكن، تعدMasc
(328; 65% of non-emptyGender
): كان، يكون، ليس، يكن، كانوا، كنت، تكونون، كن، لسنا، أكونEMPTY
(1649): س، قد، سوف، ما، هل، ربما، أ، علّ، لقد
Paradigm كَان | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Ind|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | أكون | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=2|VerbForm=Fin|Voice=Act | تكون | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكون | تكون |
Aspect=Imp|Mood=Ind|Number=Plur|Person=2|VerbForm=Fin|Voice=Act | تكونون | |
Aspect=Imp|Mood=Jus|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكن | تكن |
Aspect=Imp|Mood=Sub|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | اكون | |
Aspect=Imp|Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكون | تكون |
Aspect=Imp|Mood=Sub|Number=Dual|Person=3|VerbForm=Fin|Voice=Act | يكونا | |
Aspect=Imp|Mood=Sub|Number=Plur|Person=1|VerbForm=Fin|Voice=Act | نكون | |
Aspect=Perf|Number=Sing|Person=1|Voice=Act | كنت | |
Aspect=Perf|Number=Sing|Person=3|Voice=Act | كان | كانت |
Aspect=Perf|Number=Plur|Person=3|Voice=Act | كانوا | |
Mood=Imp|Number=Sing|VerbForm=Fin | كن |
NOUN
27 NOUN tokens (0% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Case=Gen (22; 81%), Number=Plur (21; 78%).
NOUN
tokens may have the following values of Gender
:
Fem
(26; 96% of non-emptyGender
): الحاصلات، البويات، بدايات، عداءة، الآفات، التليفونات، الخضروات، الكابلات، المداهمات، بضعةMasc
(1; 4% of non-emptyGender
): المعتمرينEMPTY
(93678): مصر، اليوم، رئيس، دولار، الحكومة، العراق، وزير، كل، الرئيس، غير
Gender
seems to be lexical feature of NOUN
. 100% lemmas (21) occur only with one value of Gender
.
PROPN
3 PROPN tokens (1% of all PROPN
tokens) have a non-empty value of Gender
.
PROPN
tokens may have the following values of Gender
:
Fem
(3; 100% of non-emptyGender
): العمارة، اللطيفية، الوكرةEMPTY
(242): بن، عبدالله، عبدالعزيز، طه، بورسعيد، أبو، النروج، عبدالمنعم، يومبلغاز، أبوردينة
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
VERB –[conj]–> VERB (1943; 75%),
VERB –[nsubj]–> DET (1573; 74%),
VERB –[ccomp]–> VERB (1520; 58%),
ADJ –[conj]–> ADJ (890; 99%),
VERB –[advcl]–> VERB (764; 68%),
VERB –[obj]–> PRON (738; 54%),
VERB –[nsubj]–> PRON (653; 98%),
VERB –[xcomp]–> VERB (634; 98%),
VERB –[xcomp]–> ADJ (580; 92%),
VERB –[obl]–> ADJ (432; 59%).