Treebank Statistics: UD_Arabic: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
66056 tokens (23%) have a non-empty value of Gender
.
9183 types (35%) occur at least once with a non-empty value of Gender
.
3386 lemmas (20%) occur at least once with a non-empty value of Gender
.
The feature is used with 6 part-of-speech tags: ADJ (29221; 10% instances), VERB (20901; 7% instances), PRON (9991; 4% instances), DET (4562; 2% instances), NUM (700; 0% instances), AUX (681; 0% instances).
ADJ
29221 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (27495; 94%), Case=Gen (19101; 65%), Definite=Def (18902; 65%).
ADJ
tokens may have the following values of Gender
:
Fem
(14182; 49% of non-emptyGender
): المصرية، المتحدة، العربية، جديدة، الدولية، الفلسطينية، خاصة، أخرى، الأمريكية، العامةMasc
(15039; 51% of non-emptyGender
): المصري، الماضي، أي، الحالي، العام، المقبل، المركزي، أكثر، الدولي، الاول
Paradigm مِصرِيّ | Masc | Fem |
---|---|---|
Case=Acc|Definite=Def|Number=Sing | المصري | المصرية, المصـــرية |
Case=Acc|Definite=Def|Number=Plur | المصريين | |
Case=Acc|Definite=Ind|Number=Sing | مصرياً | مصرية |
Case=Acc|Definite=Ind|Number=Dual | مصريين | |
Case=Acc|Definite=Ind|Number=Plur | مصريين | |
Case=Gen|Definite=Def|Number=Sing | المصري, المصرى | المصرية, المصريةـ |
Case=Gen|Definite=Def|Number=Dual | المصريتين | |
Case=Gen|Definite=Def|Number=Plur | المصريين | |
Case=Gen|Definite=Ind|Number=Sing | مصري | مصرية |
Case=Gen|Definite=Ind|Number=Plur | مصريين | مصريات |
Case=Nom|Definite=Cons|Number=Sing | مصري | |
Case=Nom|Definite=Def|Number=Sing | المصري, المصرى | المصرية |
Case=Nom|Definite=Def|Number=Plur | المصريون | |
Case=Nom|Definite=Ind|Number=Sing | مصري | مصرية |
Case=Nom|Definite=Ind|Number=Dual | مصريتان | |
Case=Nom|Definite=Ind|Number=Plur | مصريون |
VERB
20901 VERB tokens (100% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=3 (20629; 99%), Voice=Act (19687; 94%), Number=Sing (19547; 94%), Aspect=Perf (11091; 53%), Mood=EMPTY (11091; 53%), VerbForm=EMPTY (11091; 53%).
VERB
tokens may have the following values of Gender
:
Fem
(7729; 37% of non-emptyGender
): كانت، قالت، ذكرت، بلغت، تصل، تكون، بدأت، تقوم، أكدت، نقلتMasc
(13172; 63% of non-emptyGender
): قال، كان، أضاف، تم، أكد، يتم، يمكن، أشار، أوضح، أعلن
Paradigm قَال | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يقول | تقول |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Pass | يقال | |
Aspect=Imp|Mood=Ind|Number=Plur|Person=1|VerbForm=Fin|Voice=Act | نقول | |
Aspect=Imp|Mood=Ind|Number=Plur|Person=3|VerbForm=Fin|Voice=Act | يقولون | |
Aspect=Imp|Mood=Sub|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | أقول | |
Aspect=Imp|Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يقول | |
Aspect=Perf|Number=Sing|Person=1|Voice=Act | قلت | |
Aspect=Perf|Number=Sing|Person=3|Voice=Act | قال | قالت |
Aspect=Perf|Number=Sing|Person=3|Voice=Pass | قيل | |
Aspect=Perf|Number=Dual|Person=3|Voice=Act | قالا | |
Aspect=Perf|Number=Plur|Person=3|Voice=Act | قالوا |
PRON
9991 PRON tokens (100% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=Prs (9991; 100%), Person=3 (9693; 97%), Number=Sing (8642; 86%), Case=Gen (6743; 67%).
PRON
tokens may have the following values of Gender
:
Fem
(4125; 41% of non-emptyGender
): ها، هي، هما، هن، هى، ك، أعضائها، أهدافها، إليها، بضمانهاMasc
(5866; 59% of non-emptyGender
): ه، هم، هو، ك، نا، هما، كم، ي، نحن، ني
Paradigm هُوَ | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing|Person=1 | ني | |
Case=Acc|Number=Sing|Person=2 | ك | |
Case=Acc|Number=Sing|Person=3 | ه | ها |
Case=Acc|Number=Dual|Person=3 | هما | هما |
Case=Acc|Number=Plur|Person=1 | نا | |
Case=Acc|Number=Plur|Person=2 | كم | |
Case=Acc|Number=Plur|Person=3 | هم | هن |
Case=Gen|Number=Sing|Person=1 | ي | |
Case=Gen|Number=Sing|Person=2 | ك | ك |
Case=Gen|Number=Sing|Person=3 | ه, طائرته, إدانته, حكومته, لاراضيه, مستقبله, تجهيزه, بلاده, انتشاره, استعداداته, وغربه, والده, زنزانته | ها, نهايتها, بضمانها, تجارتها, إليها, تجميدها, بهويتها, مواجهتها, أهدافها, أعضائها, مستشفياتها, بفقدانها, تخصيصها |
Case=Gen|Number=Dual|Person=3 | هما | هما |
Case=Gen|Number=Plur|Person=1 | نا, لمساعدتنا | |
Case=Gen|Number=Plur|Person=2 | كم | |
Case=Gen|Number=Plur|Person=3 | هم, استبعادهم, بلادهم, لهم, شفائهم, بأنفسهم, بهم | هن |
Case=Nom|Number=Sing|Person=1 | أنا, انا | |
Case=Nom|Number=Sing|Person=2 | أنت | |
Case=Nom|Number=Sing|Person=3 | هو | هي, هى, وهي |
Case=Nom|Number=Dual|Person=3 | هما | هما |
Case=Nom|Number=Plur|Person=1 | نحن | |
Case=Nom|Number=Plur|Person=2 | انتم, أنتم | |
Case=Nom|Number=Plur|Person=3 | هم | هن |
DET
4562 DET tokens (79% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (4281; 94%), Case=Gen (3096; 68%), PronType=Rel (2513; 55%).
DET
tokens may have the following values of Gender
:
Fem
(2397; 53% of non-emptyGender
): التي، هذه، التى، تلك، هٰذه، اللتين، اللواتي، اللتان، اللاتى، هاتينMasc
(2165; 47% of non-emptyGender
): الذي، هذا، ذلك، الذين، ذٰلك، هٰذا، الذى، هؤلاء، اللذين، هذينEMPTY
(1207): ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
Paradigm اَلَّذِي | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | الذي, الذى | التي, التى |
Case=Acc|Number=Dual | اللذين | اللتين |
Case=Acc|Number=Plur | الذين | |
Case=Gen|Number=Sing | الذي, الذى | التي, التى |
Case=Gen|Number=Dual | اللذين | اللتين |
Case=Gen|Number=Plur | الذين | اللواتي, اللاتى, اللاتي |
Case=Nom|Number=Sing | الذي, الذى | التي, التى |
Case=Nom|Number=Dual | اللذان | اللتان |
Case=Nom|Number=Plur | الذين |
NUM
700 NUM tokens (9% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (700; 100%), Number=EMPTY (700; 100%), Case=Gen (410; 59%), Definite=Cons (401; 57%).
NUM
tokens may have the following values of Gender
:
Fem
(210; 30% of non-emptyGender
): ثلاث، عشر، الثلاث، خمس، ست، عشرة، اربع، الخمس، الثماني، العشرMasc
(490; 70% of non-emptyGender
): ثلاثة، خمسة، ستة، عشرة، الثلاثة، اربعة، اثنين، سبعة، أربعة، واحدEMPTY
(7056): مليون، 15، 3، 6، 2، 8، 7، مليار، ألف، 4
Paradigm ثَلَاثَة | Masc | Fem |
---|---|---|
Case=Acc|Definite=Cons | ثلاثة | ثلاث |
Case=Acc|Definite=Def | الثلاثـــــة, الثلاثة | الثلاث |
Case=Acc|Definite=Ind | ثلاثة | ثلاثا |
Case=Gen|Definite=Com | الثلاثة | |
Case=Gen|Definite=Cons | ثلاثة | ثلاث |
Case=Gen|Definite=Def | الثلاثة | الثلاث |
Case=Gen|Definite=Ind | ثلاثة | ثلاث |
Case=Nom|Definite=Cons | ثلاثة | ثلاث |
Case=Nom|Definite=Def | الثلاثة | الثلاث |
Case=Nom|Definite=Ind | ثلاثة | ثلاث |
AUX
681 AUX tokens (100% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Person=3 (670; 98%), Number=Sing (657; 96%), Voice=Act (624; 92%), Aspect=Perf (389; 57%), Mood=EMPTY (389; 57%), VerbForm=EMPTY (389; 57%).
AUX
tokens may have the following values of Gender
:
Fem
(252; 37% of non-emptyGender
): تكون، كانت، ليست، تعد، تعتبر، تكن، زالت، تزال، تظل، ظلتMasc
(429; 63% of non-emptyGender
): كان، يكون، ليس، قال، يكن، يعتبر، يعد، كانوا، زال، اصبح
Paradigm كَان | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Ind|Number=Sing|Person=2|VerbForm=Fin|Voice=Act | تكون | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكون | تكون |
Aspect=Imp|Mood=Ind|Number=Plur|Person=2|VerbForm=Fin|Voice=Act | تكونون | |
Aspect=Imp|Mood=Jus|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكن | تكن |
Aspect=Imp|Mood=Sub|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | اكون | |
Aspect=Imp|Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكون | تكون |
Aspect=Imp|Mood=Sub|Number=Dual|Person=3|VerbForm=Fin|Voice=Act | يكونا | |
Aspect=Imp|Mood=Sub|Number=Plur|Person=1|VerbForm=Fin|Voice=Act | نكون | |
Aspect=Perf|Number=Sing|Person=1|Voice=Act | كنت | |
Aspect=Perf|Number=Sing|Person=3|Voice=Act | كان | كانت |
Aspect=Perf|Number=Plur|Person=3|Voice=Act | كانوا | |
Mood=Imp|Number=Sing|VerbForm=Fin | كن |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
VERB –[conj]–> VERB (1880; 75%),
VERB –[nsubj]–> DET (1542; 74%),
VERB –[ccomp]–> VERB (1478; 58%),
ADJ –[conj]–> ADJ (841; 99%),
VERB –[advcl]–> VERB (747; 67%),
VERB –[obj]–> PRON (659; 54%),
VERB –[xcomp]–> VERB (624; 98%),
VERB –[nsubj]–> PRON (612; 99%),
VERB –[xcomp]–> ADJ (505; 95%),
VERB –[obl]–> ADJ (423; 59%).