Gender
: gender
This document is a placeholder for the language-specific documentation
for Gender
.
Treebank Statistics (UD_Arabic)
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
66056 tokens (23%) have a non-empty value of Gender
.
9183 types (35%) occur at least once with a non-empty value of Gender
.
3386 lemmas (20%) occur at least once with a non-empty value of Gender
.
The feature is used with 6 part-of-speech tags: ADJ (29221; 10% instances), VERB (21543; 8% instances), PRON (12942; 5% instances), DET (1611; 1% instances), NUM (700; 0% instances), AUX (39; 0% instances).
ADJ
29221 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (27495; 94%), Case=Gen (19101; 65%), Definite=Def (18902; 65%).
ADJ
tokens may have the following values of Gender
:
Fem
(14182; 49% of non-emptyGender
): المصرية، المتحدة، العربية، جديدة، الدولية، الفلسطينية، خاصة، أخرى، الأمريكية، العامةMasc
(15039; 51% of non-emptyGender
): المصري، الماضي، أي، الحالي، العام، المقبل، المركزي، أكثر، الدولي، الاول
Paradigm مِصرِيّ | Masc | Fem |
---|---|---|
Case=Acc|Definite=Def|Number=Sing | المصري | المصرية, المصـــرية |
Case=Acc|Definite=Def|Number=Plur | المصريين | |
Case=Acc|Definite=Ind|Number=Sing | مصرياً | مصرية |
Case=Acc|Definite=Ind|Number=Dual | مصريين | |
Case=Acc|Definite=Ind|Number=Plur | مصريين | |
Case=Gen|Definite=Def|Number=Sing | المصري, المصرى | المصرية, المصريةـ |
Case=Gen|Definite=Def|Number=Dual | المصريتين | |
Case=Gen|Definite=Def|Number=Plur | المصريين | |
Case=Gen|Definite=Ind|Number=Sing | مصري | مصرية |
Case=Gen|Definite=Ind|Number=Plur | مصريين | مصريات |
Case=Nom|Definite=Def|Number=Sing | المصري, المصرى | المصرية |
Case=Nom|Definite=Def|Number=Plur | المصريون | |
Case=Nom|Definite=Ind|Number=Sing | مصري | مصرية |
Case=Nom|Definite=Ind|Number=Dual | مصريتان | |
Case=Nom|Definite=Ind|Number=Plur | مصريون | |
Case=Nom|Definite=Red|Number=Sing | مصري |
VERB
21543 VERB tokens (100% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=3 (21260; 99%), Voice=Act (20272; 94%), Number=Sing (20165; 94%), Aspect=Perf (11442; 53%), VerbForm=EMPTY (11442; 53%), Mood=EMPTY (11442; 53%).
VERB
tokens may have the following values of Gender
:
Fem
(7977; 37% of non-emptyGender
): كانت، تكون، قالت، ذكرت، بلغت، تصل، بدأت، تقوم، أكدت، نقلتMasc
(13566; 63% of non-emptyGender
): قال، كان، أضاف، تم، أكد، يتم، يكون، يمكن، أشار، أوضح
Paradigm كَان | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Ind|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | أكون | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=2|VerbForm=Fin|Voice=Act | تكون | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكون | تكون |
Aspect=Imp|Mood=Ind|Number=Plur|Person=2|VerbForm=Fin|Voice=Act | تكونون | |
Aspect=Imp|Mood=Jus|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | اكن | |
Aspect=Imp|Mood=Jus|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكن | تكن |
Aspect=Imp|Mood=Jus|Number=Plur|Person=3|VerbForm=Fin|Voice=Act | يكونوا | |
Aspect=Imp|Mood=Sub|Number=Sing|Person=1|VerbForm=Fin|Voice=Act | اكون | |
Aspect=Imp|Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | يكون | تكون, تكـــون |
Aspect=Imp|Mood=Sub|Number=Dual|Person=3|VerbForm=Fin|Voice=Act | يكونا | |
Aspect=Imp|Mood=Sub|Number=Plur|Person=1|VerbForm=Fin|Voice=Act | نكون | |
Aspect=Imp|Mood=Sub|Number=Plur|Person=3|VerbForm=Fin|Voice=Act | يكونوا | |
Aspect=Perf|Number=Sing|Person=1|Voice=Act | كنت | |
Aspect=Perf|Number=Sing|Person=2|Voice=Act | كنت | |
Aspect=Perf|Number=Sing|Person=3|Voice=Act | كان | كانت |
Aspect=Perf|Number=Dual|Person=3|Voice=Act | كانا | كانتا |
Aspect=Perf|Number=Plur|Person=1|Voice=Act | كنا | |
Aspect=Perf|Number=Plur|Person=3|Voice=Act | كانوا | |
Mood=Imp|Number=Sing|VerbForm=Fin | كن |
PRON
12942 PRON tokens (93% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (11359; 88%), PronType=Prs (9991; 77%), Person=3 (9693; 75%), Case=Gen (8770; 68%).
PRON
tokens may have the following values of Gender
:
Fem
(5689; 44% of non-emptyGender
): ها، التي، هي، التى، هما، هن، هذه، هى، تلك، اللتينMasc
(7253; 56% of non-emptyGender
): ه، هم، الذي، هو، ذلك، الذين، ك، ذٰلك، نا، الذىEMPTY
(916): ما، من، كيف، كم، ماذا، أين، متى، لماذا، هكذا، اين
Paradigm هُوَ | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing|Person=1 | ني | |
Case=Acc|Number=Sing|Person=2 | ك | |
Case=Acc|Number=Sing|Person=3 | ه | ها |
Case=Acc|Number=Dual|Person=3 | هما | هما |
Case=Acc|Number=Plur|Person=1 | نا | |
Case=Acc|Number=Plur|Person=2 | كم | |
Case=Acc|Number=Plur|Person=3 | هم | هن |
Case=Gen|Number=Sing|Person=1 | ي | |
Case=Gen|Number=Sing|Person=2 | ك | ك |
Case=Gen|Number=Sing|Person=3 | ه, وغربه, تجهيزه, لاراضيه, والده, طائرته, حكومته, إدانته, انتشاره, مستقبله, بلاده, استعداداته, زنزانته | ها, أهدافها, مواجهتها, بضمانها, نهايتها, تخصيصها, تجميدها, أعضائها, إليها, تجارتها, بهويتها, مستشفياتها, بفقدانها |
Case=Gen|Number=Dual|Person=3 | هما | هما |
Case=Gen|Number=Plur|Person=1 | نا, لمساعدتنا | |
Case=Gen|Number=Plur|Person=2 | كم | |
Case=Gen|Number=Plur|Person=3 | هم, شفائهم, استبعادهم, بهم, بأنفسهم, لهم, بلادهم | هن |
Case=Nom|Number=Sing|Person=1 | أنا, انا | |
Case=Nom|Number=Sing|Person=2 | أنت | |
Case=Nom|Number=Sing|Person=3 | هو | هي, هى, وهي |
Case=Nom|Number=Dual|Person=3 | هما | هما |
Case=Nom|Number=Plur|Person=1 | نحن | |
Case=Nom|Number=Plur|Person=2 | انتم, أنتم | |
Case=Nom|Number=Plur|Person=3 | هم | هن |
DET
1611 DET tokens (85% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: PronType=Dem (1599; 99%), Number=Sing (1564; 97%), Case=Gen (1069; 66%).
DET
tokens may have the following values of Gender
:
Fem
(833; 52% of non-emptyGender
): هذه، تلك، هٰذه، التي، هاتين، هاتان، هذــه، هـــذه، هــــذهMasc
(778; 48% of non-emptyGender
): هذا، هٰذا، ذلك، هؤلاء، ذٰلك، هذين، الذي، الذين، هٰؤلاء، أولئكEMPTY
(291): ما، من، كيف، لماذا، ماذا
Paradigm هٰذَا | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | هذا | هذه, هٰذه, هــــذه |
Case=Acc|Number=Dual | هذين | |
Case=Acc|Number=Plur | هؤلاء | |
Case=Gen|Number=Sing | هذا, هٰذا | هذه, هٰذه, هـــذه, هذــه |
Case=Gen|Number=Dual | هذين | هاتين |
Case=Gen|Number=Plur | هؤلاء, هٰؤلاء | |
Case=Nom|Number=Sing | هذا, هٰذا | هذه, هٰذه |
Case=Nom|Number=Dual | هٰذان | هاتان |
Case=Nom|Number=Plur | هؤلاء |
NUM
700 NUM tokens (9% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Number=EMPTY (700; 100%), NumForm=Word (700; 100%), Case=Gen (410; 59%), Definite=Red (401; 57%).
NUM
tokens may have the following values of Gender
:
Fem
(210; 30% of non-emptyGender
): ثلاث، عشر، الثلاث، خمس، ست، عشرة، اربع، الخمس، الثماني، العشرMasc
(490; 70% of non-emptyGender
): ثلاثة، خمسة، ستة، عشرة، الثلاثة، اربعة، اثنين، سبعة، أربعة، واحدEMPTY
(7056): مليون، 15، 3، 6، 2، 8، 7، مليار، ألف، 4
Paradigm ثَلَاثَة | Masc | Fem |
---|---|---|
Case=Acc|Definite=Def | الثلاثة, الثلاثـــــة | الثلاث |
Case=Acc|Definite=Ind | ثلاثة | ثلاثا |
Case=Acc|Definite=Red | ثلاثة | ثلاث |
Case=Gen|Definite=Com | الثلاثة | |
Case=Gen|Definite=Def | الثلاثة | الثلاث |
Case=Gen|Definite=Ind | ثلاثة | ثلاث |
Case=Gen|Definite=Red | ثلاثة | ثلاث |
Case=Nom|Definite=Def | الثلاثة | الثلاث |
Case=Nom|Definite=Ind | ثلاثة | ثلاث |
Case=Nom|Definite=Red | ثلاثة | ثلاث |
AUX
39 AUX tokens (100% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Number=Sing (39; 100%), Person=3 (39; 100%), Voice=Act (39; 100%), Aspect=Perf (38; 97%).
AUX
tokens may have the following values of Gender
:
Fem
(4; 10% of non-emptyGender
): ليست، تعدMasc
(35; 90% of non-emptyGender
): ليس، ألا
Paradigm لَيس | Masc | Fem |
---|---|---|
ليس | ليست |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
VERB –[conj]–> VERB (1886; 75%),
VERB –[ccomp]–> VERB (1478; 58%),
VERB –[dobj]–> PRON (999; 50%),
ADJ –[conj]–> ADJ (842; 99%),
VERB –[advcl]–> VERB (749; 67%),
VERB –[nsubj]–> PRON (655; 91%),
VERB –[xcomp]–> VERB (624; 98%),
VERB –[xcomp]–> ADJ (505; 95%),
VERB –[advmod]–> ADJ (423; 59%),
VERB –[dobj]–> ADJ (332; 60%).
Gender in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]