Treebank Statistics: UD_Arabic-PUD: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
12008 tokens (58%) have a non-empty value of Gender
.
6146 types (90%) occur at least once with a non-empty value of Gender
.
4241 lemmas (89%) occur at least once with a non-empty value of Gender
.
The feature is used with 7 part-of-speech tags: NOUN (5493; 26% instances), ADJ (1940; 9% instances), VERB (1676; 8% instances), PROPN (1495; 7% instances), PRON (1145; 6% instances), AUX (181; 1% instances), NUM (78; 0% instances).
NOUN
5493 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Definite=Def (4233; 77%), Number=Sing (3967; 72%), Case=Gen (3795; 69%).
NOUN
tokens may have the following values of Gender
:
Fem
(1800; 33% of non-emptyGender
): النسبة، شركة، منطقة، المنطقة، نهاية، ذات، الحرب، المدينة، فترة، الدولMasc
(3693; 67% of non-emptyGender
): عام، شكلٍ، الوقت، اسم، القرن، الأمر، أجل، العالم، شأن، سببEMPTY
(85): العديد، الكثير، م، البعض، القليل، كلاً، كلٌ، كلٍ، الكثيرون، كثير
Paradigm رَئِيس | Masc | Fem |
---|---|---|
Case=Acc|Definite=Ind|Number=Sing | رئيساً | |
Case=Gen|Definite=Def|Number=Sing | الرئيس, رئيس | |
Case=Gen|Definite=Def|Number=Dual | الرئيسين | |
Case=Gen|Definite=Ind|Number=Sing | رئيسٍ, رئيس | رئيسةٍ |
Case=Nom|Definite=Def|Number=Sing | رئيس, الرئيس | |
Case=Nom|Definite=Ind|Number=Plur | رؤساء |
Gender
seems to be lexical feature of NOUN
. 98% lemmas (2054) occur only with one value of Gender
.
ADJ
1940 ADJ tokens (96% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (1865; 96%), Definite=Def (1215; 63%), Case=Gen (1183; 61%).
ADJ
tokens may have the following values of Gender
:
Fem
(1017; 52% of non-emptyGender
): الخاصة، المتحدة، كبيرة، الأولى، أخرى، الجديدة، البريطانية، جديدة، الأمريكية، الشماليةMasc
(923; 48% of non-emptyGender
): الأول، الثاني، أكثر، إسترليني، كبير، الثالث، كبيراً، آخر، أكبر، المتوسطEMPTY
(86): أكثر، أول، أفضل، أقصى، الأكثر، أقل، الأقل، أطول، أكبر، أبرز
Paradigm أَوَّل | Masc | Fem |
---|---|---|
Case=Acc|Definite=Def|Number=Sing | الأول | الأولى |
Case=Acc|Definite=Ind|Number=Sing | أول | أولى |
Case=Gen|Definite=Def|Number=Sing | الأول | الأولى |
Case=Gen|Definite=Def|Number=Plur | أوائل | |
Case=Gen|Definite=Ind|Number=Sing | أول | أولى |
Case=Nom|Definite=Def|Number=Sing | الأول, أول | أولى, الأولى |
Case=Nom|Definite=Ind|Number=Plur | أولى |
VERB
1676 VERB tokens (96% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=3 (1656; 99%), Number=Sing (1565; 93%), Voice=Act (1487; 89%), Tense=Past (862; 51%), Aspect=Imp (849; 51%).
VERB
tokens may have the following values of Gender
:
Fem
(633; 38% of non-emptyGender
): كانت، بدأت، قالت، تكون، تظهر، تضم، تقول، ظهرت، تبدأ، تعدMasc
(1043; 62% of non-emptyGender
): يمكن، كان، قال، يكون، تم، يكن، بدأ، يقول، بات، أصبحEMPTY
(74): أعرف، أحب، أعتقد، بحثت، نحتاج، نرى، آمل، أبحث، أتحدث، أتساءل
Paradigm كَان | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Ind|Number=Sing|Tense=Fut | يكون | |
Aspect=Imp|Mood=Ind|Number=Sing|Tense=Pres | يكون, يكن | تكن |
Aspect=Imp|Mood=Jus|Number=Sing|Tense=Past | يكن | |
Aspect=Imp|Mood=Sub|Number=Sing|Tense=Fut | يكون | |
Aspect=Imp|Mood=Sub|Number=Sing|Tense=Pres | يكون | |
Aspect=Perf|Number=Sing|Tense=Past | كان | كانت |
Aspect=Perf|Number=Dual|Tense=Past | كانتا | |
Aspect=Perf|Number=Plur|Tense=Past | كانوا |
PROPN
1495 PROPN tokens (87% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (1432; 96%), Definite=EMPTY (1176; 79%), Case=EMPTY (1007; 67%).
PROPN
tokens may have the following values of Gender
:
Fem
(656; 44% of non-emptyGender
): الصين، الولايات، فرنسا، أفريقيا، بريطانيا، روسيا، أستراليا، ألبانيا، أمريكا، أوروباMasc
(839; 56% of non-emptyGender
): تشرين، البحر، كانون، ترامب، نيسان، الاتحاد، جوزيف، دي، مجلس، نهرEMPTY
(233): سي، بي، إن، إس، هونغ، كونغ، جي، آي، إف، إم
Paradigm بِكِين | Masc | Fem |
---|---|---|
بكين | بكين |
Gender
seems to be lexical feature of PROPN
. 97% lemmas (891) occur only with one value of Gender
.
PRON
1145 PRON tokens (88% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (1012; 88%), Case=Gen (765; 67%), Person=3 (736; 64%).
PRON
tokens may have the following values of Gender
:
Fem
(464; 41% of non-emptyGender
): ها، التي، هذه، هي، تلك، هن، غالبيت، هذا، هم، ينتورMasc
(681; 59% of non-emptyGender
): ه، هم، ذلك، هذا، الذي، هو، الذين، ك، أولئك، آخرEMPTY
(154): ما، نا، هما، ي، من، ه، أنا، ك، ماذا، ني
Paradigm هُوَ | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing|Person=2 | ك | |
Case=Acc|Number=Sing|Person=3 | ه | ها |
Case=Acc|Number=Plur|Person=3 | هم | |
Case=Gen|Number=Sing|Person=2 | ك | |
Case=Gen|Number=Sing|Person=3 | ه | ها |
Case=Gen|Number=Plur|Person=3 | هم | هن, هم |
Case=Nom|Number=Sing|Person=3 | هو | هي |
Case=Nom|Number=Plur|Person=3 | هم | |
Number=Sing|Person=3 | هو, ه | هي |
AUX
181 AUX tokens (97% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Voice=Act (179; 99%), Person=3 (177; 98%), Number=Sing (168; 93%), Tense=Past (156; 86%), Mood=EMPTY (150; 83%), Aspect=Perf (147; 81%).
AUX
tokens may have the following values of Gender
:
Fem
(65; 36% of non-emptyGender
): كانت، تكن، تكون، ليستMasc
(116; 64% of non-emptyGender
): كان، يكون، كانوا، كنت، كون، ليس، يكنEMPTY
(5): كنت، أكن، كنا
Paradigm كَان | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Fut|Voice=Act | يكون | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres|Voice=Act | يكون | تكون |
Aspect=Imp|Mood=Jus|Number=Sing|Person=3|Tense=Past|Voice=Act | يكن | تكن |
Aspect=Imp|Mood=Sub|Number=Sing|Person=3|Tense=Pres|Voice=Act | يكون | تكون |
Aspect=Perf|Number=Sing|Person=2|Tense=Past|Voice=Act | كنت | |
Aspect=Perf|Number=Sing|Person=3|Tense=Past|Voice=Act | كان | كانت |
Aspect=Perf|Number=Plur|Person=3|Tense=Past|Voice=Act | كانوا | |
Case=Gen|Definite=Def | كون |
NUM
78 NUM tokens (21% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Number=Plur (73; 94%), Case=Gen (44; 56%).
NUM
tokens may have the following values of Gender
:
Fem
(31; 40% of non-emptyGender
): عشرة، أربعة، ثلاثة، ثمانية، خمسة، سبعة، المئة، ستة، الثلاثة، الثلاثينMasc
(47; 60% of non-emptyGender
): عشر، ثلاث، مليون، أربع، مليار، ست، آلاف، أربعة، أربعين، ألفيEMPTY
(293): 1، 10، 3، 2014، 2015، 100، 1492، 2010، 2012، 2013
Paradigm أربعة | Masc | Fem |
---|---|---|
Case=Acc | أربعة | |
Case=Nom | أربعة | أربعة |
Gender
seems to be lexical feature of NUM
. 97% lemmas (28) occur only with one value of Gender
.
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (1109; 81%),
NOUN –[nmod]–> NOUN (1034; 54%),
VERB –[nsubj]–> NOUN (539; 85%),
PROPN –[amod]–> ADJ (235; 98%),
VERB –[obj]–> NOUN (218; 51%),
VERB –[nsubj]–> PRON (177; 98%),
NOUN –[conj]–> NOUN (173; 66%),
VERB –[nsubj]–> PROPN (173; 90%),
NOUN –[acl:relcl]–> VERB (158; 71%),
PROPN –[flat]–> PROPN (138; 75%).