Treebank Statistics: UD_Arabic-PADT: Features: Definite
This feature is universal but the values Cons
are language-specific.
It occurs with 4 different values: Com
, Cons
, Def
, Ind
.
125257 tokens (44%) have a non-empty value of Definite
.
15283 types (61%) occur at least once with a non-empty value of Definite
.
6545 lemmas (43%) occur at least once with a non-empty value of Definite
.
The feature is used with 4 part-of-speech tags: NOUN (93680; 33% instances), ADJ (29346; 10% instances), NUM (2207; 1% instances), PROPN (24; 0% instances).
NOUN
93680 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which NOUN
and Definite
co-occurred: Number=Sing (72077; 77%), Case=Gen (66786; 71%).
NOUN
tokens may have the following values of Definite
:
Cons
(35157; 38% of non-emptyDefinite
): رئيس، وزير، كل، غير، مجلس، بعض، عام، يوم، نفس، عدمDef
(40199; 43% of non-emptyDefinite
): اليوم، الحكومة، العراق، الرئيس، الولايات، الدول، السوق، العام، المنطقة، الدكتورInd
(18324; 20% of non-emptyDefinite
): مصر، دولار، جنيه، مايو، إسرائيل، عدد، لبنان، بغداد، مصادر، سنواتEMPTY
(25): بد، أعراض، أمل، إعلان، اهمية، ايادي، بديل، بن، تعازى، تفاؤل
Paradigm يَوم | Ind | Def | Cons |
---|---|---|---|
Case=Acc|Number=Sing | يوما, يوماً | اليوم | يوم |
Case=Acc|Number=Dual | يومين | يومي, يومى | |
Case=Acc|Number=Plur | اياما | الأيام, الايام | ايام, أيام |
Case=Gen|Number=Sing | يوم | اليوم | يوم |
Case=Gen|Number=Dual | يومين | اليومين | |
Case=Gen|Number=Plur | أيام, ايام | الايام, الأيام | أيام |
Case=Nom|Number=Sing | يوم | اليوم | يوم |
Case=Nom|Number=Plur | الايام, الأيام | أيام |
ADJ
29346 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which ADJ
and Definite
co-occurred: Number=Sing (27609; 94%), Case=Gen (19119; 65%), Gender=Masc (15118; 52%).
ADJ
tokens may have the following values of Definite
:
Com
(41; 0% of non-emptyDefinite
): الثالث، الأولى، الذاتية، السابع، القصيرة، الحادية، الخامسة، الطويلة، المستندي، البعيدةCons
(1416; 5% of non-emptyDefinite
): أي، اي، أول، اول، أكبر، مختلف، أبرز، أهم، كبار، أسعدDef
(18961; 65% of non-emptyDefinite
): المصرية، المتحدة، المصري، الماضي، العربية، الحالي، الدولية، الفلسطينية، العام، المقبلInd
(8928; 30% of non-emptyDefinite
): جديدة، خاصة، أخرى، أكثر، اخرى، سورية، اكثر، جديد، كبيرة، حالياًEMPTY
(5): أفريقي، أوسطي، افريقي، عام، كبيرة
Paradigm أَوَّل | Ind | Def | Com | Cons |
---|---|---|---|---|
Case=Acc|Gender=Masc|Number=Sing | أول, أولاً, اول, اولا, أولا, اولاً | الاول, الأول | أول, اول | |
Case=Acc|Gender=Masc|Number=Plur | الأولى | |||
Case=Acc|Gender=Fem|Number=Sing | الاولى, الأولى | أولى, اولى | ||
Case=Gen|Gender=Masc|Number=Sing | أول, اول | الاول, الأول | أول, اول | |
Case=Gen|Gender=Masc|Number=Plur | الأول, الاوائل | الأولى | أوائل, اوائل | |
Case=Gen|Gender=Fem|Number=Sing | أولى, اولى | الاولى, الأولى | أولى | |
Case=Gen|Gender=Fem|Number=Dual | الاوليين | |||
Case=Gen|Gender=Fem|Number=Plur | الاوليات | |||
Case=Nom|Gender=Masc|Number=Sing | اول | الأول, الاول | اول, أول | |
Case=Nom|Gender=Fem|Number=Sing | اولى, أولى | الاولى, الأولى | أولى, اولى |
NUM
2207 NUM tokens (28% of all NUM
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which NUM
and Definite
co-occurred: NumForm=Word (2207; 100%), Case=Gen (1234; 56%), Number=Sing (1154; 52%).
NUM
tokens may have the following values of Definite
:
Com
(4; 0% of non-emptyDefinite
): الاربع، الثلاثة، الخمس، الخمسةCons
(1519; 69% of non-emptyDefinite
): مليون، مليار، ألف، ثلاثة، ملايين، بليون، الف، آلاف، ثلاث، خمسةDef
(340; 15% of non-emptyDefinite
): المئة، المائة، الثلاثة، الثلاث، العشرين، الأربعة، المليون، الثماني، الخمس، الستةInd
(344; 16% of non-emptyDefinite
): عشرين، اثنين، ثلاثة، مليوناً، واحد، مليون، ملياراً، مليونا، ألفاً، ملايينEMPTY
(5551): 15، 3، 6، 2، 8، 7، 4، 11، 10، 12
Paradigm ثَلَاثَة | Ind | Def | Com | Cons |
---|---|---|---|---|
Case=Acc|Gender=Masc | ثلاثة | الثلاثة, الثلاثـــــة | ثلاثة | |
Case=Acc|Gender=Fem | ثلاثا | الثلاث | ثلاث | |
Case=Gen|Gender=Masc | ثلاثة | الثلاثة | الثلاثة | ثلاثة |
Case=Gen|Gender=Fem | ثلاث | الثلاث | ثلاث | |
Case=Nom|Gender=Masc | ثلاثة | الثلاثة | ثلاثة | |
Case=Nom|Gender=Fem | ثلاث | الثلاث | ثلاث |
PROPN
24 PROPN tokens (10% of all PROPN
tokens) have a non-empty value of Definite
.
PROPN
tokens may have the following values of Definite
:
Cons
(1; 4% of non-emptyDefinite
): بدرDef
(23; 96% of non-emptyDefinite
): النروج، الفليبين، الإكوادور، البدري، البنتاجون، التاميل، التشاد، الزرقاوي، الفاتيكان، الكوتEMPTY
(221): بن، عبدالله، عبدالعزيز، طه، بورسعيد، أبو، عبدالمنعم، يومبلغاز، أبوردينة، أم
Definite
seems to be lexical feature of PROPN
. 100% lemmas (19) occur only with one value of Definite
.
Relations with Agreement in Definite
The 10 most frequent relations where parent and child node agree in Definite
:
NOUN –[amod]–> ADJ (19201; 83%),
NOUN –[conj]–> NOUN (4047; 70%),
ADJ –[conj]–> ADJ (881; 98%),
NOUN –[appos]–> NOUN (311; 81%),
ADJ –[amod]–> ADJ (236; 82%),
NOUN –[conj]–> ADJ (135; 67%),
ADJ –[conj]–> NOUN (99; 54%),
NOUN –[orphan]–> NOUN (57; 76%),
NOUN –[nsubj]–> ADJ (56; 82%),
ADJ –[obj]–> ADJ (20; 100%).