Treebank Statistics: UD_Arabic-PADT: Features: Definite
This feature is universal but the values Cons are language-specific.
It occurs with 4 different values: Com, Cons, Def, Ind.
125257 tokens (44%) have a non-empty value of Definite.
15283 types (61%) occur at least once with a non-empty value of Definite.
6545 lemmas (43%) occur at least once with a non-empty value of Definite.
The feature is used with 4 part-of-speech tags: NOUN (93680; 33% instances), ADJ (29346; 10% instances), NUM (2207; 1% instances), PROPN (24; 0% instances).
NOUN
93680 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Definite.
The most frequent other feature values with which NOUN and Definite co-occurred: Number=Sing (72077; 77%), Case=Gen (66786; 71%).
NOUN tokens may have the following values of Definite:
Cons(35157; 38% of non-emptyDefinite): رئيس، وزير، كل، غير، مجلس، بعض، عام، يوم، نفس، عدمDef(40199; 43% of non-emptyDefinite): اليوم، الحكومة، العراق، الرئيس، الولايات، الدول، السوق، العام، المنطقة، الدكتورInd(18324; 20% of non-emptyDefinite): مصر، دولار، جنيه، مايو، إسرائيل، عدد، لبنان، بغداد، مصادر، سنواتEMPTY(25): بد، أعراض، أمل، إعلان، اهمية، ايادي، بديل، بن، تعازى، تفاؤل
| Paradigm يَوم | Ind | Def | Cons |
|---|---|---|---|
| Case=Acc|Number=Sing | يوما, يوماً | اليوم | يوم |
| Case=Acc|Number=Dual | يومين | يومي, يومى | |
| Case=Acc|Number=Plur | اياما | الأيام, الايام | ايام, أيام |
| Case=Gen|Number=Sing | يوم | اليوم | يوم |
| Case=Gen|Number=Dual | يومين | اليومين | |
| Case=Gen|Number=Plur | أيام, ايام | الايام, الأيام | أيام |
| Case=Nom|Number=Sing | يوم | اليوم | يوم |
| Case=Nom|Number=Plur | الايام, الأيام | أيام |
ADJ
29346 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Definite.
The most frequent other feature values with which ADJ and Definite co-occurred: Number=Sing (27609; 94%), Case=Gen (19119; 65%), Gender=Masc (15118; 52%).
ADJ tokens may have the following values of Definite:
Com(41; 0% of non-emptyDefinite): الثالث، الأولى، الذاتية، السابع، القصيرة، الحادية، الخامسة، الطويلة، المستندي، البعيدةCons(1416; 5% of non-emptyDefinite): أي، اي، أول، اول، أكبر، مختلف، أبرز، أهم، كبار، أسعدDef(18961; 65% of non-emptyDefinite): المصرية، المتحدة، المصري، الماضي، العربية، الحالي، الدولية، الفلسطينية، العام، المقبلInd(8928; 30% of non-emptyDefinite): جديدة، خاصة، أخرى، أكثر، اخرى، سورية، اكثر، جديد، كبيرة، حالياًEMPTY(5): أفريقي، أوسطي، افريقي، عام، كبيرة
| Paradigm أَوَّل | Ind | Def | Com | Cons |
|---|---|---|---|---|
| Case=Acc|Gender=Masc|Number=Sing | أول, أولاً, اول, اولا, أولا, اولاً | الاول, الأول | أول, اول | |
| Case=Acc|Gender=Masc|Number=Plur | الأولى | |||
| Case=Acc|Gender=Fem|Number=Sing | الاولى, الأولى | أولى, اولى | ||
| Case=Gen|Gender=Masc|Number=Sing | أول, اول | الاول, الأول | أول, اول | |
| Case=Gen|Gender=Masc|Number=Plur | الأول, الاوائل | الأولى | أوائل, اوائل | |
| Case=Gen|Gender=Fem|Number=Sing | أولى, اولى | الاولى, الأولى | أولى | |
| Case=Gen|Gender=Fem|Number=Dual | الاوليين | |||
| Case=Gen|Gender=Fem|Number=Plur | الاوليات | |||
| Case=Nom|Gender=Masc|Number=Sing | اول | الأول, الاول | اول, أول | |
| Case=Nom|Gender=Fem|Number=Sing | اولى, أولى | الاولى, الأولى | أولى, اولى |
NUM
2207 NUM tokens (28% of all NUM tokens) have a non-empty value of Definite.
The most frequent other feature values with which NUM and Definite co-occurred: NumForm=Word (2207; 100%), Case=Gen (1234; 56%), Number=Sing (1154; 52%).
NUM tokens may have the following values of Definite:
Com(4; 0% of non-emptyDefinite): الاربع، الثلاثة، الخمس، الخمسةCons(1519; 69% of non-emptyDefinite): مليون، مليار، ألف، ثلاثة، ملايين، بليون، الف، آلاف، ثلاث، خمسةDef(340; 15% of non-emptyDefinite): المئة، المائة، الثلاثة، الثلاث، العشرين، الأربعة، المليون، الثماني، الخمس، الستةInd(344; 16% of non-emptyDefinite): عشرين، اثنين، ثلاثة، مليوناً، واحد، مليون، ملياراً، مليونا، ألفاً، ملايينEMPTY(5551): 15، 3، 6، 2، 8، 7، 4، 11، 10، 12
| Paradigm ثَلَاثَة | Ind | Def | Com | Cons |
|---|---|---|---|---|
| Case=Acc|Gender=Masc | ثلاثة | الثلاثة, الثلاثـــــة | ثلاثة | |
| Case=Acc|Gender=Fem | ثلاثا | الثلاث | ثلاث | |
| Case=Gen|Gender=Masc | ثلاثة | الثلاثة | الثلاثة | ثلاثة |
| Case=Gen|Gender=Fem | ثلاث | الثلاث | ثلاث | |
| Case=Nom|Gender=Masc | ثلاثة | الثلاثة | ثلاثة | |
| Case=Nom|Gender=Fem | ثلاث | الثلاث | ثلاث |
PROPN
24 PROPN tokens (10% of all PROPN tokens) have a non-empty value of Definite.
PROPN tokens may have the following values of Definite:
Cons(1; 4% of non-emptyDefinite): بدرDef(23; 96% of non-emptyDefinite): النروج، الفليبين، الإكوادور، البدري، البنتاجون، التاميل، التشاد، الزرقاوي، الفاتيكان، الكوتEMPTY(221): بن، عبدالله، عبدالعزيز، طه، بورسعيد، أبو، عبدالمنعم، يومبلغاز، أبوردينة، أم
Definite seems to be lexical feature of PROPN. 100% lemmas (19) occur only with one value of Definite.
Relations with Agreement in Definite
The 10 most frequent relations where parent and child node agree in Definite:
NOUN –[amod]–> ADJ (18836; 85%),
NOUN –[conj]–> NOUN (4047; 70%),
ADJ –[conj]–> ADJ (881; 98%),
NOUN –[appos]–> NOUN (311; 81%),
ADJ –[amod]–> ADJ (209; 87%),
NOUN –[conj]–> ADJ (135; 67%),
ADJ –[conj]–> NOUN (99; 54%),
NOUN –[orphan]–> NOUN (57; 76%),
NOUN –[nsubj]–> ADJ (56; 84%),
ADJ –[nmod]–> ADJ (27; 55%).