Treebank Statistics: UD_Arabic: Features: Definite
This feature is universal but the values Cons
are language-specific.
It occurs with 4 different values: Com
, Cons
, Def
, Ind
.
123453 tokens (44%) have a non-empty value of Definite
.
14971 types (57%) occur at least once with a non-empty value of Definite
.
6324 lemmas (38%) occur at least once with a non-empty value of Definite
.
The feature is used with 3 part-of-speech tags: NOUN (92032; 33% instances), ADJ (29216; 10% instances), NUM (2205; 1% instances).
NOUN
92032 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which NOUN
and Definite
co-occurred: Number=Sing (70839; 77%), Case=Gen (66157; 72%).
NOUN
tokens may have the following values of Definite
:
Cons
(34532; 38% of non-emptyDefinite
): رئيس، وزير، كل، غير، مجلس، عام، بعض، يوم، نفس، عدمDef
(39891; 43% of non-emptyDefinite
): اليوم، الحكومة، العراق، الرئيس، الولايات، الدول، السوق، العام، المنطقة، الدكتورInd
(17609; 19% of non-emptyDefinite
): مصر، دولار، جنيه، مايو، إسرائيل، عدد، لبنان، بغداد، مصادر، سنواتEMPTY
(19): بد، أمل، اهمية، ايادي، بديل، تعازى، جدوى، حلاوة، خلاف، خيارات
Paradigm يَوم | Ind | Def | Cons |
---|---|---|---|
Case=Acc|Number=Sing | يوما, يوماً | اليوم | يوم |
Case=Acc|Number=Dual | يومين | يومي, يومى | |
Case=Acc|Number=Plur | اياما | الأيام, الايام | ايام, أيام |
Case=Gen|Number=Sing | يوم | اليوم | يوم |
Case=Gen|Number=Dual | يومين | اليومين | |
Case=Gen|Number=Plur | أيام, ايام | الايام, الأيام | أيام |
Case=Nom|Number=Sing | يوم | اليوم | يوم |
Case=Nom|Number=Plur | الايام, الأيام | أيام |
ADJ
29216 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which ADJ
and Definite
co-occurred: Number=Sing (27490; 94%), Case=Gen (19099; 65%), Gender=Masc (15035; 51%).
ADJ
tokens may have the following values of Definite
:
Com
(40; 0% of non-emptyDefinite
): الثالث، الأولى، الذاتية، السابع، القصيرة، الحادية، الخامسة، المستندي، البعيدة، التاسعCons
(1404; 5% of non-emptyDefinite
): أي، اي، أول، اول، أكبر، مختلف، أبرز، أهم، كبار، أسعدDef
(18902; 65% of non-emptyDefinite
): المصرية، المتحدة، المصري، الماضي، العربية، الحالي، الدولية، الفلسطينية، العام، المقبلInd
(8870; 30% of non-emptyDefinite
): جديدة، خاصة، أخرى، أكثر، اخرى، سورية، اكثر، جديد، كبيرة، حالياًEMPTY
(5): أفريقي، أوسطي، افريقي، عام، كبيرة
Paradigm أَوَّل | Ind | Def | Com | Cons |
---|---|---|---|---|
Case=Acc|Gender=Masc|Number=Sing | أول, أولاً, اول, اولا, اولاً, أولا | الاول, الأول | أول, اول | |
Case=Acc|Gender=Masc|Number=Plur | الأولى | |||
Case=Acc|Gender=Fem|Number=Sing | الاولى, الأولى | أولى, اولى | ||
Case=Gen|Gender=Masc|Number=Sing | أول, اول | الاول, الأول | أول, اول | |
Case=Gen|Gender=Masc|Number=Plur | الأول, الاوائل | الأولى | أوائل, اوائل | |
Case=Gen|Gender=Fem|Number=Sing | أولى, اولى | الاولى, الأولى | أولى | |
Case=Gen|Gender=Fem|Number=Dual | الاوليين | |||
Case=Gen|Gender=Fem|Number=Plur | الاوليات | |||
Case=Nom|Gender=Masc|Number=Sing | اول | الأول, الاول | اول, أول | |
Case=Nom|Gender=Fem|Number=Sing | اولى, أولى | الاولى, الأولى | أولى, اولى |
NUM
2205 NUM tokens (28% of all NUM
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which NUM
and Definite
co-occurred: NumForm=Word (2205; 100%), Case=Gen (1233; 56%), Number=Sing (1154; 52%).
NUM
tokens may have the following values of Definite
:
Com
(4; 0% of non-emptyDefinite
): الاربع، الثلاثة، الخمس، الخمسةCons
(1519; 69% of non-emptyDefinite
): مليون، مليار، ألف، ثلاثة، ملايين، بليون، الف، آلاف، ثلاث، خمسةDef
(340; 15% of non-emptyDefinite
): المئة، المائة، الثلاثة، الثلاث، العشرين، الأربعة، المليون، الثماني، الخمس، الستةInd
(342; 16% of non-emptyDefinite
): عشرين، اثنين، ثلاثة، مليوناً، واحد، مليون، ملياراً، مليونا، ألفاً، ملايينEMPTY
(5551): 15، 3، 6، 2، 8، 7، 4، 11، 10، 12
Paradigm ثَلَاثَة | Ind | Def | Com | Cons |
---|---|---|---|---|
Case=Acc|Gender=Masc | ثلاثة | الثلاثة, الثلاثـــــة | ثلاثة | |
Case=Acc|Gender=Fem | ثلاثا | الثلاث | ثلاث | |
Case=Gen|Gender=Masc | ثلاثة | الثلاثة | الثلاثة | ثلاثة |
Case=Gen|Gender=Fem | ثلاث | الثلاث | ثلاث | |
Case=Nom|Gender=Masc | ثلاثة | الثلاثة | ثلاثة | |
Case=Nom|Gender=Fem | ثلاث | الثلاث | ثلاث |
Relations with Agreement in Definite
The 10 most frequent relations where parent and child node agree in Definite
:
NOUN –[amod]–> ADJ (19082; 84%),
NOUN –[conj]–> NOUN (3731; 71%),
ADJ –[conj]–> ADJ (832; 98%),
NOUN –[appos]–> NOUN (313; 79%),
ADJ –[amod]–> ADJ (234; 82%),
NOUN –[conj]–> ADJ (122; 66%),
ADJ –[conj]–> NOUN (90; 52%),
NOUN –[orphan]–> NOUN (66; 75%),
NOUN –[nsubj]–> ADJ (56; 84%),
NOUN –[case]–> NOUN (40; 55%).