Treebank Statistics: UD_Arabic-PUD: Features: Definite
This feature is universal.
It occurs with 2 different values: Def, Ind.
7882 tokens (38%) have a non-empty value of Definite.
4442 types (65%) occur at least once with a non-empty value of Definite.
2917 lemmas (61%) occur at least once with a non-empty value of Definite.
The feature is used with 6 part-of-speech tags: NOUN (5529; 27% instances), ADJ (2019; 10% instances), PROPN (323; 2% instances), VERB (8; 0% instances), AUX (2; 0% instances), DET (1; 0% instances).
NOUN
5529 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Definite.
The most frequent other feature values with which NOUN and Definite co-occurred: Number=Sing (3941; 71%), Case=Gen (3832; 69%), Gender=Masc (3651; 66%).
NOUN tokens may have the following values of Definite:
Def(4293; 78% of non-emptyDefinite): عام، الوقت، اسم، العديد، القرن، الأمر، العالم، النسبة، الكثير، المنطقةInd(1236; 22% of non-emptyDefinite): شكلٍ، جنيه، مرة، شكل، دولار، وقتٍ، سنوات، عاماً، فترة، وفقاًEMPTY(46): وضع، عمل، تبعت، حكم، دار، درس، زحف، أعما، ألف، أملت
| Paradigm عَام | Ind | Def |
|---|---|---|
| Case=Acc|Number=Sing | عاماً, عام | |
| Case=Gen|Number=Sing | عام | عام, العام |
| Case=Gen|Number=Dual | عامين | عامي, العامين |
| Case=Nom|Number=Sing | العام, عام |
ADJ
2019 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Definite.
The most frequent other feature values with which ADJ and Definite co-occurred: Number=Sing (1861; 92%), Case=Gen (1230; 61%), Gender=Fem (1017; 50%).
ADJ tokens may have the following values of Definite:
Def(1255; 62% of non-emptyDefinite): الأول، الخاصة، المتحدة، الثاني، الأولى، الجديدة، البريطانية، الثالث، الأمريكية، الشماليةInd(764; 38% of non-emptyDefinite): أكثر، كبيرة، أخرى، أول، أكبر، إسترليني، جديدة، كبير، كبيراً، آخرEMPTY(6): أحدث، آمن، ألحقا، سافر، عادل
| Paradigm أَوَّل | Ind | Def |
|---|---|---|
| Case=Acc|Gender=Masc|Number=Sing | أول | الأول |
| Case=Acc|Gender=Fem|Number=Sing | أولى | الأولى |
| Case=Gen | أول | |
| Case=Gen|Gender=Masc|Number=Sing | أول | الأول |
| Case=Gen|Gender=Masc|Number=Plur | أوائل | |
| Case=Gen|Gender=Fem|Number=Sing | أولى | الأولى |
| Case=Nom|Gender=Masc|Number=Sing | الأول, أول | |
| Case=Nom|Gender=Fem|Number=Sing | أولى, الأولى | |
| Case=Nom|Gender=Fem|Number=Plur | أولى |
PROPN
323 PROPN tokens (19% of all PROPN tokens) have a non-empty value of Definite.
The most frequent other feature values with which PROPN and Definite co-occurred: Number=Sing (271; 84%), Case=Gen (266; 82%), Gender=Masc (167; 52%).
PROPN tokens may have the following values of Definite:
Def(308; 95% of non-emptyDefinite): البحر، الولايات، الاتحاد، مجلس، نهر، الإمبراطورية، الحرب، المحيط، المملكة، بحرInd(15; 5% of non-emptyDefinite): أرض، أشياء، إمبراطورة، ابن، بيانو، تأسيس، جائزة، جزيرة، رأس، عاماًEMPTY(1405): تشرين، الصين، سي، بي، ترامب، كانون، نيسان، دي، فرنسا، أفريقيا
| Paradigm جَزِيرَة | Ind | Def |
|---|---|---|
| Case=Gen|Number=Sing | جزيرة | الجزيرة, جزيرة |
| Case=Gen|Number=Plur | الجزر, جزر | |
| Case=Nom|Number=Plur | جزر |
Definite seems to be lexical feature of PROPN. 98% lemmas (153) occur only with one value of Definite.
VERB
8 VERB tokens (0% of all VERB tokens) have a non-empty value of Definite.
The most frequent other feature values with which VERB and Definite co-occurred: Aspect=EMPTY (8; 100%), Mood=EMPTY (8; 100%), Person=EMPTY (8; 100%), Tense=EMPTY (8; 100%), VerbForm=EMPTY (8; 100%), Voice=EMPTY (7; 88%), Gender=Masc (6; 75%).
VERB tokens may have the following values of Definite:
Def(5; 63% of non-emptyDefinite): إلباس، اعتبار، الغاية، جعل، ذكراInd(3; 38% of non-emptyDefinite): أملاً، انتقادات، مهتمٌEMPTY(1746): يمكن، كان، قال، كانت، يكون، تم، بدأت، قالت، يكن، بدأ
AUX
2 AUX tokens (1% of all AUX tokens) have a non-empty value of Definite.
The most frequent other feature values with which AUX and Definite co-occurred: Aspect=EMPTY (2; 100%), Gender=Masc (2; 100%), Mood=EMPTY (2; 100%), Number=EMPTY (2; 100%), Person=EMPTY (2; 100%), Tense=EMPTY (2; 100%), VerbForm=EMPTY (2; 100%), Voice=EMPTY (2; 100%).
AUX tokens may have the following values of Definite:
Def(2; 100% of non-emptyDefinite): كونEMPTY(184): كان، كانت، يكون، كانوا، تكن، تكون، كنت، ليس، ليست، يكن
DET
1 DET tokens (1% of all DET tokens) have a non-empty value of Definite.
The most frequent other feature values with which DET and Definite co-occurred: Case=EMPTY (1; 100%), PronType=Art (1; 100%).
DET tokens may have the following values of Definite:
Def(1; 100% of non-emptyDefinite): لوEMPTY(165): كل، أحد، بعض، إحدى، أي، عدة، آخر، معظم، جميع، شبه
Relations with Agreement in Definite
The 10 most frequent relations where parent and child node agree in Definite:
NOUN –[nmod]–> NOUN (1592; 82%),
NOUN –[amod]–> ADJ (1357; 99%),
NOUN –[conj]–> NOUN (240; 91%),
ADJ –[obl]–> NOUN (160; 58%),
PROPN –[amod]–> ADJ (154; 64%),
NOUN –[ccomp]–> ADJ (88; 92%),
ADJ –[conj]–> ADJ (33; 100%),
NOUN –[appos]–> NOUN (27; 82%),
NOUN –[acl]–> NOUN (16; 94%),
NOUN –[nmod]–> ADJ (9; 75%).