Treebank Statistics: UD_Arabic-PUD: Features: Definite
This feature is universal.
It occurs with 2 different values: Def
, Ind
.
7881 tokens (38%) have a non-empty value of Definite
.
4441 types (65%) occur at least once with a non-empty value of Definite
.
2916 lemmas (61%) occur at least once with a non-empty value of Definite
.
The feature is used with 5 part-of-speech tags: NOUN (5529; 27% instances), ADJ (2019; 10% instances), PROPN (323; 2% instances), VERB (8; 0% instances), AUX (2; 0% instances).
NOUN
5529 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which NOUN
and Definite
co-occurred: Number=Sing (3941; 71%), Case=Gen (3832; 69%), Gender=Masc (3651; 66%).
NOUN
tokens may have the following values of Definite
:
Def
(4293; 78% of non-emptyDefinite
): عام، الوقت، اسم، العديد، القرن، الأمر، العالم، النسبة، الكثير، المنطقةInd
(1236; 22% of non-emptyDefinite
): شكلٍ، جنيه، مرة، شكل، دولار، وقتٍ، سنوات، عاماً، فترة، وفقاًEMPTY
(49): وضع، عمل، تبعت، حكم، دار، درس، زحف، أسمي، أعما، ألعب
Paradigm عَام | Ind | Def |
---|---|---|
Case=Acc|Number=Sing | عاماً, عام | |
Case=Gen|Number=Sing | عام | عام, العام |
Case=Gen|Number=Dual | عامين | عامي, العامين |
Case=Nom|Number=Sing | العام, عام |
ADJ
2019 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which ADJ
and Definite
co-occurred: Number=Sing (1861; 92%), Case=Gen (1230; 61%), Gender=Fem (1017; 50%).
ADJ
tokens may have the following values of Definite
:
Def
(1255; 62% of non-emptyDefinite
): الأول، الخاصة، المتحدة، الثاني، الأولى، الجديدة، البريطانية، الثالث، الأمريكية، الشماليةInd
(764; 38% of non-emptyDefinite
): أكثر، كبيرة، أخرى، أول، أكبر، إسترليني، جديدة، كبير، كبيراً، آخرEMPTY
(7): أحدث، آمن، أفضل، ألحقا، سافر، عادل
Paradigm أَوَّل | Ind | Def |
---|---|---|
Case=Acc|Gender=Masc|Number=Sing | أول | الأول |
Case=Acc|Gender=Fem|Number=Sing | أولى | الأولى |
Case=Gen | أول | |
Case=Gen|Gender=Masc|Number=Sing | أول | الأول |
Case=Gen|Gender=Masc|Number=Plur | أوائل | |
Case=Gen|Gender=Fem|Number=Sing | أولى | الأولى |
Case=Nom|Gender=Masc|Number=Sing | الأول, أول | |
Case=Nom|Gender=Fem|Number=Sing | أولى, الأولى | |
Case=Nom|Gender=Fem|Number=Plur | أولى |
PROPN
323 PROPN tokens (19% of all PROPN
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which PROPN
and Definite
co-occurred: Number=Sing (271; 84%), Case=Gen (266; 82%), Gender=Masc (167; 52%).
PROPN
tokens may have the following values of Definite
:
Def
(308; 95% of non-emptyDefinite
): البحر، الولايات، الاتحاد، مجلس، نهر، الإمبراطورية، الحرب، المحيط، المملكة، بحرInd
(15; 5% of non-emptyDefinite
): أرض، أشياء، إمبراطورة، ابن، بيانو، تأسيس، جائزة، جزيرة، رأس، عاماًEMPTY
(1405): تشرين، الصين، سي، بي، ترامب، كانون، نيسان، دي، فرنسا، أفريقيا
Paradigm جَزِيرَة | Ind | Def |
---|---|---|
Case=Gen|Number=Sing | جزيرة | الجزيرة, جزيرة |
Case=Gen|Number=Plur | الجزر, جزر | |
Case=Nom|Number=Plur | جزر |
Definite
seems to be lexical feature of PROPN
. 98% lemmas (153) occur only with one value of Definite
.
VERB
8 VERB tokens (0% of all VERB
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which VERB
and Definite
co-occurred: Aspect=EMPTY (8; 100%), Mood=EMPTY (8; 100%), Person=EMPTY (8; 100%), Tense=EMPTY (8; 100%), Voice=EMPTY (7; 88%), Gender=Masc (6; 75%).
VERB
tokens may have the following values of Definite
:
Def
(5; 63% of non-emptyDefinite
): إلباس، اعتبار، الغاية، جعل، ذكراInd
(3; 38% of non-emptyDefinite
): أملاً، انتقادات، مهتمٌEMPTY
(1742): يمكن، كان، قال، كانت، يكون، تم، بدأت، قالت، يكن، بدأ
AUX
2 AUX tokens (1% of all AUX
tokens) have a non-empty value of Definite
.
The most frequent other feature values with which AUX
and Definite
co-occurred: Aspect=EMPTY (2; 100%), Gender=Masc (2; 100%), Mood=EMPTY (2; 100%), Number=EMPTY (2; 100%), Person=EMPTY (2; 100%), Tense=EMPTY (2; 100%), Voice=EMPTY (2; 100%).
AUX
tokens may have the following values of Definite
:
Def
(2; 100% of non-emptyDefinite
): كونEMPTY
(184): كان، كانت، يكون، كانوا، تكن، تكون، كنت، ليس، ليست، يكن
Relations with Agreement in Definite
The 10 most frequent relations where parent and child node agree in Definite
:
NOUN –[nmod]–> NOUN (1575; 83%),
NOUN –[amod]–> ADJ (1357; 99%),
NOUN –[conj]–> NOUN (240; 91%),
ADJ –[obl]–> NOUN (160; 58%),
PROPN –[amod]–> ADJ (154; 64%),
NOUN –[ccomp]–> ADJ (88; 92%),
ADJ –[conj]–> ADJ (33; 100%),
NOUN –[appos]–> NOUN (27; 82%),
NOUN –[acl]–> NOUN (16; 94%),
NOUN –[nmod]–> ADJ (9; 75%).