Treebank Statistics: UD_Arabic-PUD: Features: Case
This feature is universal.
It occurs with 3 different values: Acc
, Gen
, Nom
.
9533 tokens (46%) have a non-empty value of Case
.
4605 types (68%) occur at least once with a non-empty value of Case
.
3058 lemmas (64%) occur at least once with a non-empty value of Case
.
The feature is used with 9 part-of-speech tags: NOUN (5443; 26% instances), ADJ (2014; 10% instances), PRON (1252; 6% instances), PROPN (488; 2% instances), NUM (163; 1% instances), DET (162; 1% instances), VERB (8; 0% instances), AUX (2; 0% instances), ADV (1; 0% instances).
NOUN
5443 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Definite=Def (4222; 78%), Number=Sing (3868; 71%), Gender=Masc (3589; 66%).
NOUN
tokens may have the following values of Case
:
Acc
(728; 13% of non-emptyCase
): عاماً، وفقاً، العديد، بدءاً، بدلاً، اسم، الأمر، المزيد، نجاحاً، نفسGen
(3832; 70% of non-emptyCase
): عام، شكلٍ، الوقت، القرن، أجل، النسبة، شأن، العالم، منطقة، نهايةNom
(883; 16% of non-emptyCase
): الأمر، العديد، اسم، الملك، رئيس، الجزء، الشركة، المستثمرون، زيادة، سببEMPTY
(135): الإنترنت، يورو، م، وضع، البولونيوم، عمل، ألبوم، الدراما، اللورد، التكنولوجيا
Paradigm عَام | Nom | Acc | Gen |
---|---|---|---|
Definite=Def|Number=Sing | العام, عام | عام, العام | |
Definite=Def|Number=Dual | عامي, العامين | ||
Definite=Ind|Number=Sing | عاماً, عام | عام | |
Definite=Ind|Number=Dual | عامين |
ADJ
2014 ADJ tokens (99% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Number=Sing (1860; 92%), Definite=Def (1251; 62%), Gender=Fem (1017; 50%).
ADJ
tokens may have the following values of Case
:
Acc
(370; 18% of non-emptyCase
): أكثر، كبيراً، أكبر، الخاصة، جديداً، قائلاً، خاصة، كبيرة، أول، الأولىGen
(1230; 61% of non-emptyCase
): الأول، الخاصة، المتحدة، أكثر، أخرى، الثاني، الأولى، أول، إسترليني، كبيرNom
(414; 21% of non-emptyCase
): أكثر، الأول، كبيرة، الثاني، الخاص، الخاصة، آخر، الأكثر، الأمريكية، الأهمEMPTY
(12): أحدث، 16، 96، آمن، أفضل، ألحقا، الـ36، سافر، عادل، م
Paradigm أَوَّل | Nom | Acc | Gen |
---|---|---|---|
Definite=Def|Gender=Masc|Number=Sing | الأول, أول | الأول | الأول |
Definite=Def|Gender=Masc|Number=Plur | أوائل | ||
Definite=Def|Gender=Fem|Number=Sing | أولى, الأولى | الأولى | الأولى |
Definite=Ind | أول | ||
Definite=Ind|Gender=Masc|Number=Sing | أول | أول | |
Definite=Ind|Gender=Fem|Number=Sing | أولى | أولى | |
Definite=Ind|Gender=Fem|Number=Plur | أولى |
PRON
1252 PRON tokens (96% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Number=Sing (1001; 80%), Person=3 (718; 57%), Gender=Masc (658; 53%).
PRON
tokens may have the following values of Case
:
Acc
(234; 19% of non-emptyCase
): ه، ها، ما، هذا، الذي، هم، نا، التي، هذه، ذلكGen
(863; 69% of non-emptyCase
): ه، ها، هم، التي، ما، ذلك، الذي، هذه، نا، هذاNom
(155; 12% of non-emptyCase
): هذا، التي، الذي، ما، هو، هذه، هي، من، أنا، ذلكEMPTY
(47): هو، هي، ه، ها، هما
Paradigm هُوَ | Nom | Acc | Gen |
---|---|---|---|
Gender=Masc|Number=Sing|Person=2 | ك | ك | |
Gender=Masc|Number=Sing|Person=3 | هو | ه | ه |
Gender=Masc|Number=Plur|Person=3 | هم | هم | هم |
Gender=Fem|Number=Sing|Person=3 | هي | ها | ها |
Gender=Fem|Number=Plur|Person=3 | هن, هم | ||
Number=Sing|Person=1 | أنا | ني | ي, نا |
Number=Sing|Person=2 | ك | ك | |
Number=Dual|Person=2 | هما | ||
Number=Dual|Person=3 | هما | هما | |
Number=Plur|Person=1 | نحن | نا | نا |
Number=Plur|Person=2 | كم | ||
Number=Plur|Person=3 | هم | ||
Person=2 | ك |
PROPN
488 PROPN tokens (28% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (431; 88%), Definite=Def (300; 61%), Gender=Masc (259; 53%).
PROPN
tokens may have the following values of Case
:
Acc
(18; 4% of non-emptyCase
): الإمبراطورية، أبو، أندريه، الألعاب، الثلاثاء، الحرب، الله، الولايات، اليونان، بحرGen
(410; 84% of non-emptyCase
): البحر، الصين، الاتحاد، تشرين، الولايات، كانون، نهر، جنوب، العصر، المحيطNom
(60; 12% of non-emptyCase
): الإمبراطورية، البحر، الثورة، الولايات، اليونان، حديقة، دير، رمسيس، سارة، مجلسEMPTY
(1240): سي، بي، ترامب، تشرين، دي، فرنسا، أفريقيا، بريطانيا، روسيا، هونغ
Paradigm وِلايَة | Nom | Acc | Gen |
---|---|---|---|
Number=Sing | ولاية | ||
Number=Plur | الولايات | الولايات | الولايات, لولايات |
NUM
163 NUM tokens (44% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: Gender=EMPTY (85; 52%), Number=Plur (82; 50%).
NUM
tokens may have the following values of Case
:
Acc
(26; 16% of non-emptyCase
): عشر، مليون، أربع، أربعة، ثلاث، ثمانية، ست، ألف، الثلاثة، الملياراتGen
(126; 77% of non-emptyCase
): 2014، 1492، 2012، 2013، عشر، عشرة، مليون، 1879، 1911، 1916Nom
(11; 7% of non-emptyCase
): أربعة، ثلاث، أربع، ثلاثة، ثمانية، خمسة، خمسون، عشرونEMPTY
(208): 1، 10، 3، 100، 2015، 11، 20، 2010، 2017، 31
Paradigm ثلاث | Nom | Acc | Gen |
---|---|---|---|
ثلاث | ثلاث | ثلاث |
DET
162 DET tokens (98% of all DET
tokens) have a non-empty value of Case
.
DET
tokens may have the following values of Case
:
Acc
(37; 23% of non-emptyCase
): كل، عدة، آخر، أي، بعض، أحد، شبه، غالبية، إحدى، بقيةGen
(82; 51% of non-emptyCase
): كل، أحد، أي، إحدى، عدة، بعض، آخر، جميع، معظم، أغلبNom
(43; 27% of non-emptyCase
): كل، بعض، أحد، إحدى، أي، معظم، آخر، أغلب، أكثر، جميعEMPTY
(4): ذا، ال، لو
Paradigm كُلّ | Nom | Acc | Gen |
---|---|---|---|
كل | كل | كل |
VERB
8 VERB tokens (0% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Aspect=EMPTY (8; 100%), Mood=EMPTY (8; 100%), Person=EMPTY (8; 100%), Tense=EMPTY (8; 100%), Voice=EMPTY (7; 88%), Gender=Masc (6; 75%).
VERB
tokens may have the following values of Case
:
Acc
(2; 25% of non-emptyCase
): أملاً، انتقاداتGen
(4; 50% of non-emptyCase
): إلباس، اعتبار، جعل، ذكراNom
(2; 25% of non-emptyCase
): الغاية، مهتمٌEMPTY
(1742): يمكن، كان، قال، كانت، يكون، تم، بدأت، قالت، يكن، بدأ
AUX
2 AUX tokens (1% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Aspect=EMPTY (2; 100%), Gender=Masc (2; 100%), Mood=EMPTY (2; 100%), Number=EMPTY (2; 100%), Person=EMPTY (2; 100%), Tense=EMPTY (2; 100%), Voice=EMPTY (2; 100%).
AUX
tokens may have the following values of Case
:
Gen
(2; 100% of non-emptyCase
): كونEMPTY
(184): كان، كانت، يكون، كانوا، تكن، تكون، كنت، ليس، ليست، يكن
ADV
1 ADV tokens (0% of all ADV
tokens) have a non-empty value of Case
.
ADV
tokens may have the following values of Case
:
Gen
(1; 100% of non-emptyCase
): يومEMPTY
(403): عام، أيضاً، هناك، فقط، نحو، جداً، الآن، تقريباً، عادةً، يوم
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (1349; 99%),
NOUN –[nmod]–> NOUN (1229; 65%),
NOUN –[conj]–> NOUN (253; 96%),
NOUN –[nmod]–> PRON (249; 59%),
PROPN –[amod]–> ADJ (176; 73%),
NOUN –[det]–> PRON (97; 96%),
NOUN –[ccomp]–> ADJ (89; 93%),
NOUN –[det]–> DET (69; 53%),
ADJ –[conj]–> ADJ (29; 88%),
NOUN –[appos]–> NOUN (19; 58%).