Treebank Statistics: UD_Arabic-PUD: Features: Case
This feature is universal.
It occurs with 3 different values: Acc, Gen, Nom.
9533 tokens (46%) have a non-empty value of Case.
4605 types (68%) occur at least once with a non-empty value of Case.
3058 lemmas (64%) occur at least once with a non-empty value of Case.
The feature is used with 9 part-of-speech tags: NOUN (5443; 26% instances), ADJ (2014; 10% instances), PRON (1252; 6% instances), PROPN (488; 2% instances), NUM (163; 1% instances), DET (162; 1% instances), VERB (8; 0% instances), AUX (2; 0% instances), ADV (1; 0% instances).
NOUN
5443 NOUN tokens (98% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Definite=Def (4222; 78%), Number=Sing (3868; 71%), Gender=Masc (3589; 66%).
NOUN tokens may have the following values of Case:
Acc(728; 13% of non-emptyCase): عاماً، وفقاً، العديد، بدءاً، بدلاً، اسم، الأمر، المزيد، نجاحاً، نفسGen(3832; 70% of non-emptyCase): عام، شكلٍ، الوقت، القرن، أجل، النسبة، شأن، العالم، منطقة، نهايةNom(883; 16% of non-emptyCase): الأمر، العديد، اسم، الملك، رئيس، الجزء، الشركة، المستثمرون، زيادة، سببEMPTY(132): الإنترنت، يورو، م، وضع، البولونيوم، عمل، ألبوم، الدراما، اللورد، التكنولوجيا
| Paradigm عَام | Nom | Acc | Gen |
|---|---|---|---|
| Definite=Def|Number=Sing | العام, عام | عام, العام | |
| Definite=Def|Number=Dual | عامي, العامين | ||
| Definite=Ind|Number=Sing | عاماً, عام | عام | |
| Definite=Ind|Number=Dual | عامين |
ADJ
2014 ADJ tokens (99% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Number=Sing (1860; 92%), Definite=Def (1251; 62%), Gender=Fem (1017; 50%).
ADJ tokens may have the following values of Case:
Acc(370; 18% of non-emptyCase): أكثر، كبيراً، أكبر، الخاصة، جديداً، قائلاً، خاصة، كبيرة، أول، الأولىGen(1230; 61% of non-emptyCase): الأول، الخاصة، المتحدة، أكثر، أخرى، الثاني، الأولى، أول، إسترليني، كبيرNom(414; 21% of non-emptyCase): أكثر، الأول، كبيرة، الثاني، الخاص، الخاصة، آخر، الأكثر، الأمريكية، الأهمEMPTY(11): أحدث، 16، 96، آمن، ألحقا، الـ36، سافر، عادل، م، وايلد
| Paradigm أَوَّل | Nom | Acc | Gen |
|---|---|---|---|
| Definite=Def|Gender=Masc|Number=Sing | الأول, أول | الأول | الأول |
| Definite=Def|Gender=Masc|Number=Plur | أوائل | ||
| Definite=Def|Gender=Fem|Number=Sing | أولى, الأولى | الأولى | الأولى |
| Definite=Ind | أول | ||
| Definite=Ind|Gender=Masc|Number=Sing | أول | أول | |
| Definite=Ind|Gender=Fem|Number=Sing | أولى | أولى | |
| Definite=Ind|Gender=Fem|Number=Plur | أولى |
PRON
1252 PRON tokens (96% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Number=Sing (1001; 80%), PronType=Prs (788; 63%), Person=3 (718; 57%), Gender=Masc (658; 53%).
PRON tokens may have the following values of Case:
Acc(234; 19% of non-emptyCase): ه، ها، هذا، الذي، هم، نا، التي، ما، هذه، ذلكGen(863; 69% of non-emptyCase): ه، ها، هم، التي، ذلك، ما، الذي، هذه، نا، هذاNom(155; 12% of non-emptyCase): هذا، التي، الذي، هو، هذه، هي، ما، أنا، ذلك، تلكEMPTY(47): هو، هي، ه، ها، هما
| Paradigm هُوَ | Nom | Acc | Gen |
|---|---|---|---|
| Gender=Masc|Number=Sing|Person=2 | ك | ك | |
| Gender=Masc|Number=Sing|Person=3 | هو | ه | ه |
| Gender=Masc|Number=Plur|Person=3 | هم | هم | هم |
| Gender=Fem|Number=Sing|Person=3 | هي | ها | ها |
| Gender=Fem|Number=Plur|Person=3 | هن, هم | ||
| Number=Sing|Person=1 | أنا | ني | ي, نا |
| Number=Sing|Person=2 | ك | ك | |
| Number=Dual|Person=2 | هما | ||
| Number=Dual|Person=3 | هما | هما | |
| Number=Plur|Person=1 | نحن | نا | نا |
| Number=Plur|Person=2 | كم | ||
| Number=Plur|Person=3 | هم | ||
| Person=2 | ك |
PROPN
488 PROPN tokens (28% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Number=Sing (431; 88%), Definite=Def (300; 61%), Gender=Masc (259; 53%).
PROPN tokens may have the following values of Case:
Acc(18; 4% of non-emptyCase): الإمبراطورية، أبو، أندريه، الألعاب، الثلاثاء، الحرب، الله، الولايات، اليونان، بحرGen(410; 84% of non-emptyCase): البحر، الصين، الاتحاد، تشرين، الولايات، كانون، نهر، جنوب، العصر، المحيطNom(60; 12% of non-emptyCase): الإمبراطورية، البحر، الثورة، الولايات، اليونان، حديقة، دير، رمسيس، سارة، مجلسEMPTY(1240): سي، بي، ترامب، تشرين، دي، فرنسا، أفريقيا، بريطانيا، روسيا، هونغ
| Paradigm وِلايَة | Nom | Acc | Gen |
|---|---|---|---|
| Number=Sing | ولاية | ||
| Number=Plur | الولايات | الولايات | الولايات, لولايات |
NUM
163 NUM tokens (44% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: Gender=EMPTY (85; 52%), Number=Plur (82; 50%).
NUM tokens may have the following values of Case:
Acc(26; 16% of non-emptyCase): عشر، مليون، أربع، أربعة، ثلاث، ثمانية، ست، ألف، الثلاثة، الملياراتGen(126; 77% of non-emptyCase): 2014، 1492، 2012، 2013، عشر، عشرة، مليون، 1879، 1911، 1916Nom(11; 7% of non-emptyCase): أربعة، ثلاث، أربع، ثلاثة، ثمانية، خمسة، خمسون، عشرونEMPTY(208): 1، 10، 3، 100، 2015، 11، 20، 2010، 2017، 31
| Paradigm ثلاث | Nom | Acc | Gen |
|---|---|---|---|
| ثلاث | ثلاث | ثلاث |
DET
162 DET tokens (98% of all DET tokens) have a non-empty value of Case.
The most frequent other feature values with which DET and Case co-occurred: PronType=Ind (108; 67%).
DET tokens may have the following values of Case:
Acc(37; 23% of non-emptyCase): كل، عدة، آخر، أي، بعض، أحد، شبه، غالبية، إحدى، بقيةGen(82; 51% of non-emptyCase): كل، أحد، أي، إحدى، عدة، بعض، آخر، جميع، معظم، أغلبNom(43; 27% of non-emptyCase): كل، بعض، أحد، إحدى، أي، معظم، آخر، أغلب، أكثر، جميعEMPTY(4): ذا، ال، لو
| Paradigm كُلّ | Nom | Acc | Gen |
|---|---|---|---|
| كل | كل | كل |
VERB
8 VERB tokens (0% of all VERB tokens) have a non-empty value of Case.
The most frequent other feature values with which VERB and Case co-occurred: Aspect=EMPTY (8; 100%), Mood=EMPTY (8; 100%), Person=EMPTY (8; 100%), Tense=EMPTY (8; 100%), VerbForm=EMPTY (8; 100%), Voice=EMPTY (7; 88%), Gender=Masc (6; 75%).
VERB tokens may have the following values of Case:
Acc(2; 25% of non-emptyCase): أملاً، انتقاداتGen(4; 50% of non-emptyCase): إلباس، اعتبار، جعل، ذكراNom(2; 25% of non-emptyCase): الغاية، مهتمٌEMPTY(1746): يمكن، كان، قال، كانت، يكون، تم، بدأت، قالت، يكن، بدأ
AUX
2 AUX tokens (1% of all AUX tokens) have a non-empty value of Case.
The most frequent other feature values with which AUX and Case co-occurred: Aspect=EMPTY (2; 100%), Gender=Masc (2; 100%), Mood=EMPTY (2; 100%), Number=EMPTY (2; 100%), Person=EMPTY (2; 100%), Tense=EMPTY (2; 100%), VerbForm=EMPTY (2; 100%), Voice=EMPTY (2; 100%).
AUX tokens may have the following values of Case:
Gen(2; 100% of non-emptyCase): كونEMPTY(184): كان، كانت، يكون، كانوا، تكن، تكون، كنت، ليس، ليست، يكن
ADV
1 ADV tokens (0% of all ADV tokens) have a non-empty value of Case.
ADV tokens may have the following values of Case:
Gen(1; 100% of non-emptyCase): يومEMPTY(403): عام، أيضاً، هناك، فقط، نحو، جداً، الآن، تقريباً، عادةً، يوم
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[amod]–> ADJ (1350; 99%),
NOUN –[nmod]–> NOUN (1247; 65%),
NOUN –[conj]–> NOUN (253; 96%),
NOUN –[nmod]–> PRON (253; 60%),
PROPN –[amod]–> ADJ (176; 73%),
NOUN –[det]–> PRON (96; 96%),
NOUN –[ccomp]–> ADJ (89; 93%),
NOUN –[det]–> DET (69; 53%),
ADJ –[conj]–> ADJ (29; 88%),
NOUN –[appos]–> NOUN (19; 58%).