Treebank Statistics: UD_Arabic-PADT: Features: Case
This feature is universal.
It occurs with 3 different values: Acc, Gen, Nom.
146800 tokens (52%) have a non-empty value of Case.
15350 types (62%) occur at least once with a non-empty value of Case.
6577 lemmas (43%) occur at least once with a non-empty value of Case.
The feature is used with 7 part-of-speech tags: NOUN (93686; 33% instances), ADJ (29351; 10% instances), PRON (10877; 4% instances), ADP (6005; 2% instances), DET (4670; 2% instances), NUM (2208; 1% instances), PROPN (3; 0% instances).
NOUN
93686 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (72092; 77%).
NOUN tokens may have the following values of Case:
Acc(14121; 15% of non-emptyCase): اليوم، يوم، عام، الثلاثاء، السبت، غير، كل، الحكومة، مصر، مساءGen(66788; 71% of non-emptyCase): مصر، دولار، العراق، جنيه، مجلس، كل، الحكومة، الدول، الرئيس، مايوNom(12777; 14% of non-emptyCase): رئيس، وزير، الدكتور، الحكومة، مصر، الرئيس، عدد، مصادر، التقرير، الولاياتEMPTY(19): أعراض، إعلان، الآفات، الأوتوستراد، الاستحواذ، البعض، التخويف، التعويض، الجغرافيا، الخضروات
| Paradigm يَوم | Nom | Acc | Gen |
|---|---|---|---|
| Definite=Cons|Number=Sing | يوم | يوم | يوم |
| Definite=Cons|Number=Dual | يومي, يومى | ||
| Definite=Cons|Number=Plur | أيام | ايام, أيام | أيام |
| Definite=Def|Number=Sing | اليوم | اليوم | اليوم |
| Definite=Def|Number=Dual | اليومين | ||
| Definite=Def|Number=Plur | الايام, الأيام | الأيام, الايام | الايام, الأيام |
| Definite=Ind|Number=Sing | يوم | يوما, يوماً | يوم |
| Definite=Ind|Number=Dual | يومين | يومين | |
| Definite=Ind|Number=Plur | اياما | أيام, ايام |
ADJ
29351 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Number=Sing (27614; 94%), Definite=Def (18961; 65%), Gender=Masc (15122; 52%).
ADJ tokens may have the following values of Case:
Acc(5466; 19% of non-emptyCase): خاصة، الماضي، حالياً، حاليا، مشيراً، أكثر، المقبل، مشيرا، أي، المتحدةGen(19121; 65% of non-emptyCase): المصرية، المتحدة، المصري، العربية، الماضي، الحالي، الفلسطينية، الدولية، أي، جديدةNom(4764; 16% of non-emptyCase): المتحدة، المصرية، المصري، العام، كبير، السابق، السوري، أسعد، أكثر، الاسرائيلي
| Paradigm مِصرِيّ | Nom | Acc | Gen |
|---|---|---|---|
| Definite=Cons|Gender=Masc|Number=Sing | مصري | ||
| Definite=Def|Gender=Masc|Number=Sing | المصري, المصرى | المصري | المصري, المصرى |
| Definite=Def|Gender=Masc|Number=Plur | المصريون | المصريين | المصريين |
| Definite=Def|Gender=Fem|Number=Sing | المصرية | المصرية, المصـــرية | المصرية, المصريةـ |
| Definite=Def|Gender=Fem|Number=Dual | المصريتين | ||
| Definite=Ind|Gender=Masc|Number=Sing | مصري | مصرياً | مصري |
| Definite=Ind|Gender=Masc|Number=Dual | مصريين | ||
| Definite=Ind|Gender=Masc|Number=Plur | مصريون | مصريين | مصريين |
| Definite=Ind|Gender=Fem|Number=Sing | مصرية | مصرية | مصرية |
| Definite=Ind|Gender=Fem|Number=Dual | مصريتان | ||
| Definite=Ind|Gender=Fem|Number=Plur | مصريات |
PRON
10877 PRON tokens (100% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: PronType=Prs (10850; 100%), Person=3 (10131; 93%), Number=Sing (9002; 83%), Gender=Masc (6639; 61%).
PRON tokens may have the following values of Case:
Acc(2589; 24% of non-emptyCase): ه، ها، هم، نا، ني، ك، هما، هن، كمGen(7425; 68% of non-emptyCase): ها، ه، هم، نا، هما، ك، ي، كم، هن، كماNom(863; 8% of non-emptyCase): هو، هي، هم، نحن، هى، هما، أنا، أنت، انتم، هن
| Paradigm هُوَ | Nom | Acc | Gen |
|---|---|---|---|
| Gender=Masc|Number=Sing|Person=1|PronType=Prs | أنا, انا | ني | ي, ني |
| Gender=Masc|Number=Sing|Person=2|PronType=Prs | أنت | ك | ك |
| Gender=Masc|Number=Sing|Person=3|PronType=Prs | هو | ه | ه, إدانته, استعداداته, انتشاره, بلاده, تجهيزه, حكومته, زنزانته, طائرته, لاراضيه, مستقبله, والده, وغربه |
| Gender=Masc|Number=Dual|Person=2|PronType=Prs | كما | ||
| Gender=Masc|Number=Dual|Person=3|PronType=Prs | هما | هما | هما |
| Gender=Masc|Number=Plur|Person=1|PronType=Prs | نحن | نا | نا, لمساعدتنا |
| Gender=Masc|Number=Plur|Person=2|PronType=Int | كم | كم | |
| Gender=Masc|Number=Plur|Person=2|PronType=Prs | انتم, أنتم | ||
| Gender=Masc|Number=Plur|Person=3|PronType=Prs | هم | هم | هم, استبعادهم, بأنفسهم, بلادهم, بهم, شفائهم, لهم |
| Gender=Fem|Number=Sing|Person=2|PronType=Prs | ك | ||
| Gender=Fem|Number=Sing|Person=3|PronType=Prs | هي, هى, وهي | ها | ها, أعضائها, أهدافها, إليها, بضمانها, بفقدانها, بهويتها, تجارتها, تجميدها, تخصيصها, مستشفياتها, مواجهتها, نهايتها |
| Gender=Fem|Number=Dual|Person=3|PronType=Prs | هما | هما | هما |
| Gender=Fem|Number=Plur|Person=3|PronType=Prs | هن | هن | هن |
ADP
6005 ADP tokens (14% of all ADP tokens) have a non-empty value of Case.
The most frequent other feature values with which ADP and Case co-occurred: AdpType=Prep (6005; 100%).
ADP tokens may have the following values of Case:
Acc(5377; 90% of non-emptyCase): مع، بين، خلال، بعد، حول، قبل، ضد، أمام، نحو، مقابلGen(571; 10% of non-emptyCase): خلال، دون، نحو، بين، حين، حسب، مثل، مقابل، قبل، خارجNom(57; 1% of non-emptyCase): بعد، مثل، أمام، قبل، مع، مقابلEMPTY(36550): في، ل، ب، من، على، الى، إلى، عن، فى، علي
| Paradigm بَعدَ | Nom | Acc | Gen |
|---|---|---|---|
| بعد | بعد | بعد |
DET
4670 DET tokens (79% of all DET tokens) have a non-empty value of Case.
The most frequent other feature values with which DET and Case co-occurred: Number=Sing (4384; 94%), PronType=Rel (2532; 54%), Gender=Fem (2417; 52%).
DET tokens may have the following values of Case:
Acc(702; 15% of non-emptyCase): التي، هذا، هذه، الذي، ذلك، التى، الذين، تلك، الذى، هؤلاءGen(3107; 67% of non-emptyCase): التي، هذه، الذي، هذا، ذلك، الذين، التى، هٰذه، هٰذا، ذٰلكNom(861; 18% of non-emptyCase): الذي، التي، هذا، هذه، ذٰلك، هٰذا، ذلك، الذين، تلك، التىEMPTY(1226): ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
| Paradigm اَلَّذِي | Nom | Acc | Gen |
|---|---|---|---|
| Gender=Masc|Number=Sing | الذي, الذى | الذي, الذى | الذي, الذى |
| Gender=Masc|Number=Dual | اللذان | اللذين | اللذين |
| Gender=Masc|Number=Plur | الذين | الذين | الذين |
| Gender=Fem|Number=Sing | التي, التى | التي, التى | التي, التى |
| Gender=Fem|Number=Dual | اللتان | اللتين | اللتين |
| Gender=Fem|Number=Plur | اللواتي, اللاتى, اللاتي |
NUM
2208 NUM tokens (28% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: NumForm=Word (2208; 100%), Definite=Cons (1519; 69%), Number=Sing (1155; 52%).
NUM tokens may have the following values of Case:
Acc(831; 38% of non-emptyCase): مليون، ألف، مليار، بليون، الف، ثلاثة، مليوناً، ملياراً، خمسة، مليوناGen(1234; 56% of non-emptyCase): مليون، مليار، ملايين، المئة، ثلاثة، المائة، ألف، بليون، آلاف، الفNom(143; 6% of non-emptyCase): ثلاثة، خمسة، ثلاث، عشرة، اثنان، الثلاثة، ستة، عشرات، واحد، أربعةEMPTY(5550): 15، 3، 6، 2، 8، 7، 4، 11، 10، 12
| Paradigm مِليُون | Nom | Acc | Gen |
|---|---|---|---|
| Definite=Cons|Number=Sing | مليون | مليون, ملـيون | مليون |
| Definite=Cons|Number=Dual | مليونا | مليوني | مليوني |
| Definite=Cons|Number=Plur | ملايين | ملايين | ملايين |
| Definite=Def|Number=Sing | المليون | المليون | |
| Definite=Def|Number=Plur | الملايين | الملايين | |
| Definite=Ind|Number=Sing | مليوناً, مليونا | مليون, ملــيون | |
| Definite=Ind|Number=Plur | ملايين | ||
| Number=Sing|Polarity=Neg | مليون |
PROPN
3 PROPN tokens (1% of all PROPN tokens) have a non-empty value of Case.
PROPN tokens may have the following values of Case:
Gen(3; 100% of non-emptyCase): العمارة، اللطيفية، بدرEMPTY(242): بن، عبدالله، عبدالعزيز، طه، بورسعيد، أبو، النروج، عبدالمنعم، يومبلغاز، أبوردينة
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[nmod]–> NOUN (28814; 69%),
NOUN –[amod]–> ADJ (21874; 99%),
NOUN –[conj]–> NOUN (5270; 91%),
NOUN –[nmod]–> PRON (3636; 63%),
NOUN –[det]–> DET (1707; 99%),
ADJ –[nmod]–> NOUN (1195; 58%),
ADJ –[conj]–> ADJ (841; 94%),
NOUN –[appos]–> NOUN (344; 90%),
ADJ –[amod]–> ADJ (233; 97%),
NOUN –[nsubj]–> PRON (194; 68%).