Treebank Statistics: UD_Arabic: Features: Case
This feature is universal.
It occurs with 3 different values: Acc
, Gen
, Nom
.
144002 tokens (51%) have a non-empty value of Case
.
15061 types (57%) occur at least once with a non-empty value of Case
.
6378 lemmas (38%) occur at least once with a non-empty value of Case
.
The feature is used with 6 part-of-speech tags: NOUN (92051; 33% instances), ADJ (29221; 10% instances), PRON (9991; 4% instances), ADP (5971; 2% instances), DET (4562; 2% instances), NUM (2206; 1% instances).
NOUN
92051 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (70854; 77%).
NOUN
tokens may have the following values of Case
:
Acc
(14078; 15% of non-emptyCase
): اليوم، يوم، عام، الثلاثاء، السبت، غير، كل، الحكومة، مصر، مساءGen
(66159; 72% of non-emptyCase
): مصر، دولار، العراق، جنيه، مجلس، كل، الحكومة، الدول، الرئيس، مايوNom
(11814; 13% of non-emptyCase
): رئيس، وزير، الدكتور، الحكومة، مصر، الرئيس، عدد، مصادر، التقرير، الولايات
Paradigm يَوم | Nom | Acc | Gen |
---|---|---|---|
Definite=Cons|Number=Sing | يوم | يوم | يوم |
Definite=Cons|Number=Dual | يومي, يومى | ||
Definite=Cons|Number=Plur | أيام | ايام, أيام | أيام |
Definite=Def|Number=Sing | اليوم | اليوم | اليوم |
Definite=Def|Number=Dual | اليومين | ||
Definite=Def|Number=Plur | الايام, الأيام | الأيام, الايام | الايام, الأيام |
Definite=Ind|Number=Sing | يوم | يوما, يوماً | يوم |
Definite=Ind|Number=Dual | يومين | يومين | |
Definite=Ind|Number=Plur | اياما | أيام, ايام |
ADJ
29221 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Number=Sing (27495; 94%), Definite=Def (18902; 65%), Gender=Masc (15039; 51%).
ADJ
tokens may have the following values of Case
:
Acc
(5466; 19% of non-emptyCase
): خاصة، الماضي، حالياً، حاليا، مشيراً، أكثر، المقبل، مشيرا، أي، المتحدةGen
(19101; 65% of non-emptyCase
): المصرية، المتحدة، المصري، العربية، الماضي، الحالي، الفلسطينية، الدولية، أي، جديدةNom
(4654; 16% of non-emptyCase
): المتحدة، المصرية، المصري، العام، كبير، السابق، السوري، أسعد، الاسرائيلي، الدولي
Paradigm مِصرِيّ | Nom | Acc | Gen |
---|---|---|---|
Definite=Cons|Gender=Masc|Number=Sing | مصري | ||
Definite=Def|Gender=Masc|Number=Sing | المصري, المصرى | المصري | المصري, المصرى |
Definite=Def|Gender=Masc|Number=Plur | المصريون | المصريين | المصريين |
Definite=Def|Gender=Fem|Number=Sing | المصرية | المصرية, المصـــرية | المصرية, المصريةـ |
Definite=Def|Gender=Fem|Number=Dual | المصريتين | ||
Definite=Ind|Gender=Masc|Number=Sing | مصري | مصرياً | مصري |
Definite=Ind|Gender=Masc|Number=Dual | مصريين | ||
Definite=Ind|Gender=Masc|Number=Plur | مصريون | مصريين | مصريين |
Definite=Ind|Gender=Fem|Number=Sing | مصرية | مصرية | مصرية |
Definite=Ind|Gender=Fem|Number=Dual | مصريتان | ||
Definite=Ind|Gender=Fem|Number=Plur | مصريات |
PRON
9991 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: PronType=Prs (9991; 100%), Person=3 (9693; 97%), Number=Sing (8642; 86%), Gender=Masc (5866; 59%).
PRON
tokens may have the following values of Case
:
Acc
(2422; 24% of non-emptyCase
): ه، ها، هم، نا، ك، ني، هما، هن، كمGen
(6743; 67% of non-emptyCase
): ها، ه، هم، ك، هما، نا، كم، هن، ي، أعضائهاNom
(826; 8% of non-emptyCase
): هو، هي، هم، هى، نحن، هما، أنت، أنا، انتم، هن
Paradigm هُوَ | Nom | Acc | Gen |
---|---|---|---|
Gender=Masc|Number=Sing|Person=1 | أنا, انا | ني | ي |
Gender=Masc|Number=Sing|Person=2 | أنت | ك | ك |
Gender=Masc|Number=Sing|Person=3 | هو | ه | ه, طائرته, إدانته, لاراضيه, حكومته, بلاده, مستقبله, تجهيزه, انتشاره, زنزانته, استعداداته, والده, وغربه |
Gender=Masc|Number=Dual|Person=3 | هما | هما | هما |
Gender=Masc|Number=Plur|Person=1 | نحن | نا | نا, لمساعدتنا |
Gender=Masc|Number=Plur|Person=2 | انتم, أنتم | كم | كم |
Gender=Masc|Number=Plur|Person=3 | هم | هم | هم, شفائهم, بهم, بأنفسهم, استبعادهم, لهم, بلادهم |
Gender=Fem|Number=Sing|Person=2 | ك | ||
Gender=Fem|Number=Sing|Person=3 | هي, هى, وهي | ها | ها, بضمانها, نهايتها, تجارتها, تجميدها, إليها, بهويتها, مواجهتها, أهدافها, أعضائها, مستشفياتها, بفقدانها, تخصيصها |
Gender=Fem|Number=Dual|Person=3 | هما | هما | هما |
Gender=Fem|Number=Plur|Person=3 | هن | هن | هن |
ADP
5971 ADP tokens (14% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (5971; 100%).
ADP
tokens may have the following values of Case
:
Acc
(5346; 90% of non-emptyCase
): مع، بين، خلال، بعد، حول، قبل، ضد، نحو، مقابل، أمامGen
(570; 10% of non-emptyCase
): خلال، دون، نحو، بين، حين، حسب، مثل، مقابل، قبل، خارجNom
(55; 1% of non-emptyCase
): بعد، مثل، قبل، مقابلEMPTY
(35908): في، ل، ب، من، على، الى، إلى، عن، فى، منذ
Paradigm بَعدَ | Nom | Acc | Gen |
---|---|---|---|
بعد | بعد | بعد |
DET
4562 DET tokens (79% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number=Sing (4281; 94%), PronType=Rel (2513; 55%), Gender=Fem (2397; 53%).
DET
tokens may have the following values of Case
:
Acc
(700; 15% of non-emptyCase
): التي، هذا، هذه، الذي، ذلك، التى، الذين، تلك، الذى، هؤلاءGen
(3096; 68% of non-emptyCase
): التي، هذه، الذي، هذا، ذلك، الذين، التى، هٰذه، هٰذا، ذٰلكNom
(766; 17% of non-emptyCase
): الذي، التي، هذا، هذه، ذٰلك، ذلك، هٰذا، تلك، الذين، التىEMPTY
(1207): ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
Paradigm اَلَّذِي | Nom | Acc | Gen |
---|---|---|---|
Gender=Masc|Number=Sing | الذي, الذى | الذي, الذى | الذي, الذى |
Gender=Masc|Number=Dual | اللذان | اللذين | اللذين |
Gender=Masc|Number=Plur | الذين | الذين | الذين |
Gender=Fem|Number=Sing | التي, التى | التي, التى | التي, التى |
Gender=Fem|Number=Dual | اللتان | اللتين | اللتين |
Gender=Fem|Number=Plur | اللواتي, اللاتى, اللاتي |
NUM
2206 NUM tokens (28% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=Word (2206; 100%), Definite=Cons (1519; 69%), Number=Sing (1155; 52%).
NUM
tokens may have the following values of Case
:
Acc
(831; 38% of non-emptyCase
): مليون، ألف، مليار، بليون، الف، ثلاثة، مليوناً، ملياراً، خمسة، مليوناGen
(1233; 56% of non-emptyCase
): مليون، مليار، ملايين، المئة، ثلاثة، المائة، ألف، بليون، آلاف، الفNom
(142; 6% of non-emptyCase
): ثلاثة، خمسة، ثلاث، عشرة، اثنان، الثلاثة، ستة، عشرات، واحد، اربعةEMPTY
(5550): 15، 3، 6، 2، 8، 7، 4، 11، 10، 12
Paradigm مِليُون | Nom | Acc | Gen |
---|---|---|---|
Definite=Cons|Number=Sing | مليون | مليون, ملـيون | مليون |
Definite=Cons|Number=Dual | مليونا | مليوني | مليوني |
Definite=Cons|Number=Plur | ملايين | ملايين | ملايين |
Definite=Def|Number=Sing | المليون | المليون | |
Definite=Def|Number=Plur | الملايين | الملايين | |
Definite=Ind|Number=Sing | مليوناً, مليونا | مليون, ملــيون | |
Definite=Ind|Number=Plur | ملايين | ||
Number=Sing|Polarity=Neg | مليون |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[nmod]–> NOUN (26173; 71%),
NOUN –[amod]–> ADJ (22129; 97%),
NOUN –[conj]–> NOUN (5137; 97%),
NOUN –[nmod]–> PRON (3153; 66%),
NOUN –[det]–> DET (1729; 87%),
ADJ –[nmod]–> NOUN (1169; 59%),
NOUN –[obl]–> NOUN (1032; 56%),
ADJ –[conj]–> ADJ (831; 98%),
NOUN –[cc]–> NOUN (823; 71%),
NOUN –[obl:arg]–> NOUN (768; 59%).