Treebank Statistics: UD_Arabic-PADT: Features: Case
This feature is universal.
It occurs with 3 different values: Acc
, Gen
, Nom
.
146800 tokens (52%) have a non-empty value of Case
.
15350 types (62%) occur at least once with a non-empty value of Case
.
6577 lemmas (43%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (93686; 33% instances), ADJ (29351; 10% instances), PRON (10877; 4% instances), ADP (6005; 2% instances), DET (4670; 2% instances), NUM (2208; 1% instances), PROPN (3; 0% instances).
NOUN
93686 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (72092; 77%).
NOUN
tokens may have the following values of Case
:
Acc
(14121; 15% of non-emptyCase
): اليوم، يوم، عام، الثلاثاء، السبت، غير، كل، الحكومة، مصر، مساءGen
(66788; 71% of non-emptyCase
): مصر، دولار، العراق، جنيه، مجلس، كل، الحكومة، الدول، الرئيس، مايوNom
(12777; 14% of non-emptyCase
): رئيس، وزير، الدكتور، الحكومة، مصر، الرئيس، عدد، مصادر، التقرير، الولاياتEMPTY
(19): أعراض، إعلان، الآفات، الأوتوستراد، الاستحواذ، البعض، التخويف، التعويض، الجغرافيا، الخضروات
Paradigm يَوم | Nom | Acc | Gen |
---|---|---|---|
Definite=Cons|Number=Sing | يوم | يوم | يوم |
Definite=Cons|Number=Dual | يومي, يومى | ||
Definite=Cons|Number=Plur | أيام | ايام, أيام | أيام |
Definite=Def|Number=Sing | اليوم | اليوم | اليوم |
Definite=Def|Number=Dual | اليومين | ||
Definite=Def|Number=Plur | الايام, الأيام | الأيام, الايام | الايام, الأيام |
Definite=Ind|Number=Sing | يوم | يوما, يوماً | يوم |
Definite=Ind|Number=Dual | يومين | يومين | |
Definite=Ind|Number=Plur | اياما | أيام, ايام |
ADJ
29351 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Number=Sing (27614; 94%), Definite=Def (18961; 65%), Gender=Masc (15122; 52%).
ADJ
tokens may have the following values of Case
:
Acc
(5466; 19% of non-emptyCase
): خاصة، الماضي، حالياً، حاليا، مشيراً، أكثر، المقبل، مشيرا، أي، المتحدةGen
(19121; 65% of non-emptyCase
): المصرية، المتحدة، المصري، العربية، الماضي، الحالي، الفلسطينية، الدولية، أي، جديدةNom
(4764; 16% of non-emptyCase
): المتحدة، المصرية، المصري، العام، كبير، السابق، السوري، أسعد، أكثر، الاسرائيلي
Paradigm مِصرِيّ | Nom | Acc | Gen |
---|---|---|---|
Definite=Cons|Gender=Masc|Number=Sing | مصري | ||
Definite=Def|Gender=Masc|Number=Sing | المصري, المصرى | المصري | المصري, المصرى |
Definite=Def|Gender=Masc|Number=Plur | المصريون | المصريين | المصريين |
Definite=Def|Gender=Fem|Number=Sing | المصرية | المصرية, المصـــرية | المصرية, المصريةـ |
Definite=Def|Gender=Fem|Number=Dual | المصريتين | ||
Definite=Ind|Gender=Masc|Number=Sing | مصري | مصرياً | مصري |
Definite=Ind|Gender=Masc|Number=Dual | مصريين | ||
Definite=Ind|Gender=Masc|Number=Plur | مصريون | مصريين | مصريين |
Definite=Ind|Gender=Fem|Number=Sing | مصرية | مصرية | مصرية |
Definite=Ind|Gender=Fem|Number=Dual | مصريتان | ||
Definite=Ind|Gender=Fem|Number=Plur | مصريات |
PRON
10877 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: PronType=Prs (10877; 100%), Person=3 (10131; 93%), Number=Sing (9002; 83%), Gender=Masc (6639; 61%).
PRON
tokens may have the following values of Case
:
Acc
(2589; 24% of non-emptyCase
): ه، ها، هم، نا، ني، ك، هما، هن، كمGen
(7425; 68% of non-emptyCase
): ها، ه، هم، نا، هما، ك، ي، كم، هن، كماNom
(863; 8% of non-emptyCase
): هو، هي، هم، نحن، هى، هما، أنا، أنت، انتم، هن
Paradigm هُوَ | Nom | Acc | Gen |
---|---|---|---|
Gender=Masc|Number=Sing|Person=1 | أنا, انا | ني | ي, ني |
Gender=Masc|Number=Sing|Person=2 | أنت | ك | ك |
Gender=Masc|Number=Sing|Person=3 | هو | ه | ه, إدانته, استعداداته, انتشاره, بلاده, تجهيزه, حكومته, زنزانته, طائرته, لاراضيه, مستقبله, والده, وغربه |
Gender=Masc|Number=Dual|Person=2 | كما | ||
Gender=Masc|Number=Dual|Person=3 | هما | هما | هما |
Gender=Masc|Number=Plur|Person=1 | نحن | نا | نا, لمساعدتنا |
Gender=Masc|Number=Plur|Person=2 | انتم, أنتم | كم | كم |
Gender=Masc|Number=Plur|Person=3 | هم | هم | هم, استبعادهم, بأنفسهم, بلادهم, بهم, شفائهم, لهم |
Gender=Fem|Number=Sing|Person=2 | ك | ||
Gender=Fem|Number=Sing|Person=3 | هي, هى, وهي | ها | ها, أعضائها, أهدافها, إليها, بضمانها, بفقدانها, بهويتها, تجارتها, تجميدها, تخصيصها, مستشفياتها, مواجهتها, نهايتها |
Gender=Fem|Number=Dual|Person=3 | هما | هما | هما |
Gender=Fem|Number=Plur|Person=3 | هن | هن | هن |
ADP
6005 ADP tokens (14% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (6005; 100%).
ADP
tokens may have the following values of Case
:
Acc
(5377; 90% of non-emptyCase
): مع، بين، خلال، بعد، حول، قبل، ضد، أمام، نحو، مقابلGen
(571; 10% of non-emptyCase
): خلال، دون، نحو، بين، حين، حسب، مثل، مقابل، قبل، خارجNom
(57; 1% of non-emptyCase
): بعد، مثل، أمام، قبل، مع، مقابلEMPTY
(36550): في، ل، ب، من، على، الى، إلى، عن، فى، علي
Paradigm بَعدَ | Nom | Acc | Gen |
---|---|---|---|
بعد | بعد | بعد |
DET
4670 DET tokens (79% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number=Sing (4384; 94%), PronType=Rel (2532; 54%), Gender=Fem (2417; 52%).
DET
tokens may have the following values of Case
:
Acc
(702; 15% of non-emptyCase
): التي، هذا، هذه، الذي، ذلك، التى، الذين، تلك، الذى، هؤلاءGen
(3107; 67% of non-emptyCase
): التي، هذه، الذي، هذا، ذلك، الذين، التى، هٰذه، هٰذا، ذٰلكNom
(861; 18% of non-emptyCase
): الذي، التي، هذا، هذه، ذٰلك، هٰذا، ذلك، الذين، تلك، التىEMPTY
(1226): ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
Paradigm اَلَّذِي | Nom | Acc | Gen |
---|---|---|---|
Gender=Masc|Number=Sing | الذي, الذى | الذي, الذى | الذي, الذى |
Gender=Masc|Number=Dual | اللذان | اللذين | اللذين |
Gender=Masc|Number=Plur | الذين | الذين | الذين |
Gender=Fem|Number=Sing | التي, التى | التي, التى | التي, التى |
Gender=Fem|Number=Dual | اللتان | اللتين | اللتين |
Gender=Fem|Number=Plur | اللواتي, اللاتى, اللاتي |
NUM
2208 NUM tokens (28% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=Word (2208; 100%), Definite=Cons (1519; 69%), Number=Sing (1155; 52%).
NUM
tokens may have the following values of Case
:
Acc
(831; 38% of non-emptyCase
): مليون، ألف، مليار، بليون، الف، ثلاثة، مليوناً، ملياراً، خمسة، مليوناGen
(1234; 56% of non-emptyCase
): مليون، مليار، ملايين، المئة، ثلاثة، المائة، ألف، بليون، آلاف، الفNom
(143; 6% of non-emptyCase
): ثلاثة، خمسة، ثلاث، عشرة، اثنان، الثلاثة، ستة، عشرات، واحد، أربعةEMPTY
(5550): 15، 3، 6، 2، 8، 7، 4، 11، 10، 12
Paradigm مِليُون | Nom | Acc | Gen |
---|---|---|---|
Definite=Cons|Number=Sing | مليون | مليون, ملـيون | مليون |
Definite=Cons|Number=Dual | مليونا | مليوني | مليوني |
Definite=Cons|Number=Plur | ملايين | ملايين | ملايين |
Definite=Def|Number=Sing | المليون | المليون | |
Definite=Def|Number=Plur | الملايين | الملايين | |
Definite=Ind|Number=Sing | مليوناً, مليونا | مليون, ملــيون | |
Definite=Ind|Number=Plur | ملايين | ||
Number=Sing|Polarity=Neg | مليون |
PROPN
3 PROPN tokens (1% of all PROPN
tokens) have a non-empty value of Case
.
PROPN
tokens may have the following values of Case
:
Gen
(3; 100% of non-emptyCase
): العمارة، اللطيفية، بدرEMPTY
(242): بن، عبدالله، عبدالعزيز، طه، بورسعيد، أبو، النروج، عبدالمنعم، يومبلغاز، أبوردينة
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[nmod]–> NOUN (26755; 69%),
NOUN –[amod]–> ADJ (22252; 97%),
NOUN –[conj]–> NOUN (5270; 91%),
NOUN –[nmod]–> PRON (3509; 63%),
NOUN –[det]–> DET (1743; 86%),
NOUN –[obl:arg]–> NOUN (1229; 63%),
ADJ –[nmod]–> NOUN (1195; 58%),
NOUN –[obl]–> NOUN (1103; 57%),
ADJ –[conj]–> ADJ (841; 94%),
NOUN –[appos]–> NOUN (344; 90%).