DET
: determiner
This document is a placeholder for the language-specific documentation
for DET
.
Treebank Statistics (UD_Arabic)
There are 10 DET
lemmas (0%), 29 DET
types (0%) and 1902 DET
tokens (1%).
Out of 16 observed tags, the rank of DET
is: 13 in number of lemmas, 11 in number of types and 11 in number of tokens.
The 10 most frequent DET
lemmas: هٰذَا، مَا، ذٰلِكَ، مَن، اَلَّذِي، ذُو، كَيفَ، كِلَا، لِمَاذَا، مَاذَا
The 10 most frequent DET
types: هذه، هذا، ما، تلك، هٰذه، هٰذا، ذلك، من، هؤلاء، ذٰلك
The 10 most frequent ambiguous lemmas: هٰذَا (DET 1434, PRON 110), مَا (PRON 755, DET 252, PART 67, INTJ 1), ذٰلِكَ (PRON 326, DET 162), مَن (PRON 75, DET 35), اَلَّذِي (PRON 2501, DET 12), ذُو (PRON 6, DET 2), كَيفَ (PRON 18, DET 2), كِلَا (PRON 4, DET 1), لِمَاذَا (PRON 8, DET 1), مَاذَا (PRON 14, DET 1)
The 10 most frequent ambiguous types: هذه (DET 648, X 28, PRON 21), هذا (DET 585, PRON 38, X 34), ما (PRON 755, DET 252, PART 67, X 4, INTJ 1), تلك (DET 93, PRON 8, X 7), هٰذه (DET 82, PRON 7), هٰذا (DET 76, PRON 28), ذلك (PRON 213, X 69, DET 60), من (ADP 5381, PRON 74, DET 35), هؤلاء (DET 26, PRON 15, X 10), ذٰلك (PRON 101, DET 7)
- هذه
- هذا
- ما
- PRON 755: ما الضمانات الإسرائيلية و الأمريكية ل نجاح هذه الهدنة .
- DET 252: مقتل ما لا يقل عن 12 شخصا في مواجهات في احدى اسواق لاغوس
- PART 67: و ما زال سبب اندلاع الحريق و حجم الخسائر الاقتصادية قيد التحقيق .
- X 4: يمكن استنتاج هذه الوعود من ما أعلن ه صدام حسين في تسجيلات ه منذ هروب ه ، ما دام لم يصدر أي بيان يحدد برنامجاً سياسيا ب الانتقام من “ المتخاذلين “ أي من لم يقفوا مع صدام ، و هم غالبية ساحقة في الجنوب و الوسط و كل كردستان .
- INTJ 1: و أضافت : “ لا بد من ان نسأل انفسنا انفسنا في هذا المؤتمر ما هو الاتحاد الذي نتطلع إلي ه ؟ و ما الذي تحتاج إلي ه المرأة في عالمنا عالمنا هذا ؟ و إلى اي اتحاد نحتاج ؟ و هل ورش العمل و اللجان التي س تنبثق من ها ستساعدنا ستساعدنا ستساعدنا على تحديد حاجاتنا حاجاتنا و فهم التزاماتنا التزاماتنا واعطائها واعطائها واعطائها افقاً فعالا و موسعا “ .
- تلك
- DET 93: و قال ان ايران عارضت استمرار حكم صدام ل العراق ، كما عارضت الحرب على تلك الدولة .
- PRON 8: القوات الأمريكية تكبدت خسائر منذ احتلال العراق تفوق تلك التي منيت ب ها في فيتنام خلال السنة الأولى من الحرب .
- X 7: و من المتوقع ان تساهم تلك الاجابات في تكوين قاعدة معطيات س يتم تحليل ها و متابعة ها لاحقا .
- هٰذه
- هٰذا
- ذلك
- من
- هؤلاء
- ذٰلك
Morphology
The form / lemma ratio of DET
is 2.900000 (the average of all parts of speech is 1.685612).
The 1st highest number of forms (13) was observed with the lemma “هٰذَا”: هؤلاء, هاتان, هاتين, هذا, هذــه, هذه, هذين, هـــذه, هــــذه, هٰؤلاء, هٰذا, هٰذان, هٰذه.
The 2nd highest number of forms (5) was observed with the lemma “ذٰلِكَ”: أولئك, اولئك, تلك, ذلك, ذٰلك.
The 3rd highest number of forms (3) was observed with the lemma “اَلَّذِي”: التي, الذي, الذين.
DET
occurs with 4 features: Case (1611; 85% instances), Gender (1611; 85% instances), Number (1611; 85% instances), PronType (1611; 85% instances)
DET
occurs with 10 feature-value pairs: Case=Acc
, Case=Gen
, Case=Nom
, Gender=Fem
, Gender=Masc
, Number=Dual
, Number=Plur
, Number=Sing
, PronType=Dem
, PronType=Rel
DET
occurs with 22 feature combinations.
The most frequent feature combination is Case=Gen|Gender=Fem|Number=Sing|PronType=Dem
(556 tokens).
Examples: هذه، هٰذه، تلك، هذــه، هـــذه
Relations
DET
nodes are attached to their parents using 9 different relations: det (1842; 97% instances), nmod (35; 2% instances), mark (11; 1% instances), cop (5; 0% instances), aux (4; 0% instances), mwe (2; 0% instances), amod (1; 0% instances), ccomp (1; 0% instances), nsubjpass (1; 0% instances)
Parents of DET
nodes belong to 4 different parts of speech: NOUN (1848; 97% instances), ADJ (42; 2% instances), PRON (7; 0% instances), DET (5; 0% instances)
1596 (84%) DET
nodes are leaves.
141 (7%) DET
nodes have one child.
134 (7%) DET
nodes have two children.
31 (2%) DET
nodes have three or more children.
The highest child degree of a DET
node is 12.
Children of DET
nodes are attached using 18 different relations: acl (192; 37% instances), case (149; 29% instances), nmod (72; 14% instances), nsubj (23; 4% instances), cc (19; 4% instances), punct (17; 3% instances), nummod (14; 3% instances), amod (9; 2% instances), conj (7; 1% instances), advmod (5; 1% instances), dobj (4; 1% instances), advmod:emph (3; 1% instances), mwe (2; 0% instances), aux (1; 0% instances), ccomp (1; 0% instances), cop (1; 0% instances), mark (1; 0% instances), parataxis (1; 0% instances)
Children of DET
nodes belong to 11 different parts of speech: VERB (194; 37% instances), ADP (149; 29% instances), NOUN (69; 13% instances), PRON (35; 7% instances), NUM (17; 3% instances), PUNCT (17; 3% instances), ADJ (12; 2% instances), CONJ (12; 2% instances), X (9; 2% instances), DET (5; 1% instances), PART (2; 0% instances)
DET in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]