Treebank Statistics: UD_Arabic-PADT: POS Tags: DET
There are 24 DET
lemmas (0%), 54 DET
types (0%) and 5896 DET
tokens (2%).
Out of 17 observed tags, the rank of DET
is: 10 in number of lemmas, 9 in number of types and 10 in number of tokens.
The 10 most frequent DET
lemmas: اَلَّذِي، هٰذَا، مَا، ذٰلِكَ، مَن، كَيفَ، أَينَ، مَاذَا، كَم، مَتَى
The 10 most frequent DET
types: التي، ما، الذي، هذه، هذا، ذلك، الذين، ذٰلك، التى، هٰذا
The 10 most frequent ambiguous lemmas: مَا (DET 1021, AUX 64, PART 3, INTJ 1), ما (DET 4, X 4), هُوَ (PRON 10877, DET 1)
The 10 most frequent ambiguous types: التي (DET 1368, X 54), ما (DET 1025, AUX 64, X 4, PART 3, INTJ 1), الذي (DET 712, X 65), هذه (DET 669, X 28), هذا (DET 623, X 34), ذلك (DET 273, X 69), الذين (DET 185, X 20), التى (DET 156, X 14), من (ADP 5398, DET 109), تلك (DET 101, X 7)
- التي
- ما
- DET 1025: ما الضمانات الإسرائيلية و الأمريكية ل نجاح هذه الهدنة .
- AUX 64: و ما زال سبب اندلاع الحريق و حجم الخسائر الاقتصادية قيد التحقيق .
- X 4: يمكن استنتاج هذه الوعود من ما أعلن ه صدام حسين في تسجيلات ه منذ هروب ه ، ما دام لم يصدر أي بيان يحدد برنامجاً سياسيا ب الانتقام من “ المتخاذلين “ أي من لم يقفوا مع صدام ، و هم غالبية ساحقة في الجنوب و الوسط و كل كردستان .
- PART 3: ـ صدام حسين و أعضاء النظام السابق أبرياء ما لم تثبت إدانة هم ، و ل هٰذا ل هم الحق ب ارتداء ما يريدون ه في السجن و في المحكمة ، و عندما يصدر قرار القضاة ب سجن هم عند ذاك يرتدون الملابس الخاصة ب السجناء مثل هم مثل بقية السجناء .
- INTJ 1: و أضافت : “ لا بد من ان نسأل أنفس نا في هذا المؤتمر ما هو الاتحاد الذي نتطلع إلي ه ؟ و ما الذي تحتاج إلي ه المرأة في عالم نا هذا ؟ و إلى اي اتحاد نحتاج ؟ و هل ورش العمل و اللجان التي س تنبثق من ها س تساعد نا على تحديد حاجات نا و فهم التزامات نا و إعطاء ها افقاً فعالا و موسعا “ .
- الذي
- هذه
- هذا
- ذلك
- الذين
- التى
- من
- تلك
Morphology
The form / lemma ratio of DET
is 2.250000 (the average of all parts of speech is 1.761966).
The 1st highest number of forms (13) was observed with the lemma “هٰذَا”: هؤلاء, هاتان, هاتين, هذا, هذــه, هذه, هذين, هـــذه, هــــذه, هٰؤلاء, هٰذا, هٰذان, هٰذه.
The 2nd highest number of forms (12) was observed with the lemma “اَلَّذِي”: التى, التي, الذى, الذي, الذين, اللاتى, اللاتي, اللتان, اللتين, اللذان, اللذين, اللواتي.
The 3rd highest number of forms (6) was observed with the lemma “ذٰلِكَ”: أولئك, أولٰئك, اولئك, تلك, ذلك, ذٰلك.
DET
occurs with 5 features: Case (4670; 79% instances), Number (4670; 79% instances), Gender (4668; 79% instances), PronType (4662; 79% instances), Person (13; 0% instances)
DET
occurs with 12 feature-value pairs: Case=Acc
, Case=Gen
, Case=Nom
, Gender=Fem
, Gender=Masc
, Number=Dual
, Number=Plur
, Number=Sing
, Person=1
, Person=3
, PronType=Dem
, PronType=Rel
DET
occurs with 36 feature combinations.
The most frequent feature combination is _
(1221 tokens).
Examples: ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين
Relations
DET
nodes are attached to their parents using 20 different relations: nsubj (2325; 39% instances), det (2147; 36% instances), obl (612; 10% instances), nsubj:pass (218; 4% instances), obl:arg (154; 3% instances), obj (118; 2% instances), conj (101; 2% instances), nmod (55; 1% instances), amod (36; 1% instances), root (28; 0% instances), parataxis (26; 0% instances), fixed (24; 0% instances), appos (18; 0% instances), dep (10; 0% instances), xcomp (9; 0% instances), dislocated (7; 0% instances), iobj (4; 0% instances), orphan (2; 0% instances), acl (1; 0% instances), ccomp (1; 0% instances)
Parents of DET
nodes belong to 13 different parts of speech: VERB (3123; 53% instances), NOUN (2311; 39% instances), X (132; 2% instances), ADJ (131; 2% instances), CCONJ (58; 1% instances), DET (41; 1% instances), (28; 0% instances), PART (22; 0% instances), NUM (19; 0% instances), PRON (13; 0% instances), ADV (11; 0% instances), ADP (5; 0% instances), SCONJ (2; 0% instances)
4900 (83%) DET
nodes are leaves.
416 (7%) DET
nodes have one child.
399 (7%) DET
nodes have two children.
181 (3%) DET
nodes have three or more children.
The highest child degree of a DET
node is 22.
Children of DET
nodes are attached using 28 different relations: case (506; 27% instances), acl (491; 26% instances), nmod (159; 8% instances), cc (152; 8% instances), nsubj (127; 7% instances), punct (120; 6% instances), obl (69; 4% instances), mark (47; 2% instances), advcl (37; 2% instances), conj (26; 1% instances), fixed (25; 1% instances), dep (20; 1% instances), nummod (20; 1% instances), amod (15; 1% instances), parataxis (15; 1% instances), obl:arg (13; 1% instances), advmod:emph (11; 1% instances), acl:relcl (7; 0% instances), cop (5; 0% instances), appos (3; 0% instances), aux (3; 0% instances), csubj (3; 0% instances), det (3; 0% instances), dislocated (3; 0% instances), xcomp (3; 0% instances), advmod (1; 0% instances), ccomp (1; 0% instances), orphan (1; 0% instances)
Children of DET
nodes belong to 15 different parts of speech: VERB (553; 29% instances), ADP (499; 26% instances), NOUN (244; 13% instances), CCONJ (205; 11% instances), PUNCT (120; 6% instances), PRON (82; 4% instances), DET (41; 2% instances), NUM (36; 2% instances), X (30; 2% instances), ADJ (27; 1% instances), SCONJ (23; 1% instances), PART (9; 0% instances), ADV (8; 0% instances), AUX (8; 0% instances), INTJ (1; 0% instances)