Statistics of DET in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Arabic-PADT: POS Tags: `DET`

There are 24 DET lemmas (0%), 54 DET types (0%) and 5896 DET tokens (2%). Out of 17 observed tags, the rank of DET is: 10 in number of lemmas, 9 in number of types and 10 in number of tokens.

The 10 most frequent DET lemmas: اَلَّذِي، هٰذَا، مَا، ذٰلِكَ، مَن، كَيفَ، أَينَ، مَاذَا، كَم، مَتَى

The 10 most frequent DET types: التي، ما، الذي، هذه، هذا، ذلك، الذين، ذٰلك، التى، هٰذا

The 10 most frequent ambiguous lemmas: مَا (DET 1021, AUX 64, PART 3, INTJ 1), ما (DET 4, X 4), هُوَ (PRON 10877, DET 1)

The 10 most frequent ambiguous types: التي (DET 1368, X 54), ما (DET 1025, AUX 64, X 4, PART 3, INTJ 1), الذي (DET 712, X 65), هذه (DET 669, X 28), هذا (DET 623, X 34), ذلك (DET 273, X 69), الذين (DET 185, X 20), التى (DET 156, X 14), من (ADP 5398, DET 109), تلك (DET 101, X 7)

التي
- DET 1368: و كان الأفضل أن يكتفي ب كلمات المجاملة التي تفرض ها بروتوكولات الزيارة .
- X 54: ربما من خلال هذه الرمزية التي لا تخلو من حرقة و رجاء ، كانت خلاصة حديث ه عبارة عن كلمتين : الفرصة و الثقة .
ما
- DET 1025: ما الضمانات الإسرائيلية و الأمريكية ل نجاح هذه الهدنة .
- AUX 64: و ما زال سبب اندلاع الحريق و حجم الخسائر الاقتصادية قيد التحقيق .
- X 4: يمكن استنتاج هذه الوعود من ما أعلن ه صدام حسين في تسجيلات ه منذ هروب ه ، ما دام لم يصدر أي بيان يحدد برنامجاً سياسيا ب الانتقام من “ المتخاذلين “ أي من لم يقفوا مع صدام ، و هم غالبية ساحقة في الجنوب و الوسط و كل كردستان .
- PART 3: ـ صدام حسين و أعضاء النظام السابق أبرياء ما لم تثبت إدانة هم ، و ل هٰذا ل هم الحق ب ارتداء ما يريدون ه في السجن و في المحكمة ، و عندما يصدر قرار القضاة ب سجن هم عند ذاك يرتدون الملابس الخاصة ب السجناء مثل هم مثل بقية السجناء .
- INTJ 1: و أضافت : “ لا بد من ان نسأل أنفس نا في هذا المؤتمر ما هو الاتحاد الذي نتطلع إلي ه ؟ و ما الذي تحتاج إلي ه المرأة في عالم نا هذا ؟ و إلى اي اتحاد نحتاج ؟ و هل ورش العمل و اللجان التي س تنبثق من ها س تساعد نا على تحديد حاجات نا و فهم التزامات نا و إعطاء ها افقاً فعالا و موسعا “ .
الذي
- DET 712: غير ان الشرطة عادت و ألقت القبض على عادل الذي احيل الى المدعي العام .
- X 65: “ و نور المحامي “ الفصيح الذي لا يهز ه هوس او فحيح .
هذه
- DET 669: و لم تؤكد السلطات كما أن ها لم تنف هذه الحصيلة .
- X 28: و مزيد من الهجمات س يجبر هذه القوى على الإسراع في الانسحاب .
هذا
- DET 623: هذا الجهد قائم في هذا الملف و غير ه “ .
- X 34: هذا غريب كنت أعتقد أن ك أسلمت قبل سنوات “ .
ذلك
- DET 273: ماذا لو تحقق ذلك ؟ . .
- X 69: أعلن ذلك الدكتور مصطفى أحمد المستشار ب المعهد .
الذين
- DET 185: بيد أن ه لم يحدد عدد الركاب الذين كانوا على متن الطائرة .
- X 20: أخطأ الذين اعتقدوا أن هجمات 11 سبتمبر طلقة مدوية في حرب بعيدة .
التى
- DET 156: اقلعت الطائرة ، التى تعمل ل حساب شركتى كوريان اير و اير فرانس ، من سول متوجهة إلى باريس .
- X 14: في ما يلى أهم الانباء التى نشرت ها كبريات الصحف الالمانية اليوم .
من
- ADP 5398: و كان من الممكن جدا ان يحصل هجوم لو لم نبدا ب قصف هم “ .
- DET 109: و نريد من يحسب ل نا كم تتكلف هذه العمليات . .
تلك
- DET 101: و قال ان ايران عارضت استمرار حكم صدام ل العراق ، كما عارضت الحرب على تلك الدولة .
- X 7: و من المتوقع ان تساهم تلك الاجابات في تكوين قاعدة معطيات س يتم تحليل ها و متابعة ها لاحقا .

Morphology

The form / lemma ratio of DET is 2.250000 (the average of all parts of speech is 1.761966).

The 1st highest number of forms (13) was observed with the lemma “هٰذَا”: هؤلاء, هاتان, هاتين, هذا, هذــه, هذه, هذين, هـــذه, هــــذه, هٰؤلاء, هٰذا, هٰذان, هٰذه.

The 2nd highest number of forms (12) was observed with the lemma “اَلَّذِي”: التى, التي, الذى, الذي, الذين, اللاتى, اللاتي, اللتان, اللتين, اللذان, اللذين, اللواتي.

The 3rd highest number of forms (6) was observed with the lemma “ذٰلِكَ”: أولئك, أولٰئك, اولئك, تلك, ذلك, ذٰلك.

DET occurs with 5 features: Case (4670; 79% instances), Number (4670; 79% instances), Gender (4668; 79% instances), PronType (4662; 79% instances), Person (13; 0% instances)

DET occurs with 12 feature-value pairs: Case=Acc, Case=Gen, Case=Nom, Gender=Fem, Gender=Masc, Number=Dual, Number=Plur, Number=Sing, Person=1, Person=3, PronType=Dem, PronType=Rel

DET occurs with 36 feature combinations. The most frequent feature combination is _ (1221 tokens). Examples: ما، من، كيف، ماذا، كم، أين، متى، لماذا، هكذا، اين

Relations

DET nodes are attached to their parents using 20 different relations: nsubj (2325; 39% instances), det (2147; 36% instances), obl (611; 10% instances), nsubj:pass (218; 4% instances), obl:arg (154; 3% instances), obj (116; 2% instances), conj (101; 2% instances), nmod (56; 1% instances), amod (36; 1% instances), root (28; 0% instances), parataxis (26; 0% instances), fixed (24; 0% instances), appos (18; 0% instances), dep (10; 0% instances), xcomp (9; 0% instances), dislocated (7; 0% instances), iobj (6; 0% instances), orphan (2; 0% instances), acl (1; 0% instances), ccomp (1; 0% instances)

Parents of DET nodes belong to 13 different parts of speech: VERB (3122; 53% instances), NOUN (2312; 39% instances), X (132; 2% instances), ADJ (131; 2% instances), CCONJ (58; 1% instances), DET (41; 1% instances), (28; 0% instances), PART (22; 0% instances), NUM (19; 0% instances), PRON (13; 0% instances), ADV (11; 0% instances), ADP (5; 0% instances), SCONJ (2; 0% instances)

4900 (83%) DET nodes are leaves.

416 (7%) DET nodes have one child.

399 (7%) DET nodes have two children.

181 (3%) DET nodes have three or more children.

The highest child degree of a DET node is 22.

Children of DET nodes are attached using 28 different relations: case (506; 27% instances), acl (491; 26% instances), nmod (159; 8% instances), cc (152; 8% instances), nsubj (127; 7% instances), punct (119; 6% instances), obl (69; 4% instances), mark (47; 2% instances), advcl (37; 2% instances), conj (26; 1% instances), fixed (25; 1% instances), dep (20; 1% instances), nummod (20; 1% instances), amod (15; 1% instances), parataxis (15; 1% instances), obl:arg (13; 1% instances), advmod:emph (11; 1% instances), acl:relcl (7; 0% instances), cop (5; 0% instances), appos (3; 0% instances), aux (3; 0% instances), csubj (3; 0% instances), det (3; 0% instances), dislocated (3; 0% instances), xcomp (3; 0% instances), orphan (2; 0% instances), advmod (1; 0% instances), ccomp (1; 0% instances)

Children of DET nodes belong to 15 different parts of speech: VERB (553; 29% instances), ADP (499; 26% instances), NOUN (245; 13% instances), CCONJ (205; 11% instances), PUNCT (119; 6% instances), PRON (82; 4% instances), DET (41; 2% instances), NUM (36; 2% instances), X (30; 2% instances), ADJ (27; 1% instances), SCONJ (23; 1% instances), PART (9; 0% instances), ADV (8; 0% instances), AUX (8; 0% instances), INTJ (1; 0% instances)

Treebank Statistics: UD_Arabic-PADT: POS Tags: DET

Morphology

Relations

Treebank Statistics: UD_Arabic-PADT: POS Tags: `DET`