X

This is part of archived UD v1 documentation. See http://universaldependencies.org/ for the current version.

home ar/pos issue tracker

`X`: other

This document is a placeholder for the language-specific documentation for X.

Treebank Statistics (UD_Arabic)

There are 7839 X lemmas (46%), 7900 X types (27%) and 22298 X tokens (8%). Out of 16 observed tags, the rank of X is: 1 in number of lemmas, 2 in number of types and 6 in number of tokens.

The 10 most frequent X lemmas: ب، محمد، اف، وَاشِنطُن، عبد، وذلك، مبارك، سُورِيَا، أَفرِيقِيَا، شَارُون

The 10 most frequent X types: ب، اف، محمد، واشنطن، عبد، وذلك، مبارك، سوريا، شارون، السارس

The 10 most frequent ambiguous lemmas: أَ (X 48, PART 10), ر (PUNCT 22, X 20), آل (X 18, VERB 2, NOUN 1), أَي (CONJ 38, X 13), إِن (CONJ 20, X 13), تَلّ (X 13, NOUN 1), رَام (X 6, VERB 1), فِي (ADP 8751, X 4), آن (NOUN 141, X 3)

The 10 most frequent ambiguous types: ب (ADP 5831, X 205), محمد (X 136, NOUN 34), عبد (X 104, NOUN 28), مبارك (X 99, NOUN 12), أفريقيا (X 87, NOUN 1, ADJ 1), الله (X 73, NOUN 53), ذلك (PRON 213, X 69, DET 60), علي (ADP 283, X 69, NOUN 5), عرفات (X 67, NOUN 1), الذي (PRON 704, X 65, DET 4)

ب
- ADP 5831: مقتل شخصين و إصابة آخر ب جروح في حرائق في بلغاريا
- X 205: و في 12 حزيران / يونيو نشرت الحكومة لائحة ب 804 مزارع بغية نزع الملكية عن ها في حين تم احتلال اكثر من 1600 مزرعة .
محمد
- X 136: محمد صلاح - حازم محمد
- NOUN 34: محمد الأشهب
عبد
- X 104: عبد العليم أن ه لا يستبعد ه ب النسبة ل العقلية الإسرائيلية .
- NOUN 28: الا ان تغييرا حصل في وزارة المالية التي س يتولى ها عبد اللطيف بن اشنهو بدلا من محمد ترباش .
مبارك
- X 99: تقليص نشاطات مبارك ب سبب الأزمة الصحية
- NOUN 12: وعكة مبارك تعجل ب قرار تعيين نائب الرئيس
أفريقيا
- X 87: السعودية و جنوب أفريقيا توقعان مذكرة تفاهم في مجال الدفاع
- NOUN 1: و قال إن تلك الجهود اقتضت من مصر استكمال البنية التشريعية التي تتوافق مع كل المعايير الدولية التي اقتضت إصدار تشريع مستقل و لائحة تنفيذية أكدت المنظمات الدولية أن ها أفضل اللوائح التنفيذية على مستوى العالم ، كما اقتضت تلك الجهود إصدار ضوابط رقابية ل كافة المؤسسات المالية ، و أضاف المستشار صيام أن المرحلة الماضية اقتضت أن تعد مصر الخطة التنفيذية ل وضع البنية التشريعية موضع التنفيذ ، و أخيرا قامت اللجنة المنبثقة عن المنظمة المعنية ب الشرق الأوسط و شمال أفريقيا ب زيارة ل مصر في بداية الشهر الحالي شملت وحدة مكافحة غسل الأموال و البنك المركزي المصري و عددا من المؤسسات المالية و السلطة الرقابية و الهيئات الرقابية العامة ، أعدت بعد ها تقرير ها الأخير و أوضح المستشار صيام أن قرار المنظمة الدولية سوف يدعم علاقات مصر الاقتصادية مع كافة الدول الـ 32 الأعضاء في المنظمة الدولية فضلاً عن علاقة ها مع المنظمات الدولية المالية .
- ADJ 1: و لم يعد يتقبل اللاعبون انتقاد تسوبيل ل هم خصوصا بعدما غلبت العصبية على تصرفات ه و كانت سببا في توقيع العقوبات علي ه محليا و أفريقيا اكثر من مرة .
الله
- X 73: إسرائيل : حزب الله “ قد يخطف جنوداً و س يكون ردنا ردنا عملية داخل سورية
- NOUN 53: حزب الله : العراقيون ليسوا ب حاجة لمساعدتنا لمساعدتنا لمساعدتنا
ذلك
- PRON 213: ماذا لو تحقق ذلك ؟ . .
- X 69: أعلن ذلك الدكتور مصطفى أحمد المستشار ب المعهد .
- DET 60: لعل ما حدث يوم 19 / 11 الحالي يعد صورة واضحة ل كل ذلك . .
علي
- ADP 283: و علق علي ه ب قول ه “ كان خطابا عظيما “ .
- X 69: الرئيس بن علي يوقع أمرا ب تنظيم الحياة المدرسية
- NOUN 5: و تضم هذه الحكومة 28 وزيرا و عشرة وزراء منتدبين ، مثل تلك التي سبقت ها و كان يرأس ها علي بن فليس الذي أقال ه الرئيس عبد العزيز بوتفليقة وسط خلافات بين الرجلين بشان بشان الانتخابات الرئاسية المقرر اجراؤها اجراؤها في ربيع 2004 .
عرفات
- X 67: عرفات يهنىء بشار الاسد ب انتخاب ه رئيسا لسوريا لسوريا
- NOUN 1: رئيس اندونيسيا يلتقي بيريز قبل وصول عرفات
الذي
- PRON 704: * ما هو الوقت الذي س تستغرق ه هذه المحاكمات ؟
- X 65: “ ونور ونور المحامي “ الفصيح الذي لا يهزه يهزه هوس او فحيح .
- DET 4: و تابع أن 70 % من حجم الواردات المصرية خلال العام الماضي و البالغة نحو 13.9 مليار دولار جاءت من دول ارتفعت أسعار عملة ها أمام الدولار ب نسبة لا تقل عن 20 % الأمر الذي كلف الاقتصاد المصري أعباء إضافية تجاوزت ملياري دولار .

Morphology

The form / lemma ratio of X is 1.007782 (the average of all parts of speech is 1.685612).

The 1st highest number of forms (4) was observed with the lemma “أَي”: أى, أي, اى, اي.

The 2nd highest number of forms (3) was observed with the lemma “آبَاد”: آباد, أباد, اباد.

The 3rd highest number of forms (3) was observed with the lemma “آسِيَا”: آسيا, أسيا, اسيا.

X occurs with 2 features: Foreign (5095; 23% instances), Abbr (501; 2% instances)

X occurs with 2 feature-value pairs: Abbr=Yes, Foreign=Foreign

X occurs with 3 feature combinations. The most frequent feature combination is _ (16702 tokens). Examples: محمد، اف، عبد، وذلك، مبارك، الله، ذلك، علي، عرفات، الذي

Relations

X nodes are attached to their parents using 24 different relations: nmod (11266; 51% instances), nsubj (2449; 11% instances), conj (1641; 7% instances), cc (1574; 7% instances), dobj (1256; 6% instances), advmod (1044; 5% instances), foreign (745; 3% instances), case (596; 3% instances), root (509; 2% instances), dep (426; 2% instances), iobj (147; 1% instances), appos (142; 1% instances), parataxis (100; 0% instances), xcomp (98; 0% instances), mark (90; 0% instances), aux (60; 0% instances), advmod:emph (46; 0% instances), nsubjpass (36; 0% instances), cop (33; 0% instances), mwe (23; 0% instances), acl (7; 0% instances), ccomp (5; 0% instances), advcl (4; 0% instances), csubj (1; 0% instances)

Parents of X nodes belong to 16 different parts of speech: X (8116; 36% instances), NOUN (8045; 36% instances), VERB (4034; 18% instances), ADJ (727; 3% instances), ROOT (509; 2% instances), NUM (387; 2% instances), PROPN (138; 1% instances), CONJ (116; 1% instances), PRON (109; 0% instances), PART (61; 0% instances), ADV (22; 0% instances), ADP (20; 0% instances), DET (9; 0% instances), AUX (2; 0% instances), INTJ (2; 0% instances), PUNCT (1; 0% instances)

11599 (52%) X nodes are leaves.

5267 (24%) X nodes have one child.

2841 (13%) X nodes have two children.

2591 (12%) X nodes have three or more children.

The highest child degree of a X node is 20.

Children of X nodes are attached using 25 different relations: nmod (7253; 34% instances), punct (3413; 16% instances), case (2741; 13% instances), cc (1589; 7% instances), conj (1180; 5% instances), dobj (928; 4% instances), amod (829; 4% instances), foreign (745; 3% instances), dep (652; 3% instances), nsubj (454; 2% instances), acl (293; 1% instances), mark (284; 1% instances), parataxis (242; 1% instances), advmod (214; 1% instances), nummod (137; 1% instances), advmod:emph (87; 0% instances), appos (84; 0% instances), neg (84; 0% instances), ccomp (70; 0% instances), aux (63; 0% instances), xcomp (61; 0% instances), advcl (59; 0% instances), cop (42; 0% instances), mwe (21; 0% instances), csubj (10; 0% instances)

Children of X nodes belong to 15 different parts of speech: X (8116; 38% instances), NOUN (3845; 18% instances), PUNCT (3413; 16% instances), ADP (2165; 10% instances), CONJ (1062; 5% instances), ADJ (1012; 5% instances), VERB (731; 3% instances), NUM (547; 3% instances), PRON (333; 2% instances), PART (148; 1% instances), ADV (67; 0% instances), PROPN (62; 0% instances), SYM (29; 0% instances), AUX (3; 0% instances), INTJ (2; 0% instances)

X in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]

X: other

Treebank Statistics (UD_Arabic)

Morphology

Relations

`X`: other