Treebank Statistics: UD_Arabic: POS Tags: X
There are 7839 X
lemmas (46%), 7900 X
types (27%) and 22298 X
tokens (8%).
Out of 16 observed tags, the rank of X
is: 1 in number of lemmas, 2 in number of types and 6 in number of tokens.
The 10 most frequent X
lemmas: ب، محمد، اف، وَاشِنطُن، عبد، وذلك، مبارك، سُورِيَا، أَفرِيقِيَا، شَارُون
The 10 most frequent X
types: ب، اف، محمد، واشنطن، عبد، وذلك، مبارك، سوريا، شارون، السارس
The 10 most frequent ambiguous lemmas: أَ (X 48, PART 10), ر (PUNCT 22, X 20), آل (X 18, VERB 2, NOUN 1), أَي (CCONJ 38, X 13), إِن (CCONJ 20, X 13), تَلّ (X 13, NOUN 1), رَام (X 6, VERB 1), فِي (ADP 8751, X 4), آن (NOUN 141, X 3)
The 10 most frequent ambiguous types: ب (ADP 5831, X 205), محمد (X 136, NOUN 34), عبد (X 104, NOUN 28), مبارك (X 99, NOUN 12), أفريقيا (X 87, ADJ 1, NOUN 1), الله (X 73, NOUN 53), ذلك (DET 273, X 69), علي (ADP 283, X 69, NOUN 5), عرفات (X 67, NOUN 1), الذي (DET 708, X 65)
- ب
- محمد
- عبد
- مبارك
- أفريقيا
- X 87: السعودية و جنوب أفريقيا توقعان مذكرة تفاهم في مجال الدفاع
- ADJ 1: و لم يعد يتقبل اللاعبون انتقاد تسوبيل ل هم خصوصا بعدما غلبت العصبية على تصرفات ه و كانت سببا في توقيع العقوبات علي ه محليا و أفريقيا اكثر من مرة .
- NOUN 1: و قال إن تلك الجهود اقتضت من مصر استكمال البنية التشريعية التي تتوافق مع كل المعايير الدولية التي اقتضت إصدار تشريع مستقل و لائحة تنفيذية أكدت المنظمات الدولية أن ها أفضل اللوائح التنفيذية على مستوى العالم ، كما اقتضت تلك الجهود إصدار ضوابط رقابية ل كافة المؤسسات المالية ، و أضاف المستشار صيام أن المرحلة الماضية اقتضت أن تعد مصر الخطة التنفيذية ل وضع البنية التشريعية موضع التنفيذ ، و أخيرا قامت اللجنة المنبثقة عن المنظمة المعنية ب الشرق الأوسط و شمال أفريقيا ب زيارة ل مصر في بداية الشهر الحالي شملت وحدة مكافحة غسل الأموال و البنك المركزي المصري و عددا من المؤسسات المالية و السلطة الرقابية و الهيئات الرقابية العامة ، أعدت بعد ها تقرير ها الأخير و أوضح المستشار صيام أن قرار المنظمة الدولية سوف يدعم علاقات مصر الاقتصادية مع كافة الدول الـ 32 الأعضاء في المنظمة الدولية فضلاً عن علاقة ها مع المنظمات الدولية المالية .
- الله
- ذلك
- علي
- ADP 283: و علق علي ه ب قول ه “ كان خطابا عظيما “ .
- X 69: الرئيس بن علي يوقع أمرا ب تنظيم الحياة المدرسية
- NOUN 5: و تضم هذه الحكومة 28 وزيرا و عشرة وزراء منتدبين ، مثل تلك التي سبقت ها و كان يرأس ها علي بن فليس الذي أقال ه الرئيس عبد العزيز بوتفليقة وسط خلافات بين الرجلين بشان بشان الانتخابات الرئاسية المقرر اجراؤها اجراؤها في ربيع 2004 .
- عرفات
- الذي
Morphology
The form / lemma ratio of X
is 1.007782 (the average of all parts of speech is 1.685281).
The 1st highest number of forms (4) was observed with the lemma “أَي”: أى, أي, اى, اي.
The 2nd highest number of forms (3) was observed with the lemma “آبَاد”: آباد, أباد, اباد.
The 3rd highest number of forms (3) was observed with the lemma “آسِيَا”: آسيا, أسيا, اسيا.
X
occurs with 2 features: Foreign (5095; 23% instances), Abbr (501; 2% instances)
X
occurs with 2 feature-value pairs: Abbr=Yes
, Foreign=Yes
X
occurs with 3 feature combinations.
The most frequent feature combination is _
(16702 tokens).
Examples: محمد، اف، عبد، وذلك، مبارك، الله، ذلك، علي، عرفات، الذي
Relations
X
nodes are attached to their parents using 27 different relations: nmod (11266; 51% instances), nsubj (2449; 11% instances), conj (1595; 7% instances), cc (1574; 7% instances), advmod (1044; 5% instances), obj (799; 4% instances), flat:foreign (745; 3% instances), case (596; 3% instances), obl:arg (548; 2% instances), root (509; 2% instances), dep (420; 2% instances), appos (142; 1% instances), parataxis (100; 0% instances), xcomp (98; 0% instances), mark (90; 0% instances), aux (60; 0% instances), iobj (56; 0% instances), orphan (51; 0% instances), advmod:emph (46; 0% instances), nsubj:pass (36; 0% instances), cop (33; 0% instances), fixed (23; 0% instances), acl (7; 0% instances), ccomp (5; 0% instances), advcl (4; 0% instances), csubj (1; 0% instances), obl (1; 0% instances)
Parents of X
nodes belong to 16 different parts of speech: X (8717; 39% instances), NOUN (7603; 34% instances), VERB (3937; 18% instances), ADJ (663; 3% instances), (509; 2% instances), NUM (383; 2% instances), PROPN (139; 1% instances), CCONJ (116; 1% instances), PRON (67; 0% instances), PART (60; 0% instances), DET (56; 0% instances), ADP (24; 0% instances), ADV (19; 0% instances), AUX (2; 0% instances), INTJ (2; 0% instances), PUNCT (1; 0% instances)
11000 (49%) X
nodes are leaves.
5526 (25%) X
nodes have one child.
3141 (14%) X
nodes have two children.
2631 (12%) X
nodes have three or more children.
The highest child degree of a X
node is 26.
Children of X
nodes are attached using 28 different relations: nmod (6761; 31% instances), punct (3431; 16% instances), case (2741; 12% instances), cc (1921; 9% instances), conj (1183; 5% instances), amod (829; 4% instances), flat:foreign (745; 3% instances), dep (643; 3% instances), obj (529; 2% instances), obl (520; 2% instances), nsubj (503; 2% instances), obl:arg (399; 2% instances), acl (293; 1% instances), mark (284; 1% instances), parataxis (242; 1% instances), advmod (229; 1% instances), nummod (137; 1% instances), advmod:emph (87; 0% instances), appos (84; 0% instances), ccomp (70; 0% instances), aux (63; 0% instances), xcomp (61; 0% instances), advcl (59; 0% instances), orphan (45; 0% instances), cop (42; 0% instances), det (41; 0% instances), fixed (21; 0% instances), csubj (10; 0% instances)
Children of X
nodes belong to 16 different parts of speech: X (8717; 40% instances), NOUN (3862; 18% instances), PUNCT (3431; 16% instances), ADP (2166; 10% instances), ADJ (1012; 5% instances), CCONJ (871; 4% instances), VERB (701; 3% instances), NUM (547; 2% instances), PRON (171; 1% instances), DET (153; 1% instances), PART (152; 1% instances), ADV (69; 0% instances), PROPN (62; 0% instances), AUX (32; 0% instances), SYM (25; 0% instances), INTJ (2; 0% instances)