Statistics of NUM in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Arabic-PADT: POS Tags: `NUM`

There are 993 NUM lemmas (6%), 1083 NUM types (4%) and 7758 NUM tokens (3%). Out of 17 observed tags, the rank of NUM is: 5 in number of lemmas, 5 in number of types and 9 in number of tokens.

The 10 most frequent NUM lemmas: مِليُون، أَلف، 15، 3، ثَلَاثَة، مِليَار، 6، 2، 8، 7

The 10 most frequent NUM types: مليون، 15، 3، 6، 2، 8، 7، مليار، ألف، 4

The 10 most frequent ambiguous lemmas: اِثنَان (NOUN 58, NUM 44), وَاحِد (ADJ 100, NUM 31), أَحَد (NOUN 199, NUM 1)

The 10 most frequent ambiguous types: مليون (NUM 485, X 48), مليار (NUM 153, X 28), ألف (NUM 143, X 2, VERB 1), بليون (NUM 71, X 1), الف (NUM 62, X 4), عشرة (NUM 49, X 2), عشرين (NUM 31, X 1), اثنين (NUM 29, NOUN 1), الاف (NUM 26, X 4), خمس (NUM 24, X 1)

مليون
- NUM 485: و بلغت قيمة انتقال راباييتش ( 27 عاما ) نحو 5 ر 17 مليون دولار .
- X 48: جدير ب الذكر ان فى الصين اكثر من 65.9 مليون هكتار من الاراضى الرطبة مشكلة 10 ب المئة من اجمالى العالم .
مليار
- NUM 153: 3.2 مليار جنيه استثمارات جديدة ب المدن الجديدة
- X 28: و على مستوى المركز المالي ل بنك التنمية الصناعية ف قد ارتفع إجمالي الأصول المصرفية ب ه في منتصف العام الماضي إلى 2.613 مليار جنيه مقارنة ب نحو 2.186 مليار جنيه في عام 2002 .
ألف
- NUM 143: 40 ألف حالة اختفاء ب مصر أشهر ها الصحافي رضا هلال
- X 2: و تصل قيمة الحج السياحي طبقاً ل هٰذه الزيادة 80 ألف جنيه ل الفاخر ، و 40 ألف ل المتوسط و 25 ألف جنيه ل العادي .
- VERB 1: كما أوقفت المكتبة عرض 5 كتب أخرى ألف ها باحثون و مؤلفون مصريون تتناول في مجمل ها ترجمة عربية ل نص الكتاب الذي قدم ل ه في إحدى النسخ عباس محمود العقاد .
بليون
- NUM 71: مصر : 7،1 بليون دولار كلفة إعادة هيكلة صناعة الغزل والنسيج والنسيج
- X 1: و قال رئيس شعبة المستوردين في اتحاد الغرف التجارية مصطفى زكي لـ » الحياة « إن ما تقول ه الحكومة يختلف عن الواقع تماماً ، ف كل المؤشرات تؤكد ان حجم الاستيراد س ينخفض نهاية السنة ب نحو 5 بلايين دولار عن السابق ( 11 بليون من 16 بليون دولار ) ب سبب الاحداث الجارية ، فيما س تنخفض الصادرات غير البترولية 51 في المئة على الأقل و هي حالياً 4 بلايين دولار ، و كشف أن المستوردين و التجار قرروا فعلياً وقف الاستيراد تماماً من دول العالم حتى نهاية السنة ل درس الموقف و طرح بدائل توازي الخسارة القائمة .
الف
- NUM 62: ميراث ب 300 الف دولار يقلب حياة متشرد اميركي
- X 4: و كانت سيمنز قد قدمت 17 جهاز تنفس و 200 هاتف محمول و قيمة ها الاجمالية 7 ملايين يوان / حوالى 853.7 الف دولار امريكى / ل الحملة ضد السارس فى عموم الصين .
عشرة
- NUM 49: و قال الطبيب ضياء احمد من مستشفى الفلوجة العام “ لدي نا قتيلان و عشرة جرحى “ .
- X 2: و قال مستشار اتحاد الغرف التجارية المصرية عبد الستار عشرة إن ه س يتم خلال الزيارة تحديد موعد المؤتمر القادم ل رجال الأعمال السعوديين و المصريين و الموضوعات التي س يتم طرح ها خلال المؤتمر كما س يقترح الجانب المصري عقد مؤتمر آخر حول الاستثمار المشترك بين البلدين يعقد في السعودية ل إعطاء دفعة ل الاستثمار المشترك بين البلدين ، و شدد عشرة على ضرورة اتباع استراتيجيات طويلة المدى في التعامل مع السوق السعودية و تطوير نظام التقاضي في منازعات الاستثمار و سرعة البت في القضايا .
عشرين
- NUM 31: لبنان رفض عرضا ب عشرين مليار دولار ل توطين الفلسطينيين
- X 1: و كان عرفات زار بعد فشل قمة كامب ديفيد في 25 تموز / يوليو عشرين من دون ان يحظى على ما يبدو ب دعم حاسم ل مشروع اعلان الدولة الفلسطينية .
اثنين
- NUM 29: و تتشكل الحكومة الجديدة من 17 وزيرا و اثنين من كتاب دولة لدى الرئاسة .
- NOUN 1: و س تشتري مجموعة روبرت مردوخ “ نيوز كورب “ ، مجموعة “ كريس - كرافت اندوستريز “ الاميركية و اثنين من فروع ها هما “ بي . اتش . سي كومينيكيشنز “ و “ يونايتد تيلفيجن “ التى تملك عشر محطات اقليمية تلفزيونية ، ب 5،35 مليارات دولار ، كما افاد بيان صدر في نيويورك .
الاف
- NUM 26: الاف المشاركين فى معرض هونغ كونغ ل المستلزمات المنزلية
- X 4: و قال كاروبى ل الصحفيين ان باب مؤخرة الطائرة فتح فجأة على ارتفاع 7 الاف قدم / 2200 متر / فوق مدينة مبوجى - مايى .
خمس
- NUM 24: و اعتبر اخيرا ان قمم رؤساء دول اوبك ينبغي ان تعقد كل اربع او خمس سنوات .
- X 1: الصعود الافرادي : نقلت صحيفة “ كومسومولسكايا برافدا “ عن بوريس بافلوف المسؤول في معهد المشاكل البيولوجية ان “ على متن الغواصة سبل ل الإنقاذ الفردي و هي سترات ل الغوص وقارورات مليئة ب الأوكسجين و الهيليوم . و يخرج البحار من فتحة حجرة حفظ الضغط ( ساس ) او من انبوب الطوربيدات و يصعد الى السطح ك أي غواص . الا أن ه س يعاني من اختلاف الضغط لان عملية الصعود س تستغرق خمس الى ست دقائق و لن تتم في ها مراعاة مراحل تخفيف الانضغاط “ .

Morphology

The form / lemma ratio of NUM is 1.090634 (the average of all parts of speech is 1.761981).

The 1st highest number of forms (16) was observed with the lemma “أَلف”: آلاف, آلافا, ألف, ألفا, ألفاً, ألفي, ألفين, الآلاف, الألف, الاف, الالاف, الف, الفا, الفى, الفي, الفين.

The 2nd highest number of forms (9) was observed with the lemma “أَربَعَة”: أربع, أربعاً, أربعة, اربع, اربعة, الأربع, الأربعة, الاربع, الاربعة.

The 3rd highest number of forms (9) was observed with the lemma “مِليَار”: المليار, المليارات, مليار, مليارا, مليارات, ملياراً, مليارى, ملياري, مليارين.

NUM occurs with 7 features: NumForm (7758; 100% instances), Case (2208; 28% instances), Definite (2207; 28% instances), Number (1442; 19% instances), Gender (702; 9% instances), NumValue (582; 8% instances), Polarity (1; 0% instances)

NUM occurs with 18 feature-value pairs: Case=Acc, Case=Gen, Case=Nom, Definite=Com, Definite=Cons, Definite=Def, Definite=Ind, Gender=Fem, Gender=Masc, NumForm=Digit, NumForm=Word, NumValue=1, NumValue=2, NumValue=3, Number=Dual, Number=Plur, Number=Sing, Polarity=Neg

NUM occurs with 77 feature combinations. The most frequent feature combination is NumForm=Digit (5521 tokens). Examples: 15، 3، 6، 2، 8، 7، 4، 11، 10، 12

Relations

NUM nodes are attached to their parents using 21 different relations: nummod (3048; 39% instances), conj (1014; 13% instances), nmod (861; 11% instances), dep (656; 8% instances), obl (575; 7% instances), obj (517; 7% instances), obl:arg (462; 6% instances), nsubj (272; 4% instances), appos (117; 2% instances), root (117; 2% instances), nsubj:pass (54; 1% instances), orphan (26; 0% instances), dislocated (10; 0% instances), parataxis (10; 0% instances), compound (7; 0% instances), iobj (3; 0% instances), acl (2; 0% instances), advcl (2; 0% instances), advcl:pred (2; 0% instances), ccomp (2; 0% instances), xcomp (1; 0% instances)

Parents of NUM nodes belong to 13 different parts of speech: NUM (2535; 33% instances), NOUN (2393; 31% instances), VERB (1727; 22% instances), X (508; 7% instances), ADJ (300; 4% instances), (117; 2% instances), PRON (79; 1% instances), DET (54; 1% instances), CCONJ (18; 0% instances), ADV (13; 0% instances), ADP (8; 0% instances), PART (4; 0% instances), PROPN (2; 0% instances)

1016 (13%) NUM nodes are leaves.

3512 (45%) NUM nodes have one child.

2084 (27%) NUM nodes have two children.

1146 (15%) NUM nodes have three or more children.

The highest child degree of a NUM node is 15.

Children of NUM nodes are attached using 26 different relations: nmod (4959; 43% instances), case (1781; 15% instances), punct (1566; 13% instances), conj (1019; 9% instances), nummod (937; 8% instances), cc (606; 5% instances), amod (134; 1% instances), nsubj (120; 1% instances), appos (111; 1% instances), acl (100; 1% instances), dep (64; 1% instances), parataxis (50; 0% instances), advmod:emph (42; 0% instances), obl (41; 0% instances), mark (17; 0% instances), cop (14; 0% instances), acl:relcl (9; 0% instances), advcl:pred (9; 0% instances), compound (7; 0% instances), advcl (5; 0% instances), advmod (4; 0% instances), obl:arg (3; 0% instances), orphan (3; 0% instances), aux (2; 0% instances), det (1; 0% instances), dislocated (1; 0% instances)

Children of NUM nodes belong to 16 different parts of speech: NOUN (3687; 32% instances), NUM (2535; 22% instances), ADP (1806; 16% instances), PUNCT (1566; 13% instances), CCONJ (517; 4% instances), ADJ (378; 3% instances), X (364; 3% instances), SYM (346; 3% instances), VERB (162; 1% instances), PRON (106; 1% instances), PART (46; 0% instances), ADV (40; 0% instances), DET (19; 0% instances), AUX (16; 0% instances), SCONJ (15; 0% instances), PROPN (2; 0% instances)

Treebank Statistics: UD_Arabic-PADT: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_Arabic-PADT: POS Tags: `NUM`