Treebank Statistics: UD_Persian-Seraji: POS Tags: NOUN
There are 7054 NOUN
lemmas (62%), 9823 NOUN
types (61%) and 57578 NOUN
tokens (38%).
Out of 15 observed tags, the rank of NOUN
is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.
The 10 most frequent NOUN
lemmas: _، کشور، سال، ایران، مردم، کار، روز، قرار، دست، برنامه
The 10 most frequent NOUN
types: ایران، سال، مردم، کشور، روز، کار، قرار، دست، انقلاب، تهران
The 10 most frequent ambiguous lemmas: _ (VERB 1320, NOUN 909, AUX 91, PRON 8, ADV 2), سال (NOUN 429, ADJ 2), کار (NOUN 362, ADJ 1), روز (NOUN 350, ADJ 2), برنامه (NOUN 232, ADJ 2), حال (NOUN 228, ADV 13), انقلاب (NOUN 202, ADJ 1), مورد (NOUN 197, ADP 128), معاویه (NOUN 180, X 1), گروه (NOUN 169, ADJ 4)
The 10 most frequent ambiguous types: روز (NOUN 297, ADJ 2), معاویه (NOUN 180, X 1), امام (NOUN 161, X 1), مورد (NOUN 150, ADP 128), حال (NOUN 141, ADV 13), سر (NOUN 134, ADP 19), هند (NOUN 118, ADJ 1), میان (NOUN 94, ADP 32), علی (NOUN 87, X 5), همراه (NOUN 80, ADP 23, ADJ 1)
- روز
- معاویه
- امام
- مورد
- حال
- سر
- هند
- میان
- علی
- همراه
Morphology
The form / lemma ratio of NOUN
is 1.392543 (the average of all parts of speech is 1.409222).
The 1st highest number of forms (567) was observed with the lemma “_”: آتشبیاران, آتنیها, آثاری, آحاد, آداب, آرمانهای, آزادگان, آزتکها, آزمایشهای, آفتها, آفتکشها, آقایان, آلرژیها, آمدها, آمریکاییها, آموختههای, آموزگاران, آنتنهای, آگهیهای, آیات, آیتمهای, ائمهٔ, ابعاد, اتحادها, اتفاقهای, اتمهای, اثرگذاران, اجانب, اجداد, اجزا, احادیث, احادیثی, اخباری, اختلافات, اختلافاتی, اختلالات, ادیان, ارتفاعات, اسبها, استوانههای, اسرائیلیها, اسلامهای, اسلحه, اسماعیلیان, اسهال, اشرار, اشراری, اشراف, اشعههای, اشکهای, اصحاب, اصطلاحاتی, اصلاحاتی, اصناف, اصول, اطفال, اظهاراتی, اظهارنظرهای, اعلامیههای, اعماق, اعمالی, افسانهها, افسانههای, اقسام, اقشار, الزاماتی, الماسها, امتحانات, امضاکنندگان, املاک, امهات, امواج, امیال, امیدهای, انبیا, انتخابهای, انتقاداتی, انجمنهای, انجمنهای, اندوختههای, اندیشمندان, انگلیسها, اوزان, اوصاف, اولاد, اولیا, اکاذیب, ایثارگران, ایدهها, ایدههای, بازبینها, بازرگانان, بازماندگان, بازیهای, بازیهای, بالغین, بامها, بانوان, بانکها, بانکهای, بخارهای, بدهیهای, براندازان, برخوردهای, بررسیهای, برشهای, برنامهسازها, برگزارکنندگان, برگهای, بعضیها, بقایای, بنیادگراها, بنیانهای, بهترینهای, بیابانها, بیمارانی, بینندگان, بینندگانی, بیچارگانی, بیگانگان, بیکاران, تئاتر, تارهای, تالارهای, تبعات, تبخالهای, تجاوزات, تدابیر, ترجمههای, ترسها, ترورها, تشخیصهای, تشکها, تشکهای, تصمیمگیرندگان, تفاصیل, تفالهها, تقلبهای, تلفات, تلویزیونهای, تماشاگرانی, تمبرها, تمبرهای, تندیسها, تندیسهای, تنشهای, تودههای, توطئهها, توطئههای, تولیدات, تومورهای, توپهای, تکواندوکاران, تیترهای, تیمها, تیمهای, تیپهای, ثروتها, جامعهشناسان, جانداران, جاها, جاهای, جاهایی, جرائم, جرایم, جرزهای, جزوات, جلسات, جملات, جنایات, جنجالها, جنگهای, جنگآوران, جنگهای, جهات, جوایزی, جورهایی, جویندگان, حاسدان, حالات, حاملگیها, حبوبات, حرکات, حرکتهای, حزنها, حسودان, حشرهکشها, حقخواهان, حملات, حوادث, حوادثی, حواس, حوصله, حکیمان, حیلهها, خاماندیشانی, خبرها, خبرهای, خبرهایی, خدمه, خرابههای, خرافاتی, خردمندان, خصال, خصومتها, خطبا, خطمشیها, خلافها, خنیاگران, خوارج, خواستههای, خواستهای, خواهندگان, خونهای, خویشاوندان, خیانتها, خیرخواهان, داروهای, داستانهای, داغها, دانشگاهها, دانشگاههای, دانشآموختگان, دانشآموزان, دانشپژوهان, دختران, دربارهای, دروس, دروغها, دریافتکنندههای, دستان, دستهبندیهای, دستگاهها, دستاندرکاران, دستها, دستهای, دعاها, دفاتر, دفترهای, دقایقی, دلاوران, دهههای, دوروبریها, دوستانی, دولتهای, دوکهای, دکورهای, دیوها, ذخایر, ذرات, رأىدهندگان, راستگرایان, راهبردهای, راهروهای, راهپیماییهای, راهحلهایی, راهها, راههای, راهپیماییهای, راهپیماییها, راوس, رایسهای, رایهای, رزمندگان, رفتنها, رفقای, رمانها, رنجهایی, روبناها, روحانیون, روسها, رومیان, رویابافیهای, رکوردهای, رگهای, زدنهای, زشتکاران, زنانی, زندگیهای, زنها, زیانهای, سازمانها, سازمانهای, سازهای, ساعتهای, سبزهزارها, ستارگان, ستمگران, سدههای, سرخرگهای, سریالها, سریالها, سریالهای, سریالهایی, سریهای, سعایتکنندگان, سلاطینی, سلولها, سلولهای, سلولهای, سمهای, سوژهها, سوژههای, سوژههایی, سکنه, سیاهچالهها, سینماگران, سیگاریها, شاخههای, شاهان, شرارتهای, شرایین, شریانها, شریکان, شعائر, شعرها, شعرهای, شناورها, شوراهای, شوهای, شکات, شکایات, صحراهای, صدماتی, صفات, صفحات, صفحاتی, صفوف, صفویان, صنوفی, صهیونیستها, صهیونیستها, صوفیهای, ضربان, ضعفا, طرق, طواغیت, ظلمات, عابران, عادات, عرایض, عروق, عقلای, علائمی, علاقمندان, علایمی, عنوانهای, عواقب, عوالم, عواملی, غدد, غدههای, غزالان, غلات, غیرسیگاریها, فایلهایی, فرشتگان, فرمهای, فریبهای, فضایل, فضولات, فقرای, فقها, فقیرها, فلسطینیان, فواید, فکرهای, فکین, قاسطین, قبایل, قرضهای, قصهها, قصههای, قصورات, قضات, قطعات, قلبهای, قلکها, قواعد, قوانینی, قوای, قوسها, لاکپشتها, لایههای, لثهها, لجنهای, لحظات, لذایذ, مأموران, مادران, مادرانی, مادرها, مارهای, ماموران, مامورها, مامورین, ماها, مبارزان, مبالغی, مبتلایان, متحدین, متکلمان, مجاهدین, مجتهدان, مجریان, مجلسین, محاسن, محاسنی, محافلی, محاکم, محرمات, مدارس, مدافعات, مذاقها, مذاکراتی, مراجعات, مردمان, مزایا, مزهپرانیهای, مسؤلین, مساجد, مسلکهای, مسوولان, مشتهای, مشروبات, مطرحکنندگان, معابدی, معابر, معالجات, معاندان, معاینات, معدنچیان, معضلات, معضلاتی, معیارهایی, مغولان, مفاصل, مفاهیمی, مقابر, مقدماتی, مقولات, ملودرامهای, ملیگرایان, ممیزیها, منابر, مناسک, مناظر, مناقشات, منشیهای, منویات, مهاجمان, مهدهای, موادی, مواضع, موافقان, مواقع, مواقعی, موانع, موتورپمپهای, موجبات, موجودات, موشها, موکلین, مکاتب, مکانیسمهای, مکملهای, میلهها, میلههای, میهمانان, میوهها, میوههای, میکرب, نابسامانیهای, ناخنهای, نامهای, نتایجی, ندانمکاریهای, نردههای, نسبتها, نصرتهای, نظامهای, نظرسنجیهای, نظرها, نظرهای, نظرهایی, نغمهپردازان, نفرات, نقاط, نقشههای, نقشها, نقصها, نهادهای, نوارهای, نوازندگان, نوزادان, نوشتههای, نویسندگان, نکاتی, نیکوکاران, نیکیها, هموم, همومی, همینها, همینهایی, هورمونهای, هوچیگران, هیدروکربنهای, وابستگان, واقعیتهای, والدین, وظایف, وعاظ, وقتها, ولهها, ولههایی, وکلایی, پاسداران, پاسکاریها, پخشکنندگان, پرتغالیها, پریها, پسماندههای, پشنگههای, پلاتوهای, پناهندگان, پولهای, پیکارها, پیکرههای, پیکها, کاانات, کابوسهایی, کابوسهای, کاروانهای, کارکردهای, کاستیهای, کانالها, کربوهیدراتها, کربوهیدراتها, کردنها, کردها, کرمها, کرمهای, کشتزاران, کشمکشهای, کفشها, کلمات, کلیدهای, کلیشهها, کمونیستها, کودکانِ, کودکها, کوران, کوههای, گردانندگان, گردشگران, گردههای, گروهکهای, گروگانهای, گروگانهای, گفتهها, گوهای, گوهرهای, گویندگان, گیسوان, یاران, یاوهگوییها, یکشنبهها.
The 2nd highest number of forms (8) was observed with the lemma “جناح”: جناح, جناحها, جناحهای, جناحهایی, جناحِ, جناحی, جناحها, جناحهای.
The 3rd highest number of forms (8) was observed with the lemma “حرف”: حرف, حرفها, حرفهای, حرفهایی, حرفی, حرفهای, حرفهای, حروف.
NOUN
occurs with 2 features: Number (57574; 100% instances), Case (4; 0% instances)
NOUN
occurs with 3 feature-value pairs: Case=Voc
, Number=Plur
, Number=Sing
NOUN
occurs with 3 feature combinations.
The most frequent feature combination is Number=Sing
(48926 tokens).
Examples: ایران، سال، مردم، کشور، روز، کار، قرار، دست، انقلاب، تهران
Relations
NOUN
nodes are attached to their parents using 27 different relations: nmod:poss (14668; 25% instances), obl (7885; 14% instances), nmod (7504; 13% instances), nsubj (7348; 13% instances), conj (4801; 8% instances), compound:lvc (4766; 8% instances), obj (3422; 6% instances), flat (3320; 6% instances), root (1013; 2% instances), ccomp (617; 1% instances), appos (543; 1% instances), xcomp (310; 1% instances), dep (283; 0% instances), fixed (257; 0% instances), acl:relcl (239; 0% instances), nsubj:pass (144; 0% instances), compound (109; 0% instances), parataxis (105; 0% instances), advcl (92; 0% instances), vocative (64; 0% instances), dislocated (44; 0% instances), nummod (25; 0% instances), case (8; 0% instances), amod (5; 0% instances), compound:prt (3; 0% instances), mark (2; 0% instances), flat:foreign (1; 0% instances)
Parents of NOUN
nodes belong to 12 different parts of speech: NOUN (29535; 51% instances), VERB (21702; 38% instances), ADJ (3889; 7% instances), (1013; 2% instances), ADV (452; 1% instances), PRON (406; 1% instances), ADP (262; 0% instances), NUM (246; 0% instances), X (48; 0% instances), DET (22; 0% instances), SCONJ (2; 0% instances), INTJ (1; 0% instances)
13998 (24%) NOUN
nodes are leaves.
19236 (33%) NOUN
nodes have one child.
16396 (28%) NOUN
nodes have two children.
7948 (14%) NOUN
nodes have three or more children.
The highest child degree of a NOUN
node is 13.
Children of NOUN
nodes are attached using 35 different relations: case (17350; 21% instances), nmod:poss (16547; 20% instances), amod (9189; 11% instances), punct (5328; 7% instances), nmod (5249; 6% instances), conj (4886; 6% instances), cc (4063; 5% instances), det (3697; 5% instances), flat (3282; 4% instances), nummod (2413; 3% instances), nsubj (1456; 2% instances), acl:relcl (1256; 2% instances), compound (1221; 2% instances), cop (1089; 1% instances), mark (807; 1% instances), advmod (567; 1% instances), appos (528; 1% instances), ccomp (493; 1% instances), compound:lvc (358; 0% instances), aux (321; 0% instances), dep (267; 0% instances), parataxis (175; 0% instances), advcl (162; 0% instances), fixed (145; 0% instances), obj (80; 0% instances), obl (62; 0% instances), det:predet (52; 0% instances), xcomp (45; 0% instances), aux:pass (31; 0% instances), nsubj:pass (23; 0% instances), vocative (16; 0% instances), dislocated (13; 0% instances), nsubj:nc (9; 0% instances), cc:preconj (8; 0% instances), compound:prt (4; 0% instances)
Children of NOUN
nodes belong to 15 different parts of speech: NOUN (29535; 36% instances), ADP (14999; 18% instances), ADJ (9899; 12% instances), PUNCT (5328; 7% instances), CCONJ (4080; 5% instances), DET (3629; 4% instances), PRON (2911; 4% instances), NUM (2707; 3% instances), VERB (2621; 3% instances), PART (2208; 3% instances), AUX (1442; 2% instances), ADV (970; 1% instances), SCONJ (787; 1% instances), X (39; 0% instances), INTJ (37; 0% instances)