home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Persian-Seraji: POS Tags: NOUN

There are 7054 NOUN lemmas (62%), 9823 NOUN types (61%) and 57578 NOUN tokens (38%). Out of 15 observed tags, the rank of NOUN is: 1 in number of lemmas, 1 in number of types and 1 in number of tokens.

The 10 most frequent NOUN lemmas: _، کشور، سال، ایران، مردم، کار، روز، قرار، دست، برنامه

The 10 most frequent NOUN types: ایران، سال، مردم، کشور، روز، کار، قرار، دست، انقلاب، تهران

The 10 most frequent ambiguous lemmas: _ (VERB 1320, NOUN 909, AUX 91, PRON 8, ADV 2), سال (NOUN 429, ADJ 2), کار (NOUN 362, ADJ 1), روز (NOUN 350, ADJ 2), برنامه (NOUN 232, ADJ 2), حال (NOUN 228, ADV 13), انقلاب (NOUN 202, ADJ 1), مورد (NOUN 197, ADP 128), معاویه (NOUN 180, X 1), گروه (NOUN 169, ADJ 4)

The 10 most frequent ambiguous types: روز (NOUN 297, ADJ 2), معاویه (NOUN 180, X 1), امام (NOUN 161, X 1), مورد (NOUN 150, ADP 128), حال (NOUN 141, ADV 13), سر (NOUN 134, ADP 19), هند (NOUN 118, ADJ 1), میان (NOUN 94, ADP 32), علی (NOUN 87, X 5), همراه (NOUN 80, ADP 23, ADJ 1)

Morphology

The form / lemma ratio of NOUN is 1.392543 (the average of all parts of speech is 1.409222).

The 1st highest number of forms (567) was observed with the lemma “_”: آتش‌بیاران, آتنی‌ها, آثاری, آحاد, آداب, آرمانهای, آزادگان, آزتک‌ها, آزمایش‌های, آفت‌ها, آفت‌کش‌ها, آقایان, آلرژیها, آمدها, آمریکایی‌ها, آموخته‌های, آموزگاران, آنتن‌های, آگهی‌های, آیات, آیتم‌های, ائمهٔ, ابعاد, اتحادها, اتفاقهای, اتم‌های, اثرگذاران, اجانب, اجداد, اجزا, احادیث, احادیثی, اخباری, اختلافات, اختلافاتی, اختلالات, ادیان, ارتفاعات, اسب‌ها, استوانه‌های, اسرائیلی‌ها, اسلام‌های, اسلحه, اسماعیلیان, اسهال, اشرار, اشراری, اشراف, اشعه‌های, اشک‌های, اصحاب, اصطلاحاتی, اصلاحاتی, اصناف, اصول, اطفال, اظهاراتی, اظهارنظرهای, اعلامیه‌های, اعماق, اعمالی, افسانه‌ها, افسانه‌های, اقسام, اقشار, الزاماتی, الماس‌ها, امتحانات, امضاکنندگان, املاک, امهات, امواج, امیال, امیدهای, انبیا, انتخابهای, انتقاداتی, انجمنهای, انجمن‌های, اندوخته‌های, اندیشمندان, انگلیسها, اوزان, اوصاف, اولاد, اولیا, اکاذیب, ایثارگران, ایده‌ها, ایده‌های, بازبینها, بازرگانان, بازماندگان, بازیهای, بازی‌های, بالغین, بام‌ها, بانوان, بانک‌ها, بانک‌های, بخارهای, بدهی‌های, براندازان, برخوردهای, بررسیهای, برش‌های, برنامه‌سازها, برگزار‌کنندگان, برگه‌ای, بعضی‌ها, بقایای, بنیادگراها, بنیان‌های, بهترین‌های, بیابانها, بیمارانی, بینندگان, بینندگانی, بیچارگانی, بیگانگان, بی‌کاران, تئاتر, تارهای, تالارهای, تبعات, تب‌خال‌های, تجاوزات, تدابیر, ترجمه‌های, ترسها, ترورها, تشخیصهای, تشک‌ها, تشک‌های, تصمیم‌گیرندگان, تفاصیل, تفاله‌ها, تقلب‌های, تلفات, تلویزیونهای, تماشاگرانی, تمبرها, تمبرهای, تندیس‌ها, تندیس‌های, تنش‌های, توده‌های, توطئه‌ها, توطئه‌های, تولیدات, تومورهای, توپهای, تکواندوکاران, تیترهای, تیمها, تیمهای, تیپ‌های, ثروتها, جامعه‌شناسان, جانداران, جاها, جاهای, جاهایی, جرائم, جرایم, جرزهای, جزوات, جلسات, جملات, جنایات, جنجالها, جنگهای, جنگ‌آوران, جنگ‌های, جهات, جوایزی, جورهایی, جویندگان, حاسدان, حالات, حاملگی‌ها, حبوبات, حرکات, حرکتهای, حزنها, حسودان, حشره‌کش‌ها, حق‌خواهان, حملات, حوادث, حوادثی, حواس, حوصله‌, حکیمان, حیله‌ها, خام‌اندیشانی, خبرها, خبرهای, خبرهایی, خدمه, خرابه‌های, خرافاتی, خردمندان, خصال, خصومت‌ها, خطبا, خط‌مشی‌ها, خلاف‌ها, خنیاگران, خوارج, خواسته‌های, خواست‌های, خواهندگان, خون‌های, خویشاوندان, خیانتها, خیرخواهان, داروهای, داستانهای, داغ‌ها, دانشگاه‌ها, دانشگاه‌های, دانش‌آموختگان, دانش‌آموزان, دانش‌پژوهان, دختران, دربارهای, دروس, دروغ‌ها, دریافت‌کننده‌های, دستان, دسته‌بندیهای, دستگاه‌ها, دست‌اندرکاران, دست‌ها, دست‌های, دعاها, دفاتر, دفترهای, دقایقی, دلاوران, دهه‌های, دوروبریها, دوستانی, دولت‌های, دوکهای, دکورهای, دیوها, ذخایر, ذرات, رأى‌دهندگان, راست‌گرایان, راهبردهای, راهروهای, راهپیمایی‌های, راه‌حل‌هایی, راه‌ها, راه‌های, راه‌پیماییهای, راه‌پیمایی‌ها, راوس, رایسه‌ای, رای‌های, رزمندگان, رفتن‌ها, رفقای, رمان‌ها, رنجهایی, روبناها, روحانیون, روس‌ها, رومیان, رویابافی‌های, رکوردهای, رگ‌های, زدنهای, زشتکاران, زنانی, زندگیهای, زنها, زیان‌های, سازمانها, سازمان‌های, سازهای, ساعت‌های, سبزه‌زارها, ستارگان, ستمگران, سده‌های, سرخرگ‌های, سریالها, سریال‌ها, سریال‌های, سریال‌هایی, سری‌های, سعایت‌کنندگان, سلاطینی, سلولها, سلولهای, سلول‌های, سم‌های, سوژه‌ها, سوژه‌های, سوژه‌هایی, سکنه, سیاه‌چاله‌ها, سینماگران, سیگاری‌ها, شاخه‌های, شاهان, شرارت‌های, شرایین, شریان‌ها, شریکان, شعائر, شعرها, شعرهای, شناورها, شوراهای, شوهای, شکات, شکایات, صحراهای, صدماتی, صفات, صفحات, صفحاتی, صفوف, صفویان, صنوفی, صهیونیستها, صهیونیست‌ها, صوفیهای, ضربان, ضعفا, طرق, طواغیت, ظلمات, عابران, عادات, عرایض, عروق, عقلای, علائمی, علاقمندان, علایمی, عنوانهای, عواقب, عوالم, عواملی, غدد, غده‌های, غزالان, غلات, غیرسیگاریها, فایل‌هایی, فرشتگان, فرم‌های, فریب‌های, فضایل, فضولات, فقرای, فقها, فقیرها, فلسطینیان, فواید, فکرهای, فکین, قاسطین, قبایل, قرضهای, قصه‌ها, قصه‌های, قصورات, قضات, قطعات, قلبهای, قلکها, قواعد, قوانینی, قوای, قوسها, لاک‌پشت‌ها, لایه‌های, لثه‌ها, لجن‌های, لحظات, لذایذ, مأموران, مادران, مادرانی, مادرها, مارهای, ماموران, مامورها, مامورین, ماها, مبارزان, مبالغی, مبتلایان, متحدین, متکلمان, مجاهدین, مجتهدان, مجریان, مجلسین, محاسن, محاسنی, محافلی, محاکم, محرمات, مدارس, مدافعات, مذاقها, مذاکراتی, مراجعات, مردمان, مزایا, مزه‌پرانیهای, مسؤلین, مساجد, مسلکهای, مسوولان, مشتهای, مشروبات, مطرح‌کنندگان, معابدی, معابر, معالجات, معاندان, معاینات, معدنچیان, معضلات, معضلاتی, معیارهایی, مغولان, مفاصل, مفاهیمی, مقابر, مقدماتی, مقولات, ملودرام‌های, ملی‌گرایان, ممیزیها, منابر, مناسک, مناظر, مناقشات, منشی‌های, منویات, مهاجمان, مهدهای, موادی, مواضع, موافقان, مواقع, مواقعی, موانع, موتور‌پمپ‌های, موجبات, موجودات, موش‌ها, موکلین, مکاتب, مکانیسم‌های, مکملهای, میله‌ها, میله‌های, میهمانان, میوه‌ها, میوه‌های, میکرب, نابسامانی‌های, ناخنهای, نام‌های, نتایجی, ندانم‌کاری‌های, نرده‌های, نسبتها, نصرتهای, نظامهای, نظرسنجی‌های, نظرها, نظرهای, نظرهایی, نغمه‌پردازان, نفرات, نقاط, نقشه‌های, نقش‌ها, نقصها, نهادهای, نوارهای, نوازندگان, نوزادان, نوشته‌های, نویسندگان, نکاتی, نیکوکاران, نیکیها, هموم, همومی, همینها, همینهایی, هورمونهای, هوچی‌گران, هیدروکربن‌های, وابستگان, واقعیت‌های, والدین, وظایف, وعاظ, وقتها, وله‌ها, وله‌هایی, وکلایی, پاسداران, پاسکاریها, پخش‌کنندگان, پرتغالی‌ها, پری‌ها, پس‌مانده‌های, پشنگه‌های, پلاتوهای, پناهندگان, پول‌های, پیکارها, پیکره‌های, پیک‌ها, کاانات, کابوسهایی, کابوس‌های, کاروان‌های, کارکردهای, کاستی‌های, کانال‌ها, کربوهیدراتها, کربوهیدرات‌ها, کردنها, کردها, کرم‌ها, کرم‌های, کشتزاران, کشمکش‌های, کفشها, کلمات, کلیدهای, کلیشه‌ها, کمونیستها, کودکانِ, کودکها, کوران, کوه‌های, گردانندگان, گردشگران, گرده‌های, گروهکهای, گروگانهای, گروگان‌های, گفته‌ها, گوهای, گوهرهای, گویندگان, گیسوان, یاران, یاوه‌گوییها, یکشنبه‌ها.

The 2nd highest number of forms (8) was observed with the lemma “جناح”: جناح, جناحها, جناحهای, جناحهایی, جناحِ, جناحی, جناح‌ها, جناح‌های.

The 3rd highest number of forms (8) was observed with the lemma “حرف”: حرف, حرفها, حرفهای, حرفهایی, حرفی, حرف‌های, حرف‌های‌, حروف.

NOUN occurs with 2 features: Number (57574; 100% instances), Case (4; 0% instances)

NOUN occurs with 3 feature-value pairs: Case=Voc, Number=Plur, Number=Sing

NOUN occurs with 3 feature combinations. The most frequent feature combination is Number=Sing (48926 tokens). Examples: ایران، سال، مردم، کشور، روز، کار، قرار، دست، انقلاب، تهران

Relations

NOUN nodes are attached to their parents using 27 different relations: nmod:poss (14668; 25% instances), obl (7885; 14% instances), nmod (7504; 13% instances), nsubj (7348; 13% instances), conj (4801; 8% instances), compound:lvc (4766; 8% instances), obj (3422; 6% instances), flat (3320; 6% instances), root (1013; 2% instances), ccomp (617; 1% instances), appos (543; 1% instances), xcomp (310; 1% instances), dep (283; 0% instances), fixed (257; 0% instances), acl:relcl (239; 0% instances), nsubj:pass (144; 0% instances), compound (109; 0% instances), parataxis (105; 0% instances), advcl (92; 0% instances), vocative (64; 0% instances), dislocated (44; 0% instances), nummod (25; 0% instances), case (8; 0% instances), amod (5; 0% instances), compound:prt (3; 0% instances), mark (2; 0% instances), flat:foreign (1; 0% instances)

Parents of NOUN nodes belong to 12 different parts of speech: NOUN (29535; 51% instances), VERB (21702; 38% instances), ADJ (3889; 7% instances), (1013; 2% instances), ADV (452; 1% instances), PRON (406; 1% instances), ADP (262; 0% instances), NUM (246; 0% instances), X (48; 0% instances), DET (22; 0% instances), SCONJ (2; 0% instances), INTJ (1; 0% instances)

13998 (24%) NOUN nodes are leaves.

19236 (33%) NOUN nodes have one child.

16396 (28%) NOUN nodes have two children.

7948 (14%) NOUN nodes have three or more children.

The highest child degree of a NOUN node is 13.

Children of NOUN nodes are attached using 35 different relations: case (17350; 21% instances), nmod:poss (16547; 20% instances), amod (9189; 11% instances), punct (5328; 7% instances), nmod (5249; 6% instances), conj (4886; 6% instances), cc (4063; 5% instances), det (3697; 5% instances), flat (3282; 4% instances), nummod (2413; 3% instances), nsubj (1456; 2% instances), acl:relcl (1256; 2% instances), compound (1221; 2% instances), cop (1089; 1% instances), mark (807; 1% instances), advmod (567; 1% instances), appos (528; 1% instances), ccomp (493; 1% instances), compound:lvc (358; 0% instances), aux (321; 0% instances), dep (267; 0% instances), parataxis (175; 0% instances), advcl (162; 0% instances), fixed (145; 0% instances), obj (80; 0% instances), obl (62; 0% instances), det:predet (52; 0% instances), xcomp (45; 0% instances), aux:pass (31; 0% instances), nsubj:pass (23; 0% instances), vocative (16; 0% instances), dislocated (13; 0% instances), nsubj:nc (9; 0% instances), cc:preconj (8; 0% instances), compound:prt (4; 0% instances)

Children of NOUN nodes belong to 15 different parts of speech: NOUN (29535; 36% instances), ADP (14999; 18% instances), ADJ (9899; 12% instances), PUNCT (5328; 7% instances), CCONJ (4080; 5% instances), DET (3629; 4% instances), PRON (2911; 4% instances), NUM (2707; 3% instances), VERB (2621; 3% instances), PART (2208; 3% instances), AUX (1442; 2% instances), ADV (970; 1% instances), SCONJ (787; 1% instances), X (39; 0% instances), INTJ (37; 0% instances)