Treebank Statistics: UD_Persian-Seraji: POS Tags: AUX
There are 12 AUX lemmas (0%), 191 AUX types (1%) and 5027 AUX tokens (3%).
Out of 15 observed tags, the rank of AUX is: 14 in number of lemmas, 6 in number of types and 9 in number of tokens.
The 10 most frequent AUX lemmas: است، بود، خواست، بایست، توانست، کرد، توان، شد، گشت، داشت
The 10 most frequent AUX types: است، بود، باید، خواهد، باشد، بودند، ست، باشند، بوده، شده
The 10 most frequent ambiguous lemmas: است (AUX 2221, VERB 223, NOUN 1), بود (AUX 1355, VERB 232), خواست (AUX 403, VERB 110, NOUN 7), توانست (AUX 248, VERB 19), کرد (VERB 4342, AUX 225, NOUN 6), توان (AUX 84, NOUN 10), شد (AUX 56, VERB 4), گشت (AUX 43, VERB 21), داشت (VERB 1193, AUX 42), گردید (AUX 16, VERB 1)
The 10 most frequent ambiguous types: است (AUX 2069, VERB 188), بود (AUX 631, VERB 91), باشد (AUX 177, VERB 32), بودند (AUX 139, VERB 20), ست (AUX 116, VERB 30, NOUN 1), باشند (AUX 79, VERB 3), بوده (AUX 77, VERB 31, ADJ 2), شده (VERB 367, AUX 71), میتواند (AUX 58, VERB 2), میشود (VERB 357, AUX 49)
- است
- بود
- باشد
- بودند
- ست
- AUX 116: امام حسین ) ع ( پاسخی به معاویه داد که پاسخ او طلایه انقلاب عاشورا ست .
- VERB 30: به امام حسین ) ع ( گفته بود رهبری آن چهار نفر دیگر بر عهده تو ست .
- NOUN 1: این ترمیم که به منظور شفاف و سفید کردن مجسمهها که با اصل خود شباهت داشته باشند در گالری جدیدی که توسط لرد داوین و به پیشنهاد تاریخنویس مشهور ویلیام ست کلیر ترتیب داده شده بود ، انجام شد .
- باشند
- بوده
- AUX 77: نظامی میگوید : زادگاه فردوسی باژ بوده است .
- VERB 31: گفت : ضعف در کار هیئت نظارت بوده است بعضی جاها دقت لازم را نداشتهاند .
- ADJ 2: این استل سنگی که اندازه آن به بیش از یک متر میرسد ، متعلق به قرن هشتم پیش از میلاد بوده و شرح لشکرکشی سارگون دوم را به سرزمینهای دیگر از جمله سرزمین ماد بیان میکند .
- شده
- میتواند
- میشود
Morphology
The form / lemma ratio of AUX is 15.916667 (the average of all parts of speech is 1.372220).
The 1st highest number of forms (38) was observed with the lemma “توانست”: بتوان, بتواند, بتوانم, بتوانند, بتوانیم, توانست, توانستند, توانستهاند, توانستید, میتواند, میتوانست, میتوانستم, میتوانستیم, میتوانم, میتوانند, میتوانی, میتوانید, میتوانیم, میتونم, میتونیم, نتوان, نتوانست, نتوانستم, نتوانستند, نتوانسته, نتوانستهاند, نتوانند, نتونستم, نمیتواند, نمیتوانست, نمیتوانستند, نمیتوانسته, نمیتوانستیم, نمیتوانم, نمیتوانند, نمیتوانی, نمیتوانید, نمیتوانیم.
The 2nd highest number of forms (38) was observed with the lemma “خواست”: بخواهد, بخواهم, بخواهند, بخواهی, بخواهیم, خواست, خواستم, خواستند, خواستی, خواستید, خواهد, خواهم, خواهند, خواهی, خواهید, خواهیم, میخواست, میخواستم, میخواستند, میخواسته, میخواستید, میخواستیم, میخواهد, میخواهم, میخواهند, میخواهی, میخواهید, میخواهیم, نخواهد, نخواهم, نخواهند, نخواهی, نخواهیم, نمیخواد, نمیخواستند, نمیخواهد, نمیخواهم, نمیخواهند.
The 3rd highest number of forms (34) was observed with the lemma “بود”: باش, باشد, باشم, باشند, باشه, باشی, باشید, باشیم, بود, بودم, بودند, بوده, بودهام, بودهاند, بودهای, بودهایم, بودید, بودیم, میباشد, میباشم, میباشند, میباشید, نباشد, نباشم, نباشند, نباشید, نبود, نبودم, نبودند, نبوده, نبودیم, نمیباشد, نمیباشند, نمیبود.
AUX occurs with 6 features: Person (4594; 91% instances), Number (4593; 91% instances), Tense (4379; 87% instances), VerbForm (1324; 26% instances), Mood (787; 16% instances), Polarity (223; 4% instances)
AUX occurs with 15 feature-value pairs: Mood=Imp, Mood=Ind, Mood=Sub, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Neg, Tense=Fut, Tense=Past, Tense=Pres, VerbForm=Fin, VerbForm=Inf, VerbForm=Part
AUX occurs with 67 feature combinations.
The most frequent feature combination is Number=Sing|Person=3|Tense=Pres (2387 tokens).
Examples: است، ست، میتواند، میشود، میباشد، میخواهد، میگردد، ه، نمیشود، میشه
Relations
AUX nodes are attached to their parents using 6 different relations: cop (2469; 49% instances), aux (2282; 45% instances), aux:pass (270; 5% instances), conj (3; 0% instances), acl:relcl (2; 0% instances), ccomp (1; 0% instances)
Parents of AUX nodes belong to 8 different parts of speech: VERB (1954; 39% instances), NOUN (1443; 29% instances), ADJ (1399; 28% instances), PRON (124; 2% instances), ADV (75; 1% instances), NUM (29; 1% instances), AUX (2; 0% instances), DET (1; 0% instances)
4999 (99%) AUX nodes are leaves.
26 (1%) AUX nodes have one child.
0 (0%) AUX nodes have two children.
2 (0%) AUX nodes have three or more children.
The highest child degree of a AUX node is 5.
Children of AUX nodes are attached using 8 different relations: punct (20; 57% instances), conj (4; 11% instances), cc (3; 9% instances), ccomp (2; 6% instances), mark (2; 6% instances), obl (2; 6% instances), advcl (1; 3% instances), obj (1; 3% instances)
Children of AUX nodes belong to 7 different parts of speech: PUNCT (20; 57% instances), VERB (4; 11% instances), CCONJ (3; 9% instances), ADJ (2; 6% instances), AUX (2; 6% instances), PRON (2; 6% instances), SCONJ (2; 6% instances)