Treebank Statistics: UD_Persian-Seraji: POS Tags: AUX
There are 11 AUX
lemmas (0%), 194 AUX
types (1%) and 5028 AUX
tokens (3%).
Out of 15 observed tags, the rank of AUX
is: 14 in number of lemmas, 6 in number of types and 9 in number of tokens.
The 10 most frequent AUX
lemmas: است، بود، خواست، بایست، توانست، کرد، _، توان، گشت، داشت
The 10 most frequent AUX
types: است، بود، باید، خواهد، باشد، بودند، ست، باشند، بوده، شده
The 10 most frequent ambiguous lemmas: است (AUX 2215, VERB 222, NOUN 1), بود (AUX 1339, VERB 225), خواست (AUX 402, VERB 93, NOUN 6), توانست (AUX 248, VERB 16), کرد (VERB 4238, AUX 225, NOUN 4), _ (VERB 1320, NOUN 909, AUX 91, PRON 8, ADV 2), توان (AUX 84, NOUN 10), گشت (AUX 43, VERB 15), داشت (VERB 1140, AUX 39)
The 10 most frequent ambiguous types: است (AUX 2068, VERB 188), بود (AUX 630, VERB 91), باشد (AUX 177, VERB 32), بودند (AUX 139, VERB 20), ست (AUX 116, VERB 30, NOUN 1), باشند (AUX 79, VERB 3), بوده (AUX 77, VERB 31, ADJ 2), شده (VERB 367, AUX 71), میتواند (AUX 58, VERB 2), میشود (VERB 357, AUX 49)
- است
- بود
- باشد
- بودند
- ست
- AUX 116: امام حسین ) ع ( پاسخی به معاویه داد که پاسخ او طلایه انقلاب عاشورا ست .
- VERB 30: به امام حسین ) ع ( گفته بود رهبری آن چهار نفر دیگر بر عهده تو ست .
- NOUN 1: این ترمیم که به منظور شفاف و سفید کردن مجسمهها که با اصل خود شباهت داشته باشند در گالری جدیدی که توسط لرد داوین و به پیشنهاد تاریخنویس مشهور ویلیام ست کلیر ترتیب داده شده بود ، انجام شد .
- باشند
- بوده
- AUX 77: نظامی میگوید : زادگاه فردوسی باژ بوده است .
- VERB 31: گفت : ضعف در کار هیئت نظارت بوده است بعضی جاها دقت لازم را نداشتهاند .
- ADJ 2: این استل سنگی که اندازه آن به بیش از یک متر میرسد ، متعلق به قرن هشتم پیش از میلاد بوده و شرح لشکرکشی سارگون دوم را به سرزمینهای دیگر از جمله سرزمین ماد بیان میکند .
- شده
- میتواند
- میشود
Morphology
The form / lemma ratio of AUX
is 17.636364 (the average of all parts of speech is 1.409222).
The 1st highest number of forms (46) was observed with the lemma “_”: اجراست, ام, اند, باشه, بشوم, بشوند, بشویم, بود؛, دارن, داره, شدهای, شدهاید, شدهایم, شدی, شدیم, شوم, میباشید, میشدم, میشده, میشدیم, میشه, میشوی, میشویم, میکرده, نباشند, نباشید, نبایستی, نبودم, نخواهند, نشدم, نشدند, نشدید, نشدیم, نشود, نشوند, نشوی, نشویم, نمیبایست, نمیشدم, نمیشدند, نگردند, نگردیده, هستین, گردند, یی, اند.
The 2nd highest number of forms (38) was observed with the lemma “توانست”: بتوان, بتواند, بتوانم, بتوانند, بتوانیم, توانست, توانستند, توانستهاند, توانستید, میتواند, میتوانست, میتوانستم, میتوانستیم, میتوانم, میتوانند, میتوانی, میتوانید, میتوانیم, میتونم, میتونیم, نتوان, نتوانست, نتوانستم, نتوانستند, نتوانسته, نتوانستهاند, نتوانند, نتونستم, نمیتواند, نمیتوانست, نمیتوانستند, نمیتوانسته, نمیتوانستیم, نمیتوانم, نمیتوانند, نمیتوانی, نمیتوانید, نمیتوانیم.
The 3rd highest number of forms (38) was observed with the lemma “خواست”: بخواهد, بخواهم, بخواهند, بخواهی, بخواهیم, خواست, خواستم, خواستند, خواستی, خواستید, خواهد, خواهم, خواهند, خواهی, خواهید, خواهیم, میخواست, میخواستم, میخواستند, میخواسته, میخواستید, میخواستیم, میخواهد, میخواهم, میخواهند, میخواهی, میخواهید, میخواهیم, نخواهد, نخواهم, نخواهند, نخواهی, نخواهیم, نمیخواد, نمیخواستند, نمیخواهد, نمیخواهم, نمیخواهند.
AUX
occurs with 6 features: Number (4594; 91% instances), Person (4594; 91% instances), Tense (4379; 87% instances), VerbForm (891; 18% instances), Mood (468; 9% instances), Polarity (223; 4% instances)
AUX
occurs with 14 feature-value pairs: Mood=Imp
, Mood=Sub
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, Polarity=Neg
, Tense=Fut
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
AUX
occurs with 71 feature combinations.
The most frequent feature combination is Number=Sing|Person=3|Tense=Pres
(2387 tokens).
Examples: است، ست، میتواند، میشود، میباشد، میخواهد، میگردد، ه، نمیشود، میشه
Relations
AUX
nodes are attached to their parents using 6 different relations: cop (2470; 49% instances), aux (2282; 45% instances), aux:pass (270; 5% instances), conj (3; 0% instances), acl:relcl (2; 0% instances), ccomp (1; 0% instances)
Parents of AUX
nodes belong to 8 different parts of speech: VERB (1955; 39% instances), NOUN (1442; 29% instances), ADJ (1400; 28% instances), PRON (124; 2% instances), ADV (75; 1% instances), NUM (29; 1% instances), AUX (2; 0% instances), DET (1; 0% instances)
4999 (99%) AUX
nodes are leaves.
27 (1%) AUX
nodes have one child.
0 (0%) AUX
nodes have two children.
2 (0%) AUX
nodes have three or more children.
The highest child degree of a AUX
node is 5.
Children of AUX
nodes are attached using 8 different relations: punct (20; 56% instances), conj (5; 14% instances), cc (3; 8% instances), ccomp (2; 6% instances), mark (2; 6% instances), obl (2; 6% instances), advcl (1; 3% instances), obj (1; 3% instances)
Children of AUX
nodes belong to 7 different parts of speech: PUNCT (20; 56% instances), VERB (5; 14% instances), CCONJ (3; 8% instances), ADJ (2; 6% instances), AUX (2; 6% instances), PRON (2; 6% instances), SCONJ (2; 6% instances)