Treebank Statistics: UD_Persian-Seraji: POS Tags: AUX
There are 20 AUX
lemmas (0%), 170 AUX
types (1%) and 5439 AUX
tokens (4%).
Out of 15 observed tags, the rank of AUX
is: 12 in number of lemmas, 6 in number of types and 8 in number of tokens.
The 10 most frequent AUX
lemmas: کرد#کن، است، بود#باش، هست، بایست#باید، خواست#خواه، بود، _، توان، گشت#گرد
The 10 most frequent AUX
types: است، بود، شد، شده، میشود، باید، خواهد، نیست، شود، باشد
The 10 most frequent ambiguous lemmas: کرد#کن (VERB 2814, AUX 1609, ADJ 6), است (AUX 1434, VERB 1003, NOUN 1), بود#باش (AUX 792, VERB 474, ADJ 3, NOUN 1), هست (AUX 528, VERB 129, NOUN 1), خواست#خواه (AUX 271, VERB 192), بود (AUX 159, VERB 138), _ (NOUN 4861, VERB 1388, ADJ 1371, ADV 194, NUM 152, AUX 98, X 92, PUNCT 90, PRON 35, ADP 32, INTJ 19, SCONJ 12, CCONJ 5, DET 4), توان (AUX 84, NOUN 10), گشت#گرد (AUX 42, VERB 16), داشت#دار (VERB 1142, AUX 37)
The 10 most frequent ambiguous types: است (AUX 1287, VERB 969), بود (AUX 449, VERB 272), شد (AUX 404, VERB 43), شده (AUX 346, VERB 92), میشود (AUX 343, VERB 63), نیست (AUX 172, VERB 33), شود (AUX 131, VERB 20), باشد (AUX 118, VERB 91), هستند (AUX 117, VERB 46), ست (AUX 116, VERB 30, NOUN 1)
- است
- بود
- شد
- شده
- میشود
- نیست
- شود
- باشد
- هستند
- ست
- AUX 116: امام حسین ) ع ( پاسخی به معاویه داد که پاسخ او طلایه انقلاب عاشورا ست .
- VERB 30: به امام حسین ) ع ( گفته بود رهبری آن چهار نفر دیگر بر عهده تو ست .
- NOUN 1: این ترمیم که به منظور شفاف و سفید کردن مجسمهها که با اصل خود شباهت داشته باشند در گالری جدیدی که توسط لرد داوین و به پیشنهاد تاریخنویس مشهور ویلیام ست کلیر ترتیب داده شده بود ، انجام شد .
Morphology
The form / lemma ratio of AUX
is 8.500000 (the average of all parts of speech is 1.920334).
The 1st highest number of forms (49) was observed with the lemma “_”: اجراست, ام, اند, باشه, بایستی, بشوم, بشوند, بشویم, بود؛, دارن, داره, شدهای, شدهاید, شدهایم, شدی, شدیم, شوم, میباشید, میباید, میشدم, میشده, میشدیم, میشه, میشوی, میشویم, میکرده, نباشند, نباشید, نبایستی, نبودم, نخواهند, نشدم, نشدند, نشدید, نشدیم, نشود, نشوند, نشوی, نشویم, نمیباید, نمیبایست, نمیشدم, نمیشدند, نگردند, نگردیده, هستین, گردند, یی, اند.
The 2nd highest number of forms (31) was observed with the lemma “کرد#کن”: بشود, شد, شدم, شدند, شده, شدهام, شدهای, شدهایم, شود, شوند, شویم, میشدهام, میشد, میشدند, میشود, میشوم, میشوند, میشوید, میکرد, میکنند, میکنی, نشد, نشده, نشدهاند, نشود, نشوید, نمیشد, نمیشود, نمیشوند, کرد, کنند.
The 3rd highest number of forms (26) was observed with the lemma “بود#باش”: باش, باشد, باشم, باشند, باشی, باشید, باشیم, بود, بوده, بودهام, بودهاند, بودهای, بودهایم, بودیم, میباشد, میباشم, میباشند, نباشد, نباشم, نبود, نبودند, نبوده, نبودیم, نمیباشد, نمیباشند, نمیبود.
AUX
occurs with 6 features: Number (4997; 92% instances), Person (4997; 92% instances), Tense (4456; 82% instances), VerbForm (1187; 22% instances), Mood (482; 9% instances), Polarity (396; 7% instances)
AUX
occurs with 14 feature-value pairs: Mood=Imp
, Mood=Sub
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, Polarity=Neg
, Tense=Fut
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
AUX
occurs with 64 feature combinations.
The most frequent feature combination is Number=Sing|Person=3|Tense=Pres
(1860 tokens).
Examples: است، میشود، ست، میباشد، نمیشود، هست، میگردد، ه، میشه، نمیباشد
Relations
AUX
nodes are attached to their parents using 5 different relations: cop (4697; 86% instances), aux (736; 14% instances), conj (3; 0% instances), acl:relcl (2; 0% instances), ccomp (1; 0% instances)
Parents of AUX
nodes belong to 7 different parts of speech: NOUN (2295; 42% instances), ADJ (2193; 40% instances), VERB (571; 10% instances), PRON (133; 2% instances), AUX (111; 2% instances), ADV (107; 2% instances), NUM (29; 1% instances)
4990 (92%) AUX
nodes are leaves.
433 (8%) AUX
nodes have one child.
2 (0%) AUX
nodes have two children.
14 (0%) AUX
nodes have three or more children.
The highest child degree of a AUX
node is 8.
Children of AUX
nodes are attached using 15 different relations: aux (408; 81% instances), punct (23; 5% instances), obl (15; 3% instances), compound:lvc (11; 2% instances), obj (9; 2% instances), nsubj (8; 2% instances), ccomp (7; 1% instances), mark (7; 1% instances), advmod (4; 1% instances), advcl (3; 1% instances), cc (3; 1% instances), conj (3; 1% instances), aux:pass (1; 0% instances), vocative (1; 0% instances), xcomp (1; 0% instances)
Children of AUX
nodes belong to 10 different parts of speech: VERB (306; 61% instances), AUX (111; 22% instances), NOUN (38; 8% instances), PUNCT (23; 5% instances), ADJ (8; 2% instances), SCONJ (7; 1% instances), ADV (4; 1% instances), CCONJ (3; 1% instances), PRON (3; 1% instances), X (1; 0% instances)