home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Persian-Seraji: POS Tags: AUX

There are 20 AUX lemmas (0%), 170 AUX types (1%) and 5439 AUX tokens (4%). Out of 15 observed tags, the rank of AUX is: 12 in number of lemmas, 6 in number of types and 8 in number of tokens.

The 10 most frequent AUX lemmas: کرد#کن، است، بود#باش، هست، بایست#باید، خواست#خواه، بود، _، توان، گشت#گرد

The 10 most frequent AUX types: است، بود، شد، شده، می‌شود، باید، خواهد، نیست، شود، باشد

The 10 most frequent ambiguous lemmas: کرد#کن (VERB 2814, AUX 1609, ADJ 6), است (AUX 1434, VERB 1003, NOUN 1), بود#باش (AUX 792, VERB 474, ADJ 3, NOUN 1), هست (AUX 528, VERB 129, NOUN 1), خواست#خواه (AUX 271, VERB 192), بود (AUX 159, VERB 138), _ (NOUN 4861, VERB 1388, ADJ 1371, ADV 194, NUM 152, AUX 98, X 92, PUNCT 90, PRON 35, ADP 32, INTJ 19, SCONJ 12, CCONJ 5, DET 4), توان (AUX 84, NOUN 10), گشت#گرد (AUX 42, VERB 16), داشت#دار (VERB 1142, AUX 37)

The 10 most frequent ambiguous types: است (AUX 1287, VERB 969), بود (AUX 449, VERB 272), شد (AUX 404, VERB 43), شده (AUX 346, VERB 92), می‌شود (AUX 343, VERB 63), نیست (AUX 172, VERB 33), شود (AUX 131, VERB 20), باشد (AUX 118, VERB 91), هستند (AUX 117, VERB 46), ست (AUX 116, VERB 30, NOUN 1)

Morphology

The form / lemma ratio of AUX is 8.500000 (the average of all parts of speech is 1.920334).

The 1st highest number of forms (49) was observed with the lemma “_”: اجراست, ام, اند, باشه, بایستی, بشوم, بشوند, بشویم, بود؛, دارن, داره, شده‌ای, شده‌اید, شده‌ایم, شدی, شدیم, شوم, می‌باشید, می‌باید, می‌شدم, می‌شده, می‌شدیم, می‌شه, می‌شوی, می‌شویم, می‌کرده, نباشند, نباشید, نبایستی, نبودم, نخواهند, نشدم, نشدند, نشدید, نشدیم, نشود, نشوند, نشوی, نشویم, نمی‌باید, نمی‌بایست, نمی‌شدم, نمی‌شدند, نگردند, نگردیده, هستین, گردند, یی, ‌اند.

The 2nd highest number of forms (31) was observed with the lemma “کرد#کن”: بشود, شد, شدم, شدند, شده, شده‌ام, شده‌ای, شده‌ایم, شود, شوند, شویم, میشده‌ام, می‌شد, می‌شدند, می‌شود, می‌شوم, می‌شوند, می‌شوید, می‌کرد, می‌کنند, می‌کنی, نشد, نشده, نشده‌اند, نشود, نشوید, نمی‌شد, نمی‌شود, نمی‌شوند, کرد, کنند.

The 3rd highest number of forms (26) was observed with the lemma “بود#باش”: باش, باشد, باشم, باشند, باشی, باشید, باشیم, بود, بوده, بوده‌ام, بوده‌اند, بوده‌ای, بوده‌ایم, بودیم, می‌باشد, می‌باشم, می‌باشند, نباشد, نباشم, نبود, نبودند, نبوده, نبودیم, نمی‌باشد, نمی‌باشند, نمی‌بود.

AUX occurs with 6 features: Number (4997; 92% instances), Person (4997; 92% instances), Tense (4456; 82% instances), VerbForm (1187; 22% instances), Mood (482; 9% instances), Polarity (396; 7% instances)

AUX occurs with 14 feature-value pairs: Mood=Imp, Mood=Sub, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Neg, Tense=Fut, Tense=Past, Tense=Pres, VerbForm=Fin, VerbForm=Inf, VerbForm=Part

AUX occurs with 64 feature combinations. The most frequent feature combination is Number=Sing|Person=3|Tense=Pres (1860 tokens). Examples: است، می‌شود، ست، می‌باشد، نمی‌شود، هست، می‌گردد، ه، می‌شه، نمی‌باشد

Relations

AUX nodes are attached to their parents using 5 different relations: cop (4697; 86% instances), aux (736; 14% instances), conj (3; 0% instances), acl:relcl (2; 0% instances), ccomp (1; 0% instances)

Parents of AUX nodes belong to 7 different parts of speech: NOUN (2295; 42% instances), ADJ (2193; 40% instances), VERB (571; 10% instances), PRON (133; 2% instances), AUX (111; 2% instances), ADV (107; 2% instances), NUM (29; 1% instances)

4990 (92%) AUX nodes are leaves.

433 (8%) AUX nodes have one child.

2 (0%) AUX nodes have two children.

14 (0%) AUX nodes have three or more children.

The highest child degree of a AUX node is 8.

Children of AUX nodes are attached using 15 different relations: aux (408; 81% instances), punct (23; 5% instances), obl (15; 3% instances), compound:lvc (11; 2% instances), obj (9; 2% instances), nsubj (8; 2% instances), ccomp (7; 1% instances), mark (7; 1% instances), advmod (4; 1% instances), advcl (3; 1% instances), cc (3; 1% instances), conj (3; 1% instances), aux:pass (1; 0% instances), vocative (1; 0% instances), xcomp (1; 0% instances)

Children of AUX nodes belong to 10 different parts of speech: VERB (306; 61% instances), AUX (111; 22% instances), NOUN (38; 8% instances), PUNCT (23; 5% instances), ADJ (8; 2% instances), SCONJ (7; 1% instances), ADV (4; 1% instances), CCONJ (3; 1% instances), PRON (3; 1% instances), X (1; 0% instances)