home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Persian-Seraji: POS Tags: AUX

There are 12 AUX lemmas (0%), 191 AUX types (1%) and 5027 AUX tokens (3%). Out of 15 observed tags, the rank of AUX is: 14 in number of lemmas, 6 in number of types and 9 in number of tokens.

The 10 most frequent AUX lemmas: است، بود، خواست، بایست، توانست، کرد، توان، شد، گشت، داشت

The 10 most frequent AUX types: است، بود، باید، خواهد، باشد، بودند، ست، باشند، بوده، شده

The 10 most frequent ambiguous lemmas: است (AUX 2221, VERB 223, NOUN 1), بود (AUX 1355, VERB 232), خواست (AUX 403, VERB 110, NOUN 7), توانست (AUX 248, VERB 19), کرد (VERB 4342, AUX 225, NOUN 6), توان (AUX 84, NOUN 10), شد (AUX 56, VERB 4), گشت (AUX 43, VERB 21), داشت (VERB 1193, AUX 42), گردید (AUX 16, VERB 1)

The 10 most frequent ambiguous types: است (AUX 2069, VERB 188), بود (AUX 631, VERB 91), باشد (AUX 177, VERB 32), بودند (AUX 139, VERB 20), ست (AUX 116, VERB 30, NOUN 1), باشند (AUX 79, VERB 3), بوده (AUX 77, VERB 31, ADJ 2), شده (VERB 367, AUX 71), می‌تواند (AUX 58, VERB 2), می‌شود (VERB 357, AUX 49)

Morphology

The form / lemma ratio of AUX is 15.916667 (the average of all parts of speech is 1.372220).

The 1st highest number of forms (38) was observed with the lemma “توانست”: بتوان, بتواند, بتوانم, بتوانند, بتوانیم, توانست, توانستند, توانسته‌اند, توانستید, می‌تواند, می‌توانست, می‌توانستم, می‌توانستیم, می‌توانم, می‌توانند, می‌توانی, می‌توانید, می‌توانیم, می‌تونم, می‌تونیم, نتوان, نتوانست, نتوانستم, نتوانستند, نتوانسته, نتوانسته‌اند, نتوانند, نتونستم, نمی‌تواند, نمی‌توانست, نمی‌توانستند, نمی‌توانسته, نمی‌توانستیم, نمی‌توانم, نمی‌توانند, نمی‌توانی, نمی‌توانید, نمی‌توانیم.

The 2nd highest number of forms (38) was observed with the lemma “خواست”: بخواهد, بخواهم, بخواهند, بخواهی, بخواهیم, خواست, خواستم, خواستند, خواستی, خواستید, خواهد, خواهم, خواهند, خواهی, خواهید, خواهیم, می‌خواست, می‌خواستم, می‌خواستند, می‌خواسته, می‌خواستید, می‌خواستیم, می‌خواهد, می‌خواهم, می‌خواهند, می‌خواهی, می‌خواهید, می‌خواهیم, نخواهد, نخواهم, نخواهند, نخواهی, نخواهیم, نمی‌خواد, نمی‌خواستند, نمی‌خواهد, نمی‌خواهم, نمی‌خواهند.

The 3rd highest number of forms (34) was observed with the lemma “بود”: باش, باشد, باشم, باشند, باشه, باشی, باشید, باشیم, بود, بودم, بودند, بوده, بوده‌ام, بوده‌اند, بوده‌ای, بوده‌ایم, بودید, بودیم, می‌باشد, می‌باشم, می‌باشند, می‌باشید, نباشد, نباشم, نباشند, نباشید, نبود, نبودم, نبودند, نبوده, نبودیم, نمی‌باشد, نمی‌باشند, نمی‌بود.

AUX occurs with 6 features: Person (4594; 91% instances), Number (4593; 91% instances), Tense (4379; 87% instances), VerbForm (1324; 26% instances), Mood (787; 16% instances), Polarity (223; 4% instances)

AUX occurs with 15 feature-value pairs: Mood=Imp, Mood=Ind, Mood=Sub, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Neg, Tense=Fut, Tense=Past, Tense=Pres, VerbForm=Fin, VerbForm=Inf, VerbForm=Part

AUX occurs with 67 feature combinations. The most frequent feature combination is Number=Sing|Person=3|Tense=Pres (2387 tokens). Examples: است، ست، می‌تواند، می‌شود، می‌باشد، می‌خواهد، می‌گردد، ه، نمی‌شود، می‌شه

Relations

AUX nodes are attached to their parents using 6 different relations: cop (2469; 49% instances), aux (2282; 45% instances), aux:pass (270; 5% instances), conj (3; 0% instances), acl:relcl (2; 0% instances), ccomp (1; 0% instances)

Parents of AUX nodes belong to 8 different parts of speech: VERB (1954; 39% instances), NOUN (1443; 29% instances), ADJ (1399; 28% instances), PRON (124; 2% instances), ADV (75; 1% instances), NUM (29; 1% instances), AUX (2; 0% instances), DET (1; 0% instances)

4999 (99%) AUX nodes are leaves.

26 (1%) AUX nodes have one child.

0 (0%) AUX nodes have two children.

2 (0%) AUX nodes have three or more children.

The highest child degree of a AUX node is 5.

Children of AUX nodes are attached using 8 different relations: punct (20; 57% instances), conj (4; 11% instances), cc (3; 9% instances), ccomp (2; 6% instances), mark (2; 6% instances), obl (2; 6% instances), advcl (1; 3% instances), obj (1; 3% instances)

Children of AUX nodes belong to 7 different parts of speech: PUNCT (20; 57% instances), VERB (4; 11% instances), CCONJ (3; 9% instances), ADJ (2; 6% instances), AUX (2; 6% instances), PRON (2; 6% instances), SCONJ (2; 6% instances)