home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Persian-Seraji: POS Tags: AUX

There are 11 AUX lemmas (0%), 194 AUX types (1%) and 5028 AUX tokens (3%). Out of 15 observed tags, the rank of AUX is: 14 in number of lemmas, 6 in number of types and 9 in number of tokens.

The 10 most frequent AUX lemmas: است، بود، خواست، بایست، توانست، کرد، _، توان، گشت، داشت

The 10 most frequent AUX types: است، بود، باید، خواهد، باشد، بودند، ست، باشند، بوده، شده

The 10 most frequent ambiguous lemmas: است (AUX 2215, VERB 222, NOUN 1), بود (AUX 1339, VERB 225), خواست (AUX 402, VERB 93, NOUN 6), توانست (AUX 248, VERB 16), کرد (VERB 4238, AUX 225, NOUN 4), _ (VERB 1320, NOUN 909, AUX 91, PRON 8, ADV 2), توان (AUX 84, NOUN 10), گشت (AUX 43, VERB 15), داشت (VERB 1140, AUX 39)

The 10 most frequent ambiguous types: است (AUX 2068, VERB 188), بود (AUX 630, VERB 91), باشد (AUX 177, VERB 32), بودند (AUX 139, VERB 20), ست (AUX 116, VERB 30, NOUN 1), باشند (AUX 79, VERB 3), بوده (AUX 77, VERB 31, ADJ 2), شده (VERB 367, AUX 71), می‌تواند (AUX 58, VERB 2), می‌شود (VERB 357, AUX 49)

Morphology

The form / lemma ratio of AUX is 17.636364 (the average of all parts of speech is 1.409222).

The 1st highest number of forms (46) was observed with the lemma “_”: اجراست, ام, اند, باشه, بشوم, بشوند, بشویم, بود؛, دارن, داره, شده‌ای, شده‌اید, شده‌ایم, شدی, شدیم, شوم, می‌باشید, می‌شدم, می‌شده, می‌شدیم, می‌شه, می‌شوی, می‌شویم, می‌کرده, نباشند, نباشید, نبایستی, نبودم, نخواهند, نشدم, نشدند, نشدید, نشدیم, نشود, نشوند, نشوی, نشویم, نمی‌بایست, نمی‌شدم, نمی‌شدند, نگردند, نگردیده, هستین, گردند, یی, ‌اند.

The 2nd highest number of forms (38) was observed with the lemma “توانست”: بتوان, بتواند, بتوانم, بتوانند, بتوانیم, توانست, توانستند, توانسته‌اند, توانستید, می‌تواند, می‌توانست, می‌توانستم, می‌توانستیم, می‌توانم, می‌توانند, می‌توانی, می‌توانید, می‌توانیم, می‌تونم, می‌تونیم, نتوان, نتوانست, نتوانستم, نتوانستند, نتوانسته, نتوانسته‌اند, نتوانند, نتونستم, نمی‌تواند, نمی‌توانست, نمی‌توانستند, نمی‌توانسته, نمی‌توانستیم, نمی‌توانم, نمی‌توانند, نمی‌توانی, نمی‌توانید, نمی‌توانیم.

The 3rd highest number of forms (38) was observed with the lemma “خواست”: بخواهد, بخواهم, بخواهند, بخواهی, بخواهیم, خواست, خواستم, خواستند, خواستی, خواستید, خواهد, خواهم, خواهند, خواهی, خواهید, خواهیم, می‌خواست, می‌خواستم, می‌خواستند, می‌خواسته, می‌خواستید, می‌خواستیم, می‌خواهد, می‌خواهم, می‌خواهند, می‌خواهی, می‌خواهید, می‌خواهیم, نخواهد, نخواهم, نخواهند, نخواهی, نخواهیم, نمی‌خواد, نمی‌خواستند, نمی‌خواهد, نمی‌خواهم, نمی‌خواهند.

AUX occurs with 6 features: Number (4594; 91% instances), Person (4594; 91% instances), Tense (4379; 87% instances), VerbForm (891; 18% instances), Mood (468; 9% instances), Polarity (223; 4% instances)

AUX occurs with 14 feature-value pairs: Mood=Imp, Mood=Sub, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Neg, Tense=Fut, Tense=Past, Tense=Pres, VerbForm=Fin, VerbForm=Inf, VerbForm=Part

AUX occurs with 71 feature combinations. The most frequent feature combination is Number=Sing|Person=3|Tense=Pres (2387 tokens). Examples: است، ست، می‌تواند، می‌شود، می‌باشد، می‌خواهد، می‌گردد، ه، نمی‌شود، می‌شه

Relations

AUX nodes are attached to their parents using 6 different relations: cop (2470; 49% instances), aux (2282; 45% instances), aux:pass (270; 5% instances), conj (3; 0% instances), acl:relcl (2; 0% instances), ccomp (1; 0% instances)

Parents of AUX nodes belong to 8 different parts of speech: VERB (1955; 39% instances), NOUN (1442; 29% instances), ADJ (1400; 28% instances), PRON (124; 2% instances), ADV (75; 1% instances), NUM (29; 1% instances), AUX (2; 0% instances), DET (1; 0% instances)

4999 (99%) AUX nodes are leaves.

27 (1%) AUX nodes have one child.

0 (0%) AUX nodes have two children.

2 (0%) AUX nodes have three or more children.

The highest child degree of a AUX node is 5.

Children of AUX nodes are attached using 8 different relations: punct (20; 56% instances), conj (5; 14% instances), cc (3; 8% instances), ccomp (2; 6% instances), mark (2; 6% instances), obl (2; 6% instances), advcl (1; 3% instances), obj (1; 3% instances)

Children of AUX nodes belong to 7 different parts of speech: PUNCT (20; 56% instances), VERB (5; 14% instances), CCONJ (3; 8% instances), ADJ (2; 6% instances), AUX (2; 6% instances), PRON (2; 6% instances), SCONJ (2; 6% instances)