home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Uyghur-UDT: POS Tags: AUX

There are 7 AUX lemmas (0%), 165 AUX types (1%) and 911 AUX tokens (2%). Out of 16 observed tags, the rank of AUX is: 13 in number of lemmas, 5 in number of types and 8 in number of tokens.

The 10 most frequent AUX lemmas: بول، _، ئى، كەت، قال، تۇر، كەل

The 10 most frequent AUX types: ئىدى، بولۇپ، ئىكەن، كەتتى، قالدى، بولسا، بولدى، ئەمەس، بولىدۇ، قالدىم

The 10 most frequent ambiguous lemmas: بول (VERB 314, AUX 275), _ (VERB 4560, NOUN 4224, PRON 479, PUNCT 434, ADJ 326, AUX 185, ADV 157, PART 119, NUM 75, CCONJ 72, ADP 51, INTJ 47, DET 28, X 27), كەت (AUX 100, VERB 74), قال (AUX 89, VERB 55), تۇر (VERB 111, AUX 50), كەل (VERB 175, AUX 27)

The 10 most frequent ambiguous types: ئىدى (AUX 126, VERB 2), بولۇپ (VERB 95, AUX 71), ئىكەن (AUX 64, VERB 3), كەتتى (AUX 61, VERB 13), قالدى (AUX 42, VERB 8), بولسا (AUX 40, VERB 16), بولدى (AUX 31, VERB 27), ئەمەس (AUX 30, ADV 10), بولىدۇ (AUX 27, VERB 16), قالدىم (AUX 19, VERB 3)

Morphology

The form / lemma ratio of AUX is 23.571429 (the average of all parts of speech is 4.088599).

The 1st highest number of forms (73) was observed with the lemma “_”: ئوخشايدۇ, ئوخشايمىز, ئىدىغۇ, ئىدىكىن, ئىشلاتمىسەك, ئىكەن, ئىكەنسىز, ئىكەنغۇ, ئىكەنلىكى, ئىكەنلىكىمنى, ئىكەنلىكىنى, ئۆزگىرىشلەر, ئەمەسكەن, ئەمەسلىكىنى, باقماقچى, باقماپتىكەنمەن, بولاتتى, بولاتتىم, بولالايدۇ, بولالمايدۇ, بولاي, بولسىلا, بولغاندىكىن, بولغاندەك, بولغانلىقى, بولغانلىقىنى, بولغانىدى, بولغانىكەن, بولغاچقا, بولغىنىم, بولغۇچىنىڭ, بولماس, بولماي, بولمىغانلىقتىن, بولمىغاچقا, بولىدى, بولىدىغان, بولىدىغۇ, بولىدىكەن, بولىشىمۇ, بولۇشقاندۇ, بولۇشۇپ, بولۇشۇپتۇ, بولۇپلا, بولۇڭ, بولۇڭلار, بولۇۋاتقان, بوپتىكەن, بوپتۇ, تۇراتتى, تۇرغۇدەك, تۇرۇپتۇ, دېگەنىدى, قارىغۇدەك, قالماي, قاپتۇ, قويغۇممۇ, قويۇپ, قىلىۋېتىدىغان, كۆرمىگەن, كېتىشلىرىمىزمۇ, كېتەتتى, كېلىدىكەن, كېلەتتى, كەتكەچكە, ىكەن, يۈرۈپتۇ, يېتەلىشى, يېگۈدەك, چىقماقچى, چىقماپتۇ, چىقمىدىغۇ, ھېساپلىنىدۇ.

The 2nd highest number of forms (37) was observed with the lemma “بول”: بولاتتى, بولاتتىكى, بولدى, بولدىڭىز, بولدۇم, بولدۇڭ, بولسا, بولساق, بولساقمۇ, بولسام, بولساممۇ, بولسامچۇ, بولساڭ, بولساڭمۇ, بولسىمۇ, بولسىڭىز, بولسۇن, بولغان, بولغاندا, بولغاندىن, بولغىنى, بولمامدۇ, بولمايدىكەن, بولمايدۇ, بولمىسا, بولمىسىمۇ, بولمىغان, بولىدۇ, بولىسىز, بولىسەن, بولىمىز, بولىمەن, بولۇش, بولۇشى, بولۇشىدىن, بولۇشىنى, بولۇپ.

The 3rd highest number of forms (15) was observed with the lemma “قال”: قالدى, قالدىم, قالدىڭ, قالدىڭىز, قالدۇق, قالسا, قالسام, قالغان, قالغاندا, قالغىنى, قالمايدۇ, قالمىدۇق, قېلىشى, قېلىشىدىن, قېلىپ.

AUX occurs with 11 features: VerbForm (682; 75% instances), Number (592; 65% instances), Person (592; 65% instances), Mood (559; 61% instances), Tense (469; 51% instances), Aspect (171; 19% instances), Polarity (58; 6% instances), Case (25; 3% instances), Number[psor] (11; 1% instances), Person[psor] (11; 1% instances), Polite (3; 0% instances)

AUX occurs with 26 feature-value pairs: Aspect=Hab, Aspect=Perf, Case=Abl, Case=Acc, Case=Dat, Case=Loc, Case=Nom, Mood=Cnd, Mood=Imp, Mood=Ind, Number=Plur, Number=Sing, Number[psor]=Plur,Sing, Person=1, Person=2, Person=3, Person[psor]=3, Polarity=Neg, Polite=Form, Tense=Past, Tense=Pres, VerbForm=Conv, VerbForm=Fin, VerbForm=Ger, VerbForm=Inf, VerbForm=Part

AUX occurs with 36 feature combinations. The most frequent feature combination is Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin (305 tokens). Examples: ئىدى، كەتتى، قالدى، بولدى، بولغان، كەلدى، كەتكەن، تۇردى، قالغان، تۇرغان

Relations

AUX nodes are attached to their parents using 11 different relations: cop (555; 61% instances), aux (337; 37% instances), root (6; 1% instances), discourse (3; 0% instances), acl (2; 0% instances), nsubj (2; 0% instances), parataxis (2; 0% instances), advcl (1; 0% instances), amod (1; 0% instances), compound (1; 0% instances), conj (1; 0% instances)

Parents of AUX nodes belong to 10 different parts of speech: VERB (471; 52% instances), NOUN (254; 28% instances), ADJ (141; 15% instances), PRON (18; 2% instances), NUM (8; 1% instances), ADV (7; 1% instances), (6; 1% instances), AUX (4; 0% instances), ADP (1; 0% instances), X (1; 0% instances)

632 (69%) AUX nodes are leaves.

262 (29%) AUX nodes have one child.

8 (1%) AUX nodes have two children.

9 (1%) AUX nodes have three or more children.

The highest child degree of a AUX node is 7.

Children of AUX nodes are attached using 14 different relations: punct (275; 87% instances), obl (10; 3% instances), compound:lvc (6; 2% instances), compound (5; 2% instances), nsubj (5; 2% instances), advcl (4; 1% instances), cop (4; 1% instances), obj (2; 1% instances), amod (1; 0% instances), cc (1; 0% instances), conj (1; 0% instances), dep (1; 0% instances), nummod (1; 0% instances), xcomp (1; 0% instances)

Children of AUX nodes belong to 9 different parts of speech: PUNCT (275; 87% instances), NOUN (14; 4% instances), VERB (14; 4% instances), AUX (4; 1% instances), NUM (3; 1% instances), ADJ (2; 1% instances), ADV (2; 1% instances), PRON (2; 1% instances), CCONJ (1; 0% instances)