home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Uyghur-UDT: POS Tags: AUX

There are 16 AUX lemmas (1%), 284 AUX types (2%) and 1112 AUX tokens (3%). Out of 16 observed tags, the rank of AUX is: 10 in number of lemmas, 4 in number of types and 6 in number of tokens.

The 10 most frequent AUX lemmas: _، بول، ئى، كەت، تۇر، كەل، بەر، يۈر، چىق، ئولتۇر

The 10 most frequent AUX types: ئىدى، ئىكەن، بولۇپ، كەتتى، بولسا، ئەمەس، بولىدۇ، تۇراتتى، بولدى، كېتىپتۇ

The 10 most frequent ambiguous lemmas: _ (VERB 4247, NOUN 4246, AUX 501, PRON 479, PUNCT 396, ADJ 326, ADV 157, PART 119, NUM 77, CCONJ 75, X 64, ADP 56, INTJ 47, DET 28), بول (VERB 338, AUX 243), كەت (VERB 88, AUX 86), تۇر (VERB 118, AUX 43), كەل (VERB 180, AUX 22), بەر (VERB 45, AUX 18), يۈر (VERB 26, AUX 4), چىق (VERB 84, AUX 3), ئولتۇر (VERB 27, AUX 1), بولغاي (ADV 3, AUX 1)

The 10 most frequent ambiguous types: ئىدى (AUX 126, VERB 2), ئىكەن (AUX 66, VERB 1), بولۇپ (VERB 103, AUX 63), كەتتى (AUX 56, VERB 18), بولسا (AUX 39, VERB 17), ئەمەس (AUX 30, ADV 10), بولىدۇ (AUX 27, VERB 16), تۇراتتى (AUX 26, VERB 13), بولدى (VERB 33, AUX 25), كېتىپتۇ (AUX 21, VERB 6)

Morphology

The form / lemma ratio of AUX is 17.750000 (the average of all parts of speech is 4.182394).

The 1st highest number of forms (198) was observed with the lemma “_”: ئوخشايدۇ, ئوخشايمىز, ئولتۇرۇپتۇ, ئىدىغۇ, ئىدىكىن, ئىشلاتمىسەك, ئىكەن, ئىكەنسىز, ئىكەنغۇ, ئىكەنلىكى, ئىكەنلىكىمنى, ئىكەنلىكىنى, ئۆتۈشنىمۇ, ئۆزگىرىشلەر, ئۈلگۈرەتتى, ئېتىلىپ, ئەمەسكەن, ئەمەسلىكىنى, باراتتى, باشلاپتۇ, باقاي, باقايلى, باققىن, باقماقچى, باقمايتتى, باقمايلىمۇ, باقماپتىكەنمەن, باقمىغانىدىڭ, بولاتتى, بولاتتىم, بولاتتۇق, بولالايدۇ, بولالمايدۇ, بولالمىغانىدى, بولاي, بولسىلا, بولغاندىكىن, بولغاندەك, بولغانلىقى, بولغانلىقىنى, بولغانىدى, بولغانىكەن, بولغاچقا, بولغىنىم, بولغۇچىنىڭ, بولغۇچە, بولماس, بولماسمۇ, بولماي, بولمىغانلىقتىن, بولمىغاچقا, بولىدى, بولىدىغان, بولىدىغۇ, بولىدىكەن, بولىشىمۇ, بولۇشقاندۇ, بولۇشۇپ, بولۇشۇپتۇ, بولۇندى, بولۇپلا, بولۇڭ, بولۇڭلار, بولۇۋاتقان, بوپتىكەن, بوپتۇ, بۇلالماي, بېرىپتۇ, بېرىۋاتسىمۇ, بېرەتتى, بېرەتتىم, بېرەلىسەڭ, بېرەلەيدۇ, بېرەلەيسەن, بېرەي, بېقىپتۇ, بېقىڭ, بېقىڭا, بېقىڭلار, بەرگىن, بەرگەنىكەن, تاشلايتتىڭ, تاشلاڭ, تۇراتتى, تۇرالمايمەن, تۇرغانىدىم, تۇرغۇدەك, تۇرىدىكەن, تۇرۇشاتتى, تۇرۇشىدۇ, تۇرۇپتۇ, تۇرۇپلا, تۇرۇۋاتىمەن, دېگەنىدى, دېگەنىدىم, قارىغۇدەك, قالاتتى, قالاتتىم, قالار, قالارسىز, قالاي, قالدم, قالدىمغۇ, قالسۇن, قالغاندىمەن, قالغاندەك, قالغانمىدۇ, قالغانىدى, قالغانىدىم, قالغاچقا, قالماسمەن, قالماي, قالماڭ, قالمىسۇن, قالىدىكەنمىز, قالىدىكەنمەن, قالىدۇ, قالىسىز, قالىمىز, قالىمەن, قاپتىغۇ, قاپتىمەن, قاپتۇ, قوياتتىڭ, قوياتتىڭىزكەن, قويدى, قويدىيۇ, قويدۇم, قويساق, قويسىڭىز, قويغان, قويغاندى, قويغانىدى, قويغانىكەن, قويغۇممۇ, قويماقچى, قويماقچىمەن, قويماپتۇ, قويماپسىز, قويمىدى, قويىدۇ, قويىمىز, قويۇپ, قويۇپتۇ, قويۇڭا, قىلاتتى, قىلىۋېتىدىغان, قېلىشلىرىمىزمۇ, كىتىشتى, كىتىپ, كىتىپتۇ, كىتىپسەن, كۆرمىگەن, كۆرۈنەتتى, كېتىدىغان, كېتىدىكەن, كېتىدۇكى, كېتىشتى, كېتىشكەنىدى, كېتىشلىرىمىزمۇ, كېتىپتىمەن, كېتىپتۇ, كېتىۋاتاتتى, كېتىۋاتىدۇ, كېتەتتى, كېتەتتىڭ, كېتەلمەيدىكەن, كېلىدىكەن, كېلىشىگە, كېلىۋاتىمەن, كېلىۋېتىپ, كېلەتتى, كەتتىغۇ, كەتسۇن, كەتكەندۇ, كەتكەندەك, كەتكەنلىكىنى, كەتكەنىدى, كەتكەچكە, كەتمەيتتى, كەلدىكىن, كەلمەكتە, كەلگەنىدى, كەپتۇ, ىكەن, يۈرۈپتۇ, يۈرەتتى, يېتىپتۇ, يېتەلىشى, يېگۈدەك, چىققانىدىم, چىقماقچى, چىقماپتۇ, چىقمىدىغۇ, چىقىلدى, چىقىڭلار, چۈشۈپتۇ, ھېساپلىنىدۇ.

The 2nd highest number of forms (29) was observed with the lemma “بول”: بولدى, بولدىڭىز, بولدۇم, بولدۇڭ, بولسا, بولساق, بولسام, بولساممۇ, بولساڭ, بولساڭمۇ, بولسىمۇ, بولسىڭىز, بولغان, بولغاندا, بولغاندىن, بولغىنى, بولمامدۇ, بولمايدۇ, بولمىسىمۇ, بولمىغان, بولىدۇ, بولىسىز, بولىسەن, بولىمىز, بولىمەن, بولۇش, بولۇشى, بولۇشىدىن, بولۇپ.

The 3rd highest number of forms (12) was observed with the lemma “كەت”: كېتىدۇ, كېتىشتىن, كېتىمەن, كېتىپ, كەت, كەتتى, كەتتىم, كەتتۇق, كەتسىمۇ, كەتسە, كەتكەن, كەتمەيدۇ.

AUX occurs with 11 features: VerbForm (571; 51% instances), Number (507; 46% instances), Person (507; 46% instances), Mood (472; 42% instances), Tense (386; 35% instances), Aspect (86; 8% instances), Polarity (53; 5% instances), Case (16; 1% instances), Number[psor] (4; 0% instances), Person[psor] (4; 0% instances), Polite (2; 0% instances)

AUX occurs with 22 feature-value pairs: Aspect=Perf, Case=Abl, Case=Loc, Case=Nom, Mood=Cnd, Mood=Imp, Mood=Ind, Number=Plur, Number=Sing, Number[psor]=Plur,Sing, Person=1, Person=2, Person=3, Person[psor]=3, Polarity=Neg, Polite=Form, Tense=Aor, Tense=Past, VerbForm=Conv, VerbForm=Fin, VerbForm=Ger, VerbForm=Part

AUX occurs with 32 feature combinations. The most frequent feature combination is _ (502 tokens). Examples: ئىكەن، تۇراتتى، كېتىپتۇ، بوپتۇ، قاپتۇ، ئىكەنلىكىنى، قويدى، بولاتتى، بولغاچقا، قويۇپتۇ

Relations

AUX nodes are attached to their parents using 13 different relations: cop (562; 51% instances), aux (528; 47% instances), root (6; 1% instances), discourse (3; 0% instances), acl (2; 0% instances), advcl (2; 0% instances), nsubj (2; 0% instances), parataxis (2; 0% instances), advmod (1; 0% instances), amod (1; 0% instances), case (1; 0% instances), compound (1; 0% instances), conj (1; 0% instances)

Parents of AUX nodes belong to 9 different parts of speech: VERB (668; 60% instances), NOUN (257; 23% instances), ADJ (137; 12% instances), PRON (17; 2% instances), AUX (10; 1% instances), NUM (8; 1% instances), ADV (7; 1% instances), (6; 1% instances), ADP (2; 0% instances)

166 (15%) AUX nodes are leaves.

893 (80%) AUX nodes have one child.

36 (3%) AUX nodes have two children.

17 (2%) AUX nodes have three or more children.

The highest child degree of a AUX node is 6.

Children of AUX nodes are attached using 19 different relations: punct (956; 93% instances), compound (13; 1% instances), obl (11; 1% instances), compound:lvc (8; 1% instances), cop (8; 1% instances), nsubj (8; 1% instances), advmod (7; 1% instances), aux (4; 0% instances), obj (4; 0% instances), advcl (2; 0% instances), amod (2; 0% instances), case (1; 0% instances), cc (1; 0% instances), conj (1; 0% instances), dep (1; 0% instances), mark (1; 0% instances), nmod:cau (1; 0% instances), nummod (1; 0% instances), xcomp (1; 0% instances)

Children of AUX nodes belong to 12 different parts of speech: PUNCT (956; 93% instances), NOUN (24; 2% instances), VERB (24; 2% instances), AUX (10; 1% instances), ADV (5; 0% instances), NUM (3; 0% instances), PRON (3; 0% instances), ADJ (2; 0% instances), ADP (1; 0% instances), CCONJ (1; 0% instances), PART (1; 0% instances), PROPN (1; 0% instances)