home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Uyghur-UDT: POS Tags: ADJ

There are 493 ADJ lemmas (16%), 773 ADJ types (6%) and 2342 ADJ tokens (6%). Out of 16 observed tags, the rank of ADJ is: 2 in number of lemmas, 3 in number of types and 5 in number of tokens.

The 10 most frequent ADJ lemmas: _، چوڭ، ياخشى، يوق، باشقا، كىچىك، ئۇزاق، خۇددى، ئوخشاش، سادىق

The 10 most frequent ADJ types: چوڭ، يوق، ياخشى، كىچىك، خۇددى، ئوخشاش، ئۇزاق، چىرايلىق، قارا، كۆپ

The 10 most frequent ambiguous lemmas: _ (VERB 4247, NOUN 4246, AUX 501, PRON 479, PUNCT 396, ADJ 326, ADV 157, PART 119, NUM 77, CCONJ 75, X 64, ADP 56, INTJ 47, DET 28), ياخشى (ADJ 50, AUX 1), بەزى (ADJ 25, DET 13), پۈتۈن (ADJ 22, DET 1), بىللە (ADJ 19, ADV 1), ھە (ADJ 15, NOUN 4), ئېغىر (ADJ 11, VERB 2), بار (VERB 152, ADJ 10), توغرا (NOUN 20, ADJ 8), مەلۇم (ADJ 8, DET 2)

The 10 most frequent ambiguous types: ياخشى (ADJ 46, AUX 1), قارا (ADJ 24, VERB 4), پۈتۈن (ADJ 22, DET 1), بىللە (ADJ 19, ADV 1), ھە (ADJ 15, NOUN 3), ئېغىر (ADJ 11, VERB 2), بەزىدە (ADJ 8, PRON 6), مەلۇم (ADJ 8, DET 2), قىزىق (ADJ 7, VERB 2), لازىم (ADJ 7, AUX 1)

Morphology

The form / lemma ratio of ADJ is 1.567951 (the average of all parts of speech is 4.182394).

The 1st highest number of forms (194) was observed with the lemma “_”: ئاددى, ئاددىيلا, ئازابلىق, ئازراقلا, ئاسانكەن, ئاسانلا, ئاستاغىنە, ئاسما, ئاغرىقچان, ئاقكۆڭۈل, ئامان, ئاچ, ئوبرازلىق, ئوتتۇرانچى, ئوخشاشكەن, ئوخشاشلا, ئوڭايلا, ئوڭغۇل-دوڭغۇل, ئىتتىپاقىنىڭ, ئىسىملىك, ئىلاجىسىز, ئىناق, ئۆزگىچە, ئۇزاقتىن-ئۇزاق, ئۇششاقچۈششەك, ئۇششاق–چۈششەك, ئۇنىڭسىز, ئۈرۈمچىنىڭ, ئۈزۈۋاتقاندەك, ئۈنلۈك, ئېنىقراق, ئېنىقكى, ئېيتقانلارنىلا, ئېگىز-پەس, ئەركەك, ئەيىبلىك, ئەگرى, باردۇ, باركى, بارلىرى, بارمىدۇ, بايىقى, بويلۇق, بىۋاستە, بۇرۇنقىدەك, بۈك-باراقسان, بەھرىمەن, تاملىق, تورۇق, توغرىمۇ, تىت, تىرەن, تىنسىز, تىنىچ, تىنچ-ئامان, تىگىدە, تىگىشلىك, تۇتاش, تۇپراقسىز, تۈنۈگۈنكى, تېجەشلىك, تېزرەك, تېزلا, تېمەن, تەبىئىيكى, تەرتىپلىك, تەرەققى_تاپقان, تەرەققىي, تەڭلا, جىگەررەڭ, جەزبىدار, خوشال, خىرەلەشكەن, خىلۋەتلىكى, خۇشبۇي, خۇشتار, خۈشال, دولقۇنلۇق, دۆۋىسىنىڭ, راست, راستلا, راستما, راستىنلا, رايونىمىزنىڭ, رىزقىنى, رىياسەتچى, رەڭگارەڭ, زۆرۈر, زەررىچە, سانسىزلىغان, ساپالىق, ساپسېرىق, سورتلۇق, سوقما, سۆزۈمدىن, سۆسۈن, سۇسىز, سۈيۈملۈك, سۈپسۈزۈك, غەرق, غەلبىلىك, فرانسىيىدە, قارا, قاراشلىق, قايرىما, قايىل, قاڭشارلىق, قىزىق, قىشلىق, قىلىشىم, قۇلايلىق, قۇيۇق, قېتىمقى, قېلىنراق, قەدىمىي, كاۋكازچە, كىر, كىشلىك, كۆرۈشىدىغان, كۆمۈش, كۆنۈككەن, كۆپرەك, كۆپكۈك, كۈلۈمسىرىگەن, كۈنكى, كېرەك, كېچىلىك, كەس, كەمكۈتىسىز, كەچكى, كەچلىك, لاپپىدە, لەززەتلىك, مۇمكىن, مۇھتاج, مۈڭگۈزلۈك, مېۋىلىك, مەرد, مەزگىللىك, مەستلىكىم, مەلۇماتلىق, مەھرۇم, نائۈمىد, نابۇت, نامراتلار, ناملىق, ناھىيىلىك, نېرىقى, ياخشىكەن, يازلىق, يالغاندىن, يامغۇرلۇق, ياپيېشىل, يوقتەك, يوقمىدى, يوقىرى, يىتەرلىك, يىراق, يىراق-يىراقلارغا, يىلقى, يۇشۇرۇن, يۇڭلۇق, يۈەنلىك, يېقىمسىز, يېقىنراق, يېيېپ, پاختىلىق, پاراخوت, پارقىراق, پاكارراق, پىژغىرىم, پۈۋلەۋېرىپ, پەزىلەتلىك, پەس, پەسكە, چاققانغىنا, چاقلىق, چالا, چوڭراق, چىداملىق, چۈشلۈك, چەتكە, گۈزەلكەن, گۈلسىز, ھايالىق, ھاۋارەڭ, ھۆسىن, ھېسسىياتلىق, ھېچقايسىمىز, ھەقلىق, ۋوگزال, ۋىجدانلىق, ۋىجىك, ‹‹ئوتتۇز.

The 2nd highest number of forms (6) was observed with the lemma “چەۋەنداز”: چەۋەنداز, چەۋەندازلار, چەۋەندازلاردىن, چەۋەندازلىرى, چەۋەندازلىرىنى, چەۋەندىزى.

The 3rd highest number of forms (5) was observed with the lemma “باشقا”: باشقا, باشقىلار, باشقىلارغا, باشقىلارنى, باشقىلارنىڭ.

ADJ occurs with 4 features: Case (922; 39% instances), Number[psor] (79; 3% instances), Person[psor] (79; 3% instances), Number (61; 3% instances)

ADJ occurs with 12 feature-value pairs: Case=Abl, Case=Acc, Case=Dat, Case=Gen, Case=Loc, Case=Nom, Number=Plur, Number[psor]=Plur,Sing, Number[psor]=Sing, Person[psor]=1, Person[psor]=2, Person[psor]=3

ADJ occurs with 27 feature combinations. The most frequent feature combination is _ (1420 tokens). Examples: يوق، چوڭ، كىچىك، ياخشى، قارا، پۈتۈن، باشقا، خۇش، ئىجادىي، قىزىل

Relations

ADJ nodes are attached to their parents using 35 different relations: amod (929; 40% instances), advmod (423; 18% instances), compound (189; 8% instances), root (154; 7% instances), conj (117; 5% instances), nsubj (96; 4% instances), obl (63; 3% instances), nmod (48; 2% instances), obj (46; 2% instances), compound:redup (41; 2% instances), mark (32; 1% instances), nmod:poss (30; 1% instances), parataxis (29; 1% instances), discourse (24; 1% instances), ccomp (22; 1% instances), case (19; 1% instances), acl (13; 1% instances), nummod (10; 0% instances), compound:lvc (9; 0% instances), advcl (8; 0% instances), fixed (8; 0% instances), aux (5; 0% instances), nmod:clas (5; 0% instances), flat (4; 0% instances), vocative (4; 0% instances), dep (3; 0% instances), advmod:emph (2; 0% instances), csubj (2; 0% instances), advcl:cond (1; 0% instances), cc (1; 0% instances), nmod:abl (1; 0% instances), nmod:cau (1; 0% instances), nmod:tmod (1; 0% instances), orphan (1; 0% instances), punct (1; 0% instances)

Parents of ADJ nodes belong to 13 different parts of speech: NOUN (1146; 49% instances), VERB (831; 35% instances), ADJ (175; 7% instances), (154; 7% instances), PRON (8; 0% instances), ADV (6; 0% instances), NUM (6; 0% instances), PROPN (5; 0% instances), ADP (4; 0% instances), AUX (2; 0% instances), DET (2; 0% instances), INTJ (2; 0% instances), PART (1; 0% instances)

1532 (65%) ADJ nodes are leaves.

450 (19%) ADJ nodes have one child.

132 (6%) ADJ nodes have two children.

228 (10%) ADJ nodes have three or more children.

The highest child degree of a ADJ node is 8.

Children of ADJ nodes are attached using 34 different relations: punct (310; 20% instances), nsubj (229; 15% instances), advmod (194; 13% instances), cop (131; 8% instances), nmod (130; 8% instances), conj (108; 7% instances), amod (66; 4% instances), cc (61; 4% instances), compound (45; 3% instances), nmod:poss (35; 2% instances), compound:redup (30; 2% instances), advcl (21; 1% instances), case (21; 1% instances), discourse (21; 1% instances), det (19; 1% instances), nummod (18; 1% instances), parataxis (15; 1% instances), acl (14; 1% instances), mark (14; 1% instances), csubj (12; 1% instances), aux (10; 1% instances), obl (9; 1% instances), fixed (6; 0% instances), appos (5; 0% instances), nmod:comp (5; 0% instances), vocative (5; 0% instances), nmod:cau (3; 0% instances), nmod:tmod (2; 0% instances), obj (2; 0% instances), advcl:cond (1; 0% instances), advmod:emph (1; 0% instances), ccomp (1; 0% instances), compound:lvc (1; 0% instances), nmod:clas (1; 0% instances)

Children of ADJ nodes belong to 15 different parts of speech: NOUN (461; 30% instances), PUNCT (306; 20% instances), ADJ (175; 11% instances), AUX (137; 9% instances), VERB (116; 8% instances), ADV (111; 7% instances), PRON (109; 7% instances), CCONJ (45; 3% instances), NUM (25; 2% instances), INTJ (20; 1% instances), ADP (18; 1% instances), DET (11; 1% instances), SCONJ (5; 0% instances), PART (4; 0% instances), X (3; 0% instances)