home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Czech-PDT: POS Tags: ADJ

There are 14826 ADJ lemmas (25%), 40175 ADJ types (31%) and 189185 ADJ tokens (13%). Out of 17 observed tags, the rank of ADJ is: 3 in number of lemmas, 1 in number of types and 3 in number of tokens.

The 10 most frequent ADJ lemmas: český, velký, nový, další, první, jiný, druhý, vysoký, dobrý, celý

The 10 most frequent ADJ types: první, další, české, nové, druhé, poslední, státní, dalších, možné, vlastní

The 10 most frequent ambiguous lemmas: velký (ADJ 2468, ADV 1), obchodní (ADJ 588, ADV 1), starý (ADJ 567, NOUN 5), známý (ADJ 560, NOUN 21), domácí (ADJ 515, NOUN 5), mladý (ADJ 443, NOUN 3), třeba (ADJ 409, ADV 404), blízký (ADJ 314, NOUN 2), vedoucí (ADJ 156, NOUN 145), spolkový (ADJ 117, NOUN 1)

The 10 most frequent ambiguous types: vlastní (ADJ 464, VERB 76), třeba (ADJ 408, ADV 372), hlavní (ADJ 298, NOUN 3), tzv (ADJ 359, ADV 1), domácí (ADJ 230, NOUN 2), dobré (ADJ 211, NOUN 1), vysoké (ADJ 190, NOUN 1), a (CCONJ 31068, ADJ 183, NOUN 49, ADP 7), lepší (ADJ 169, VERB 2), o (ADP 9669, ADJ 110, PUNCT 99, NOUN 4)

Morphology

The form / lemma ratio of ADJ is 2.709767 (the average of all parts of speech is 2.181849).

The 1st highest number of forms (32) was observed with the lemma “známý”: nejznámější, nejznámějších, nejznámějším, neznáma, neznámo, neznámou, neznámá, neznámé, neznámého, neznámém, neznámí, neznámý, neznámých, neznámým, neznámými, znám, známa, známi, známo, známou, známy, známá, známé, známého, známém, známému, známí, známý, známých, známým, známými, známější.

The 2nd highest number of forms (31) was observed with the lemma “dobrý”: Dobrú, dobrou, dobrá, dobré, dobrého, dobrém, dobrému, dobrý, dobrých, dobrým, dobrými, dobří, lepší, lepších, lepšího, lepším, lepšími, lepšímu, nedobrou, nedobrá, nedobré, nedobrého, nedobrý, nedobrých, nejlepší, nejlepších, nejlepšího, nejlepším, nejlepšími, nejlepšímu, nelepší.

The 3rd highest number of forms (31) was observed with the lemma “velký”: největší, největších, největšího, největším, největšími, největšímu, nevelkou, nevelká, nevelké, nevelkého, nevelký, nevelkých, nevelkým, nevelkými, velcí, velkou, velká, velké, velkého, velkém, velkému, velký, velkých, velkým, velkými, větší, větších, většího, větším, většími, většímu.

ADJ occurs with 20 features: Number (184587; 98% instances), Gender (184564; 98% instances), Polarity (181483; 96% instances), Case (173088; 91% instances), Degree (165170; 87% instances), Animacy (75523; 40% instances), VerbForm (14024; 7% instances), Voice (14024; 7% instances), Variant (11414; 6% instances), Aspect (9991; 5% instances), NumType (4990; 3% instances), NameType (4756; 3% instances), Tense (4498; 2% instances), Gender[psor] (2707; 1% instances), Poss (2707; 1% instances), Foreign (2670; 1% instances), Abbr (1714; 1% instances), Hyph (398; 0% instances), Style (172; 0% instances), NumValue (30; 0% instances)

ADJ occurs with 67 feature-value pairs: Abbr=Yes, Animacy=Anim, Animacy=Inan, Aspect=Imp, Aspect=Perf, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Case=Voc, Degree=Cmp, Degree=Pos, Degree=Sup, Foreign=Yes, Gender=Fem, Gender=Fem,Masc, Gender=Fem,Neut, Gender=Masc, Gender=Neut, Gender[psor]=Fem, Gender[psor]=Masc, Hyph=Yes, NameType=Com, NameType=Com,Geo, NameType=Com,Giv, NameType=Com,Oth, NameType=Com,Pro, NameType=Com,Pro,Sur, NameType=Com,Sur, NameType=Geo, NameType=Geo,Giv, NameType=Geo,Oth, NameType=Geo,Pro, NameType=Geo,Sur, NameType=Giv, NameType=Giv,Sur, NameType=Nat, NameType=Oth, NameType=Oth,Sur, NameType=Pro, NameType=Sur, NumType=Mult,Sets, NumType=Ord, NumType=Sets, NumValue=1, Number=Dual, Number=Plur, Number=Plur,Sing, Number=Sing, Polarity=Neg, Polarity=Pos, Poss=Yes, Style=Arch, Style=Coll, Style=Expr, Style=Rare, Style=Slng, Style=Vrnc, Style=Vulg, Tense=Past, Tense=Pres, Variant=Short, VerbForm=Part, Voice=Act, Voice=Pass

ADJ occurs with 848 feature combinations. The most frequent feature combination is Case=Gen|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos (13446 tokens). Examples: české, evropské, nové, národní, politické, slovenské, státní, světové, celé, velké

Relations

ADJ nodes are attached to their parents using 30 different relations: amod (157706; 83% instances), root (8971; 5% instances), conj (8826; 5% instances), obj (1823; 1% instances), dep (1640; 1% instances), xcomp (1564; 1% instances), acl (1323; 1% instances), obl (1245; 1% instances), ccomp (1120; 1% instances), nsubj (986; 1% instances), advcl (817; 0% instances), flat:foreign (714; 0% instances), nmod (520; 0% instances), obl:arg (510; 0% instances), appos (451; 0% instances), orphan (289; 0% instances), csubj (193; 0% instances), parataxis (148; 0% instances), iobj (106; 0% instances), flat (64; 0% instances), nsubj:pass (60; 0% instances), cc (51; 0% instances), csubj:pass (37; 0% instances), obl:agent (7; 0% instances), advmod:emph (4; 0% instances), fixed (4; 0% instances), advmod (3; 0% instances), case (1; 0% instances), mark (1; 0% instances), vocative (1; 0% instances)

Parents of ADJ nodes belong to 16 different parts of speech: NOUN (154186; 82% instances), VERB (9100; 5% instances), (8971; 5% instances), ADJ (8275; 4% instances), PROPN (5805; 3% instances), DET (998; 1% instances), NUM (852; 0% instances), PRON (569; 0% instances), ADV (294; 0% instances), PART (50; 0% instances), ADP (43; 0% instances), SYM (17; 0% instances), CCONJ (14; 0% instances), SCONJ (6; 0% instances), INTJ (3; 0% instances), PUNCT (2; 0% instances)

141054 (75%) ADJ nodes are leaves.

22089 (12%) ADJ nodes have one child.

6226 (3%) ADJ nodes have two children.

19816 (10%) ADJ nodes have three or more children.

The highest child degree of a ADJ node is 19.

Children of ADJ nodes are attached using 37 different relations: punct (26441; 21% instances), obl (14192; 11% instances), advmod (14091; 11% instances), cop (11578; 9% instances), conj (8971; 7% instances), cc (7623; 6% instances), nsubj (7506; 6% instances), aux:pass (6068; 5% instances), nsubj:pass (4559; 4% instances), mark (3679; 3% instances), obj (3592; 3% instances), obl:arg (2129; 2% instances), csubj (2085; 2% instances), case (2045; 2% instances), advcl (1826; 1% instances), flat:foreign (1741; 1% instances), advmod:emph (1289; 1% instances), aux (923; 1% instances), nmod (872; 1% instances), xcomp (824; 1% instances), dep (823; 1% instances), obl:agent (590; 0% instances), expl:pv (538; 0% instances), appos (479; 0% instances), amod (362; 0% instances), orphan (352; 0% instances), nummod (320; 0% instances), ccomp (232; 0% instances), parataxis (230; 0% instances), acl (132; 0% instances), det (128; 0% instances), csubj:pass (64; 0% instances), flat (42; 0% instances), discourse (23; 0% instances), expl:pass (5; 0% instances), vocative (3; 0% instances), det:nummod (2; 0% instances)

Children of ADJ nodes belong to 16 different parts of speech: NOUN (28241; 22% instances), PUNCT (26444; 21% instances), AUX (18569; 15% instances), ADV (15530; 12% instances), ADJ (8275; 7% instances), CCONJ (7500; 6% instances), VERB (6303; 5% instances), PROPN (3633; 3% instances), SCONJ (3536; 3% instances), DET (2434; 2% instances), ADP (2112; 2% instances), PRON (2086; 2% instances), NUM (1093; 1% instances), PART (579; 0% instances), SYM (19; 0% instances), INTJ (5; 0% instances)