home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: VERB

There are 9507 VERB lemmas (18%), 39997 VERB types (28%) and 176142 VERB tokens (12%). Out of 17 observed tags, the rank of VERB is: 3 in number of lemmas, 2 in number of types and 3 in number of tokens.

The 10 most frequent VERB lemmas: мочь, быть, стать, говорить, сказать, можно, иметь, знать, идти, нет

The 10 most frequent VERB types: может, можно, есть, нет, надо, сказал, было, могут, стал, является

The 10 most frequent ambiguous lemmas: мочь (VERB 4045, NOUN 1, X 1), быть (AUX 11695, VERB 3756, PUNCT 1, X 1), стать (VERB 2354, NOUN 6), знать (VERB 1194, NOUN 4), нет (VERB 1060, PART 379, NOUN 1), надо (VERB 958, ADP 3), определять (VERB 207, ADJ 1), решать (VERB 203, ADJ 1), соответствовать (VERB 148, ADJ 1), открывать (VERB 103, ADJ 1)

The 10 most frequent ambiguous types: есть (VERB 1498, AUX 413, INTJ 1), нет (VERB 962, PART 183, ADJ 1), надо (VERB 816, ADP 5), было (AUX 2477, VERB 712, PART 41), быть (AUX 945, VERB 481), стали (VERB 437, NOUN 23), будет (AUX 1387, VERB 244), стать (VERB 222, NOUN 3), был (AUX 2259, VERB 154), значит (VERB 151, ADV 139)

Morphology

The form / lemma ratio of VERB is 4.207111 (the average of all parts of speech is 2.668831).

The 1st highest number of forms (50) was observed with the lemma “использовать”: использовавшего, использовавшие, использовавшиеся, использовавшийся, использовал, использовала, использовалась, использовали, использовались, использовало, использовалось, использовался, использован, использована, использованная, использованного, использованное, использованной, использованные, использованный, использованных, использовано, использованы, использовать, использоваться, используем, используемая, используемого, используемое, используемую, используемые, используемый, используемым, используемых, использует, используется, используйте, использую, используют, используются, использующего, использующегося, использующие, использующиеся, использующий, использующими, использующих, использующихся, использующую, используя.

The 2nd highest number of forms (39) was observed with the lemma “получить”: получат, получен, получена, полученная, полученного, полученное, полученной, полученном, полученному, полученную, полученные, полученный, полученным, полученными, полученных, получено, получены, получи, получив, получившая, получившего, получившее, получившей, получившему, получившие, получивший, получившими, получивших, получившую, получил, получила, получили, получило, получим, получит, получите, получить, получишь, получу.

The 3rd highest number of forms (38) was observed with the lemma “вести”: ведем, ведет, ведете, ведется, веди, ведомое, ведомой, ведомые, ведомый, ведомых, веду, ведут, ведутся, ведущая, ведущаяся, ведущего, ведущее, ведущей, ведущему, ведущие, ведущиеся, ведущий, ведущих, ведущихся, ведущую, ведя, ведёт, вел, вела, велась, вели, велись, вело, велось, велся, вести, вестись, вёл.

VERB occurs with 16 features: VerbForm (172346; 98% instances), Voice (172346; 98% instances), Aspect (168604; 96% instances), Tense (139380; 79% instances), Number (135099; 77% instances), Mood (111265; 63% instances), Gender (55675; 32% instances), Person (53397; 30% instances), Case (16987; 10% instances), Variant (6938; 4% instances), Animacy (1820; 1% instances), Polarity (899; 1% instances), ExtPos (191; 0% instances), Abbr (19; 0% instances), Foreign (1; 0% instances), Typo (1; 0% instances)

VERB occurs with 38 feature-value pairs: Abbr=Yes, Animacy=Anim, Animacy=Inan, Aspect=Imp, Aspect=Perf, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, ExtPos=ADV, ExtPos=CCONJ, ExtPos=VERB, Foreign=Yes, Gender=Fem, Gender=Masc, Gender=Neut, Mood=Imp, Mood=Ind, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Neg, Tense=Fut, Tense=Past, Tense=Pres, Typo=Yes, Variant=Short, VerbForm=Conv, VerbForm=Fin, VerbForm=Inf, VerbForm=Part, Voice=Act, Voice=Mid, Voice=Pass

VERB occurs with 371 feature combinations. The most frequent feature combination is Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act (17051 tokens). Examples: может, нет, говорит, стоит, идет, имеет, происходит, следует, считает, существует

Relations

VERB nodes are attached to their parents using 31 different relations: root (63885; 36% instances), conj (26969; 15% instances), acl (15401; 9% instances), xcomp (14546; 8% instances), advcl (13469; 8% instances), parataxis (9674; 5% instances), acl:relcl (8547; 5% instances), csubj (8085; 5% instances), ccomp (6626; 4% instances), amod (4545; 3% instances), parataxis:discourse (2234; 1% instances), fixed (781; 0% instances), appos (249; 0% instances), nmod (248; 0% instances), nsubj (223; 0% instances), csubj:pass (215; 0% instances), obl (128; 0% instances), orphan (107; 0% instances), obl:depict (62; 0% instances), obl:pronmod (54; 0% instances), obj (40; 0% instances), flat (14; 0% instances), iobj (14; 0% instances), nsubj:pass (12; 0% instances), flat:name (4; 0% instances), dep (3; 0% instances), dislocated (3; 0% instances), cc (1; 0% instances), compound (1; 0% instances), list (1; 0% instances), obl:agent (1; 0% instances)

Parents of VERB nodes belong to 17 different parts of speech: VERB (64650; 37% instances), (63885; 36% instances), NOUN (28989; 16% instances), ADJ (9458; 5% instances), PRON (4431; 3% instances), ADV (1730; 1% instances), PROPN (1215; 1% instances), DET (1141; 1% instances), PART (273; 0% instances), NUM (234; 0% instances), X (50; 0% instances), SYM (35; 0% instances), INTJ (20; 0% instances), SCONJ (13; 0% instances), ADP (10; 0% instances), CCONJ (5; 0% instances), AUX (3; 0% instances)

7924 (4%) VERB nodes are leaves.

17850 (10%) VERB nodes have one child.

27168 (15%) VERB nodes have two children.

123200 (70%) VERB nodes have three or more children.

The highest child degree of a VERB node is 19.

Children of VERB nodes are attached using 44 different relations: punct (148826; 25% instances), nsubj (80442; 14% instances), obl (73107; 12% instances), advmod (59927; 10% instances), obj (54711; 9% instances), conj (26759; 5% instances), cc (24052; 4% instances), mark (19157; 3% instances), xcomp (18190; 3% instances), iobj (13698; 2% instances), obl:tmod (12806; 2% instances), advcl (12183; 2% instances), nsubj:pass (9403; 2% instances), parataxis:discourse (7703; 1% instances), ccomp (7664; 1% instances), parataxis (7575; 1% instances), csubj (5293; 1% instances), aux:pass (3405; 1% instances), aux (2851; 0% instances), obl:agent (2529; 0% instances), obl:float (686; 0% instances), cop (520; 0% instances), vocative (309; 0% instances), acl (282; 0% instances), det (281; 0% instances), case (256; 0% instances), obl:depict (223; 0% instances), csubj:pass (218; 0% instances), fixed (190; 0% instances), discourse (181; 0% instances), expl (124; 0% instances), appos (57; 0% instances), amod (20; 0% instances), nummod (18; 0% instances), flat (14; 0% instances), orphan (14; 0% instances), compound (13; 0% instances), nummod:gov (13; 0% instances), acl:relcl (8; 0% instances), flat:name (6; 0% instances), nmod (5; 0% instances), nsubj:outer (5; 0% instances), dislocated (3; 0% instances), dep (1; 0% instances)

Children of VERB nodes belong to 17 different parts of speech: NOUN (180779; 30% instances), PUNCT (148826; 25% instances), VERB (64650; 11% instances), PRON (48655; 8% instances), ADV (44434; 7% instances), CCONJ (23653; 4% instances), PART (20912; 4% instances), SCONJ (18245; 3% instances), PROPN (15012; 3% instances), DET (8825; 1% instances), ADJ (8378; 1% instances), AUX (6776; 1% instances), NUM (2011; 0% instances), ADP (1335; 0% instances), SYM (701; 0% instances), X (461; 0% instances), INTJ (75; 0% instances)