home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: VERB

There are 7834 VERB lemmas (17%), 31839 VERB types (27%) and 123712 VERB tokens (11%). Out of 17 observed tags, the rank of VERB is: 4 in number of lemmas, 2 in number of types and 3 in number of tokens.

The 10 most frequent VERB lemmas: мочь, быть, стать, говорить, делать, сказать, иметь, считать, идти, получить

The 10 most frequent VERB types: может, есть, нет, могут, было, является, стал, быть, сказал, говорит

The 10 most frequent ambiguous lemmas: мочь (VERB 3357, NOUN 1, X 1), быть (AUX 8145, VERB 2885), стать (VERB 1643, NOUN 5), знать (VERB 725, NOUN 3), нет (VERB 715, PART 229, NOUN 1), определять (VERB 177, ADJ 1), решать (VERB 167, ADJ 1), соответствовать (VERB 118, ADJ 1), открывать (VERB 71, ADJ 1), развивать (VERB 65, ADJ 1)

The 10 most frequent ambiguous types: есть (VERB 1179, AUX 197, INTJ 1), нет (VERB 649, PART 119, ADJ 1), было (AUX 1650, VERB 518, PART 24), быть (AUX 718, VERB 356), стали (VERB 295, NOUN 22), будет (AUX 1086, VERB 199), стать (VERB 183, NOUN 3), был (AUX 1502, VERB 134), были (AUX 1139, VERB 113, NOUN 1), значит (VERB 109, ADV 101)

Morphology

The form / lemma ratio of VERB is 4.064207 (the average of all parts of speech is 2.589298).

The 1st highest number of forms (59) was observed with the lemma “делать”: Делался, Сделайте, делавшая, делавшееся, делаем, делает, делаете, делается, делаешь, делай, делайте, делал, делала, делалась, делали, делались, делало, делалось, делать, делаться, делаю, делают, делаются, делающего, делающие, делающими, делающих, делая, сделав, сделавшего, сделавшей, сделавшему, сделавшие, сделавший, сделавших, сделаем, сделает, сделаете, сделаешь, сделал, сделала, сделали, сделало, сделан, сделана, сделанная, сделанного, сделанное, сделанной, сделанные, сделанный, сделанным, сделанными, сделанных, сделано, сделаны, сделать, сделаю, сделают.

The 2nd highest number of forms (50) was observed with the lemma “писать”: Напишите, Пишите, написав, написавшего, написавший, написал, написала, написали, написало, написан, написана, написанная, написанного, написанное, написанной, написанном, написанную, написанные, написанный, написанным, написанных, написано, написаны, написать, напишет, напишешь, напишу, напишут, писавшим, писал, писала, писали, писались, писалось, писался, писан, писать, писаться, пишем, пишет, пишете, пишешь, пиши, пишу, пишут, пишутся, пишущая, пишущего, пишущих, пописать.

The 3rd highest number of forms (49) was observed with the lemma “брать”: Возьмите, берем, берет, берете, берешь, бери, берите, беру, берут, берутся, берущей, берущейся, берущий, берущих, берущую, беря, берёт, бравших, брал, брала, брали, брать, взяв, взявшая, взявшего, взявший, взял, взяла, взяли, взяло, взят, взята, взято, взятого, взятое, взятую, взяты, взятые, взятый, взятым, взятых, взять, возьмем, возьмет, возьмете, возьмешь, возьми, возьму, возьмут.

VERB occurs with 11 features: Voice (123711; 100% instances), Aspect (123700; 100% instances), VerbForm (123700; 100% instances), Tense (99614; 81% instances), Number (96614; 78% instances), Mood (78293; 63% instances), Person (40304; 33% instances), Gender (37473; 30% instances), Case (12873; 10% instances), Variant (5448; 4% instances), Animacy (1354; 1% instances)

VERB occurs with 31 feature-value pairs: Animacy=Anim, Animacy=Inan, Aspect=Imp, Aspect=Perf, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Gender=Fem, Gender=Masc, Gender=Neut, Mood=Imp, Mood=Ind, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Tense=Fut, Tense=Past, Tense=Pres, Variant=Short, VerbForm=Conv, VerbForm=Fin, VerbForm=Inf, VerbForm=Part, Voice=Act, Voice=Mid, Voice=Pass

VERB occurs with 308 feature combinations. The most frequent feature combination is Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act (14495 tokens). Examples: может, есть, нет, говорит, стоит, идет, имеет, происходит, будет, следует

Relations

VERB nodes are attached to their parents using 25 different relations: root (44132; 36% instances), conj (18038; 15% instances), xcomp (10728; 9% instances), acl (10098; 8% instances), advcl (9378; 8% instances), parataxis (8365; 7% instances), acl:relcl (6078; 5% instances), csubj (6022; 5% instances), ccomp (4473; 4% instances), amod (3524; 3% instances), obl (1450; 1% instances), fixed (613; 0% instances), appos (169; 0% instances), csubj:pass (167; 0% instances), nmod (166; 0% instances), nsubj (147; 0% instances), orphan (96; 0% instances), flat:foreign (33; 0% instances), flat (12; 0% instances), nsubj:pass (11; 0% instances), cc (5; 0% instances), iobj (3; 0% instances), flat:name (2; 0% instances), advmod (1; 0% instances), aux:pass (1; 0% instances)

Parents of VERB nodes belong to 16 different parts of speech: (44132; 36% instances), VERB (42058; 34% instances), NOUN (21382; 17% instances), ADJ (7088; 6% instances), ADV (3924; 3% instances), PRON (3096; 3% instances), PROPN (1025; 1% instances), DET (677; 1% instances), NUM (164; 0% instances), PART (93; 0% instances), SYM (28; 0% instances), CCONJ (14; 0% instances), SCONJ (10; 0% instances), X (9; 0% instances), ADP (6; 0% instances), INTJ (6; 0% instances)

5952 (5%) VERB nodes are leaves.

12846 (10%) VERB nodes have one child.

19311 (16%) VERB nodes have two children.

85603 (69%) VERB nodes have three or more children.

The highest child degree of a VERB node is 19.

Children of VERB nodes are attached using 37 different relations: punct (103725; 25% instances), obl (76127; 18% instances), nsubj (57028; 14% instances), advmod (41332; 10% instances), obj (33796; 8% instances), conj (18069; 4% instances), cc (15676; 4% instances), mark (13865; 3% instances), parataxis (10769; 3% instances), xcomp (9002; 2% instances), advcl (8377; 2% instances), nsubj:pass (7517; 2% instances), iobj (6059; 1% instances), ccomp (5041; 1% instances), aux:pass (2689; 1% instances), aux (2113; 1% instances), csubj (1628; 0% instances), nummod (1029; 0% instances), det (562; 0% instances), discourse (433; 0% instances), nummod:gov (197; 0% instances), csubj:pass (166; 0% instances), flat:foreign (159; 0% instances), fixed (139; 0% instances), cop (67; 0% instances), case (55; 0% instances), expl (44; 0% instances), appos (42; 0% instances), amod (41; 0% instances), flat (12; 0% instances), compound (11; 0% instances), orphan (11; 0% instances), vocative (10; 0% instances), acl (6; 0% instances), nmod (6; 0% instances), acl:relcl (5; 0% instances), flat:name (4; 0% instances)

Children of VERB nodes belong to 17 different parts of speech: NOUN (132970; 32% instances), PUNCT (103725; 25% instances), VERB (42058; 10% instances), PRON (35520; 9% instances), ADV (31694; 8% instances), CCONJ (15567; 4% instances), PART (14874; 4% instances), SCONJ (12936; 3% instances), PROPN (11270; 3% instances), ADJ (6664; 2% instances), AUX (3636; 1% instances), NUM (2040; 0% instances), DET (1184; 0% instances), ADP (1040; 0% instances), SYM (535; 0% instances), X (69; 0% instances), INTJ (30; 0% instances)