home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: VERB

There are 9380 VERB lemmas (17%), 39982 VERB types (28%) and 172826 VERB tokens (11%). Out of 17 observed tags, the rank of VERB is: 4 in number of lemmas, 2 in number of types and 3 in number of tokens.

The 10 most frequent VERB lemmas: мочь, быть, стать, говорить, сказать, делать, иметь, знать, идти, нет

The 10 most frequent VERB types: может, есть, нет, было, сказал, могут, стал, является, быть, говорит

The 10 most frequent ambiguous lemmas: мочь (VERB 4372, NOUN 1, X 1), быть (AUX 11682, VERB 3769, PUNCT 1, X 1), стать (VERB 2354, NOUN 6), знать (VERB 1194, NOUN 4), нет (VERB 1060, PART 379, NOUN 1), определять (VERB 207, ADJ 1), решать (VERB 203, ADJ 1), соответствовать (VERB 148, ADJ 1), открывать (VERB 103, ADJ 1), есть (VERB 102, INTJ 1)

The 10 most frequent ambiguous types: есть (VERB 1495, AUX 416, INTJ 1), нет (VERB 962, PART 183, ADJ 1), было (AUX 2465, VERB 724, PART 41), быть (AUX 945, VERB 481), стали (VERB 437, NOUN 23), будет (AUX 1386, VERB 245), стать (VERB 222, NOUN 3), был (AUX 2257, VERB 156), значит (VERB 151, ADV 139), были (AUX 1612, VERB 140, NOUN 1)

Morphology

The form / lemma ratio of VERB is 4.262473 (the average of all parts of speech is 2.654430).

The 1st highest number of forms (61) was observed with the lemma “делать”: Сделайте, делавшая, делавшееся, делавшей, делаем, делает, делаете, делается, делаешь, делай, делайте, делал, делала, делалась, делали, делались, делало, делалось, делался, делать, делаться, делаю, делают, делаются, делающая, делающего, делающие, делающими, делающих, делая, сделав, сделавшего, сделавшей, сделавшему, сделавшие, сделавший, сделавших, сделаем, сделает, сделаете, сделаешь, сделал, сделала, сделали, сделало, сделан, сделана, сделанная, сделанного, сделанное, сделанной, сделанные, сделанный, сделанным, сделанными, сделанных, сделано, сделаны, сделать, сделаю, сделают.

The 2nd highest number of forms (55) was observed with the lemma “писать”: Напишите, Писавшие, Пишите, написав, написавшего, написавший, написал, написала, написали, написало, написан, написана, написанная, написанного, написанное, написанной, написанном, написанную, написанные, написанный, написанным, написанных, написано, написаны, написать, напишет, напишешь, напишу, напишут, писавшим, писал, писала, писалась, писали, писались, писалось, писался, писан, писать, писаться, пишем, пишет, пишете, пишется, пишешь, пиши, пишу, пишут, пишутся, пишущая, пишущего, пишущей, пишущие, пишущих, пописать.

The 3rd highest number of forms (52) was observed with the lemma “брать”: Берется, Возьмите, берем, берет, берете, берешь, бери, берите, беру, берут, берутся, берущей, берущейся, берущем, берущий, берущих, берущую, беря, берёт, бравших, брал, брала, брали, бралось, брать, взяв, взявшая, взявшего, взявший, взял, взяла, взяли, взяло, взят, взята, взято, взятого, взятое, взятую, взяты, взятые, взятый, взятым, взятых, взять, возьмем, возьмет, возьмете, возьмешь, возьми, возьму, возьмут.

VERB occurs with 14 features: Voice (172396; 100% instances), VerbForm (172385; 100% instances), Aspect (172319; 100% instances), Tense (139422; 81% instances), Number (135138; 78% instances), Mood (111275; 64% instances), Gender (55693; 32% instances), Person (53394; 31% instances), Case (16928; 10% instances), Variant (6939; 4% instances), Animacy (1818; 1% instances), Polarity (398; 0% instances), Abbr (19; 0% instances), Foreign (1; 0% instances)

VERB occurs with 34 feature-value pairs: Abbr=Yes, Animacy=Anim, Animacy=Inan, Aspect=Imp, Aspect=Perf, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Foreign=Yes, Gender=Fem, Gender=Masc, Gender=Neut, Mood=Imp, Mood=Ind, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Neg, Tense=Fut, Tense=Past, Tense=Pres, Variant=Short, VerbForm=Conv, VerbForm=Fin, VerbForm=Inf, VerbForm=Part, Voice=Act, Voice=Mid, Voice=Pass

VERB occurs with 325 feature combinations. The most frequent feature combination is Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act (18664 tokens). Examples: может, есть, нет, говорит, стоит, идет, имеет, происходит, следует, считает

Relations

VERB nodes are attached to their parents using 27 different relations: root (61950; 36% instances), conj (26564; 15% instances), xcomp (14628; 8% instances), acl (13910; 8% instances), advcl (13438; 8% instances), parataxis (11679; 7% instances), acl:relcl (8300; 5% instances), csubj (8047; 5% instances), ccomp (6335; 4% instances), amod (4569; 3% instances), obl (1495; 1% instances), fixed (794; 0% instances), appos (247; 0% instances), csubj:pass (215; 0% instances), nsubj (214; 0% instances), nmod (208; 0% instances), orphan (106; 0% instances), obj (42; 0% instances), flat:foreign (34; 0% instances), flat (14; 0% instances), iobj (13; 0% instances), nsubj:pass (11; 0% instances), flat:name (4; 0% instances), dep (3; 0% instances), dislocated (3; 0% instances), advmod (2; 0% instances), compound (1; 0% instances)

Parents of VERB nodes belong to 17 different parts of speech: (61950; 36% instances), VERB (60184; 35% instances), NOUN (28512; 16% instances), ADJ (9400; 5% instances), ADV (5373; 3% instances), PRON (4354; 3% instances), PROPN (1454; 1% instances), DET (983; 1% instances), PART (279; 0% instances), NUM (234; 0% instances), SYM (34; 0% instances), X (22; 0% instances), INTJ (18; 0% instances), SCONJ (13; 0% instances), ADP (8; 0% instances), CCONJ (6; 0% instances), AUX (2; 0% instances)

7949 (5%) VERB nodes are leaves.

17797 (10%) VERB nodes have one child.

26395 (15%) VERB nodes have two children.

120685 (70%) VERB nodes have three or more children.

The highest child degree of a VERB node is 19.

Children of VERB nodes are attached using 43 different relations: punct (145296; 25% instances), obl (99947; 17% instances), nsubj (80356; 14% instances), advmod (58888; 10% instances), obj (49355; 8% instances), conj (26416; 5% instances), cc (23481; 4% instances), mark (18801; 3% instances), parataxis (14706; 3% instances), xcomp (14030; 2% instances), advcl (11867; 2% instances), iobj (10437; 2% instances), nsubj:pass (9397; 2% instances), ccomp (7352; 1% instances), aux:pass (3403; 1% instances), aux (2756; 0% instances), csubj (2222; 0% instances), obl:tmod (763; 0% instances), obl:agent (613; 0% instances), det (600; 0% instances), discourse (495; 0% instances), fixed (251; 0% instances), csubj:pass (213; 0% instances), flat:foreign (158; 0% instances), case (145; 0% instances), vocative (130; 0% instances), expl (122; 0% instances), acl (114; 0% instances), appos (57; 0% instances), cop (57; 0% instances), amod (42; 0% instances), flat (14; 0% instances), nummod (14; 0% instances), nummod:gov (14; 0% instances), orphan (14; 0% instances), compound (13; 0% instances), nmod (13; 0% instances), acl:relcl (7; 0% instances), flat:name (6; 0% instances), nsubj:outer (4; 0% instances), dislocated (2; 0% instances), nummod:entity (2; 0% instances), dep (1; 0% instances)

Children of VERB nodes belong to 17 different parts of speech: NOUN (179595; 31% instances), PUNCT (145296; 25% instances), VERB (60184; 10% instances), PRON (53669; 9% instances), ADV (44371; 8% instances), CCONJ (23119; 4% instances), PART (20448; 4% instances), SCONJ (17798; 3% instances), PROPN (16213; 3% instances), ADJ (9116; 2% instances), AUX (6216; 1% instances), NUM (2196; 0% instances), DET (2084; 0% instances), ADP (1362; 0% instances), SYM (699; 0% instances), X (134; 0% instances), INTJ (74; 0% instances)