Treebank Statistics: UD_Russian-SynTagRus: POS Tags: VERB
There are 9380 VERB
lemmas (17%), 39982 VERB
types (28%) and 172826 VERB
tokens (11%).
Out of 17 observed tags, the rank of VERB
is: 4 in number of lemmas, 2 in number of types and 3 in number of tokens.
The 10 most frequent VERB
lemmas: мочь, быть, стать, говорить, сказать, делать, иметь, знать, идти, нет
The 10 most frequent VERB
types: может, есть, нет, было, сказал, могут, стал, является, быть, говорит
The 10 most frequent ambiguous lemmas: мочь (VERB 4372, NOUN 1, X 1), быть (AUX 11682, VERB 3769, PUNCT 1, X 1), стать (VERB 2354, NOUN 6), знать (VERB 1194, NOUN 4), нет (VERB 1060, PART 379, NOUN 1), определять (VERB 207, ADJ 1), решать (VERB 203, ADJ 1), соответствовать (VERB 148, ADJ 1), открывать (VERB 103, ADJ 1), есть (VERB 102, INTJ 1)
The 10 most frequent ambiguous types: есть (VERB 1495, AUX 416, INTJ 1), нет (VERB 962, PART 183, ADJ 1), было (AUX 2465, VERB 724, PART 41), быть (AUX 945, VERB 481), стали (VERB 437, NOUN 23), будет (AUX 1386, VERB 245), стать (VERB 222, NOUN 3), был (AUX 2257, VERB 156), значит (VERB 151, ADV 139), были (AUX 1612, VERB 140, NOUN 1)
- есть
- нет
- было
- быть
- стали
- будет
- стать
- был
- значит
- были
Morphology
The form / lemma ratio of VERB
is 4.262473 (the average of all parts of speech is 2.654430).
The 1st highest number of forms (61) was observed with the lemma “делать”: Сделайте, делавшая, делавшееся, делавшей, делаем, делает, делаете, делается, делаешь, делай, делайте, делал, делала, делалась, делали, делались, делало, делалось, делался, делать, делаться, делаю, делают, делаются, делающая, делающего, делающие, делающими, делающих, делая, сделав, сделавшего, сделавшей, сделавшему, сделавшие, сделавший, сделавших, сделаем, сделает, сделаете, сделаешь, сделал, сделала, сделали, сделало, сделан, сделана, сделанная, сделанного, сделанное, сделанной, сделанные, сделанный, сделанным, сделанными, сделанных, сделано, сделаны, сделать, сделаю, сделают.
The 2nd highest number of forms (55) was observed with the lemma “писать”: Напишите, Писавшие, Пишите, написав, написавшего, написавший, написал, написала, написали, написало, написан, написана, написанная, написанного, написанное, написанной, написанном, написанную, написанные, написанный, написанным, написанных, написано, написаны, написать, напишет, напишешь, напишу, напишут, писавшим, писал, писала, писалась, писали, писались, писалось, писался, писан, писать, писаться, пишем, пишет, пишете, пишется, пишешь, пиши, пишу, пишут, пишутся, пишущая, пишущего, пишущей, пишущие, пишущих, пописать.
The 3rd highest number of forms (52) was observed with the lemma “брать”: Берется, Возьмите, берем, берет, берете, берешь, бери, берите, беру, берут, берутся, берущей, берущейся, берущем, берущий, берущих, берущую, беря, берёт, бравших, брал, брала, брали, бралось, брать, взяв, взявшая, взявшего, взявший, взял, взяла, взяли, взяло, взят, взята, взято, взятого, взятое, взятую, взяты, взятые, взятый, взятым, взятых, взять, возьмем, возьмет, возьмете, возьмешь, возьми, возьму, возьмут.
VERB
occurs with 14 features: Voice (172396; 100% instances), VerbForm (172385; 100% instances), Aspect (172319; 100% instances), Tense (139422; 81% instances), Number (135138; 78% instances), Mood (111275; 64% instances), Gender (55693; 32% instances), Person (53394; 31% instances), Case (16928; 10% instances), Variant (6939; 4% instances), Animacy (1818; 1% instances), Polarity (398; 0% instances), Abbr (19; 0% instances), Foreign (1; 0% instances)
VERB
occurs with 34 feature-value pairs: Abbr=Yes
, Animacy=Anim
, Animacy=Inan
, Aspect=Imp
, Aspect=Perf
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Foreign=Yes
, Gender=Fem
, Gender=Masc
, Gender=Neut
, Mood=Imp
, Mood=Ind
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, Polarity=Neg
, Tense=Fut
, Tense=Past
, Tense=Pres
, Variant=Short
, VerbForm=Conv
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
, Voice=Act
, Voice=Mid
, Voice=Pass
VERB
occurs with 325 feature combinations.
The most frequent feature combination is Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act
(18664 tokens).
Examples: может, есть, нет, говорит, стоит, идет, имеет, происходит, следует, считает
Relations
VERB
nodes are attached to their parents using 27 different relations: root (61950; 36% instances), conj (26564; 15% instances), xcomp (14628; 8% instances), acl (13910; 8% instances), advcl (13438; 8% instances), parataxis (11679; 7% instances), acl:relcl (8300; 5% instances), csubj (8047; 5% instances), ccomp (6335; 4% instances), amod (4569; 3% instances), obl (1495; 1% instances), fixed (794; 0% instances), appos (247; 0% instances), csubj:pass (215; 0% instances), nsubj (214; 0% instances), nmod (208; 0% instances), orphan (106; 0% instances), obj (42; 0% instances), flat:foreign (34; 0% instances), flat (14; 0% instances), iobj (13; 0% instances), nsubj:pass (11; 0% instances), flat:name (4; 0% instances), dep (3; 0% instances), dislocated (3; 0% instances), advmod (2; 0% instances), compound (1; 0% instances)
Parents of VERB
nodes belong to 17 different parts of speech: (61950; 36% instances), VERB (60184; 35% instances), NOUN (28512; 16% instances), ADJ (9400; 5% instances), ADV (5373; 3% instances), PRON (4354; 3% instances), PROPN (1454; 1% instances), DET (983; 1% instances), PART (279; 0% instances), NUM (234; 0% instances), SYM (34; 0% instances), X (22; 0% instances), INTJ (18; 0% instances), SCONJ (13; 0% instances), ADP (8; 0% instances), CCONJ (6; 0% instances), AUX (2; 0% instances)
7949 (5%) VERB
nodes are leaves.
17797 (10%) VERB
nodes have one child.
26395 (15%) VERB
nodes have two children.
120685 (70%) VERB
nodes have three or more children.
The highest child degree of a VERB
node is 19.
Children of VERB
nodes are attached using 43 different relations: punct (145296; 25% instances), obl (99947; 17% instances), nsubj (80356; 14% instances), advmod (58888; 10% instances), obj (49355; 8% instances), conj (26415; 5% instances), cc (23481; 4% instances), mark (18801; 3% instances), parataxis (14706; 3% instances), xcomp (14030; 2% instances), advcl (11867; 2% instances), iobj (10437; 2% instances), nsubj:pass (9396; 2% instances), ccomp (7352; 1% instances), aux:pass (3403; 1% instances), aux (2756; 0% instances), csubj (2222; 0% instances), obl:tmod (763; 0% instances), obl:agent (613; 0% instances), det (600; 0% instances), discourse (495; 0% instances), fixed (251; 0% instances), csubj:pass (214; 0% instances), flat:foreign (158; 0% instances), case (145; 0% instances), vocative (130; 0% instances), expl (122; 0% instances), acl (114; 0% instances), appos (57; 0% instances), cop (57; 0% instances), amod (42; 0% instances), flat (14; 0% instances), nummod (14; 0% instances), nummod:gov (14; 0% instances), orphan (14; 0% instances), compound (13; 0% instances), nmod (13; 0% instances), acl:relcl (7; 0% instances), flat:name (6; 0% instances), nsubj:outer (4; 0% instances), dislocated (2; 0% instances), nummod:entity (2; 0% instances), dep (1; 0% instances)
Children of VERB
nodes belong to 17 different parts of speech: NOUN (179594; 31% instances), PUNCT (145296; 25% instances), VERB (60184; 10% instances), PRON (53669; 9% instances), ADV (44371; 8% instances), CCONJ (23119; 4% instances), PART (20448; 4% instances), SCONJ (17798; 3% instances), PROPN (16213; 3% instances), ADJ (9116; 2% instances), AUX (6216; 1% instances), NUM (2196; 0% instances), DET (2084; 0% instances), ADP (1362; 0% instances), SYM (699; 0% instances), X (134; 0% instances), INTJ (74; 0% instances)