Treebank Statistics: UD_Russian-GSD: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
50176 tokens (51%) have a non-empty value of Gender.
24612 types (82%) occur at least once with a non-empty value of Gender.
15059 lemmas (80%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (26754; 27% instances), ADJ (9543; 10% instances), PROPN (6584; 7% instances), VERB (3857; 4% instances), PRON (1428; 1% instances), DET (824; 1% instances), NUM (607; 1% instances), AUX (579; 1% instances).
NOUN
26754 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (23057; 86%), Number=Sing (20138; 75%).
NOUN tokens may have the following values of Gender:
Fem(8245; 31% of non-emptyGender): области, войны, реки, территории, часть, части, компании, площадь, армии, группыMasc(13351; 50% of non-emptyGender): года, году, лет, человек, год, км, города, г., районе, составNeut(5158; 19% of non-emptyGender): время, население, населения, название, место, начале, качестве, село, времени, даннымEMPTY(60): No, n, ВЧ, C, T, f, i, x, ЛГБТ, С
| Paradigm год | Masc | Fem |
|---|---|---|
| Animacy=Anim|Case=Loc|Number=Sing | году | |
| Animacy=Inan|Case=Acc|Number=Sing | год, года | |
| Animacy=Inan|Case=Acc|Number=Plur | годы, гг., лет, годов | годы |
| Animacy=Inan|Case=Dat|Number=Sing | году | |
| Animacy=Inan|Case=Dat|Number=Plur | годам, гг. | |
| Animacy=Inan|Case=Gen|Number=Sing | года, г., гг. | |
| Animacy=Inan|Case=Gen|Number=Plur | лет, годов, гг. | |
| Animacy=Inan|Case=Ins|Number=Sing | годом | |
| Animacy=Inan|Case=Ins|Number=Plur | годами | |
| Animacy=Inan|Case=Loc|Number=Sing | году, г. | |
| Animacy=Inan|Case=Loc|Number=Plur | годах, гг., годы | |
| Animacy=Inan|Case=Nom|Number=Sing | год, г. | |
| Animacy=Inan|Case=Nom|Number=Plur | годы, гг. |
Gender seems to be lexical feature of NOUN. 99% lemmas (6039) occur only with one value of Gender.
ADJ
9543 ADJ tokens (78% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (9541; 100%), Degree=Pos (9485; 99%).
ADJ tokens may have the following values of Gender:
Fem(2720; 29% of non-emptyGender): второй, российской, первой, отечественной, большую, мировой, новой, центральной, северной, большаяMasc(5073; 53% of non-emptyGender): 2008, 2010, 2004, первый, 2012, 2006, 2011, 2007, 2009, 2001Neut(1750; 18% of non-emptyGender): 1, 12, настоящее, 15, 14, 11, 21, 23, 29, первоеEMPTY(2730): других, различных, многие, первые, самых, новые, первых, новых, известных, разных
| Paradigm первый | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc | первый | ||
| Case=Acc | первую | первое | |
| Case=Dat | первому | ||
| Case=Gen | первого | первой | первого |
| Case=Ins | первым | первой | первым |
| Case=Loc | первом | первой | первом |
| Case=Nom | первый | первая | первое |
PROPN
6584 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (6382; 97%), Animacy=Anim (3299; 50%).
PROPN tokens may have the following values of Gender:
Fem(1842; 28% of non-emptyGender): России, Украины, Франции, Германии, Европы, Испании, РФ, Москве, Франция, АнглииMasc(4523; 69% of non-emptyGender): США, СССР, Александра, Владимир, Александр, Джон, КОАТУУ, Карл, Крыма, МихаилNeut(219; 3% of non-emptyGender): Дубно, Евровидение, Марокко, ЦРУ, IPO, Борисово, Григорово, Динамо, Домодедово, ЗакарпатьеEMPTY(33): НЧ, В., 154М, 22М, 22Р, 25С, 3О, 400Т, 60К, 60Н
| Paradigm НАТО | Masc | Fem | Neut |
|---|---|---|---|
| Case=Gen | НАТО | НАТО | НАТО |
| Case=Nom | НАТО |
Gender seems to be lexical feature of PROPN. 99% lemmas (4426) occur only with one value of Gender.
VERB
3857 VERB tokens (45% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (3857; 100%), Person=EMPTY (3857; 100%), Tense=Past (3617; 94%), Variant=EMPTY (3106; 81%), Aspect=Perf (2627; 68%), Animacy=EMPTY (2452; 64%), Case=EMPTY (2451; 64%), Mood=Ind (2451; 64%), VerbForm=Fin (2451; 64%), Voice=Act (2153; 56%).
VERB tokens may have the following values of Gender:
Fem(944; 24% of non-emptyGender): стала, получила, основана, была, расположена, создана, вошла, появилась, вышла, род.Masc(2308; 60% of non-emptyGender): стал, получил, родился, начал, работал, окончил, назначен, участвовал, вышел, умерNeut(605; 16% of non-emptyGender): было, составляло, стало, удалось, принято, привело, расположено, пришлось, проживало, произошлоEMPTY(4637): является, составляет, может, находится, входит, можно, имеет, есть, занимает, могут
| Paradigm стать | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Ins|VerbForm=Part|Voice=Act | ставшим | ||
| Animacy=Anim|Case=Nom|VerbForm=Part|Voice=Act | ставший | ||
| Animacy=Inan|Case=Nom|VerbForm=Part|Voice=Act | Ставшая | ||
| Mood=Ind|VerbForm=Fin | стал | стала | стало |
| Mood=Ind|VerbForm=Fin|Voice=Act | стал | стала | стало |
PRON
1428 PRON tokens (74% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (1428; 100%), Person=EMPTY (792; 55%).
PRON tokens may have the following values of Gender:
Fem(264; 18% of non-emptyGender): она, которой, которая, ней, её, неё, которую, ей, нее, ееMasc(647; 45% of non-emptyGender): он, который, его, ему, которого, него, ним, котором, им, нёмNeut(517; 36% of non-emptyGender): это, того, что, тем, том, этом, то, этого, которое, всегоEMPTY(490): которые, они, которых, себя, их, собой, них, я, им, мы
| Paradigm который | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | которого, который | которую | |
| Animacy=Anim|Case=Dat | которому | ||
| Animacy=Anim|Case=Gen | которого | которой | |
| Animacy=Anim|Case=Ins | которым | которой | |
| Animacy=Anim|Case=Nom | который | которая | |
| Animacy=Inan|Case=Acc | который | которую | которое, которого |
| Animacy=Inan|Case=Dat | которому | которой | которому |
| Animacy=Inan|Case=Gen | которого | которой | которого |
| Animacy=Inan|Case=Ins | которым | которой | |
| Animacy=Inan|Case=Loc | котором | которой | котором |
| Animacy=Inan|Case=Nom | который | которая | которое |
Gender seems to be lexical feature of PRON. 94% lemmas (15) occur only with one value of Gender.
DET
824 DET tokens (53% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (824; 100%), Animacy=EMPTY (729; 88%).
DET tokens may have the following values of Gender:
Fem(251; 30% of non-emptyGender): своей, свою, этой, эта, всей, эту, н., всю, каждая, каждойMasc(327; 40% of non-emptyGender): этот, этого, свой, этом, своего, тот, каждый, весь, том, своимNeut(246; 30% of non-emptyGender): то, это, том, этого, своё, свое, что, всё, своего, тогоEMPTY(731): его, её, их, все, всех, некоторые, эти, этих, своих, свои
| Paradigm этот | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | этого | ||
| Animacy=Inan|Case=Acc | этот | ||
| Case=Acc | эту | это | |
| Case=Dat | этому | этой | этому |
| Case=Gen | этого | этой, это | этого |
| Case=Ins | этим | этой | этим |
| Case=Loc | этом | этой | этом |
| Case=Nom | этот | эта | это |
NUM
607 NUM tokens (29% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (590; 97%), Animacy=Inan (493; 81%).
NUM tokens may have the following values of Gender:
Fem(154; 25% of non-emptyGender): одной, две, одна, двух, тыс., одну, 2, 1, обе, двумMasc(423; 70% of non-emptyGender): два, один, 2, 1, двух, одним, одного, 22, оба, 21Neut(30; 5% of non-emptyGender): одно, одним, одного, 2, два, двух, одном, 1, 12, 22EMPTY(1496): несколько, 10, 4, три, 3, 5, 6, 20, четыре, 16
| Paradigm один | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | одного | ||
| Animacy=Anim|Case=Dat|Number=Sing | одному | ||
| Animacy=Anim|Case=Gen|Number=Sing | одного | одного | |
| Animacy=Anim|Case=Ins|Number=Sing | одним | одной | |
| Animacy=Anim|Case=Nom|Number=Sing | один | одна | |
| Animacy=Inan|Case=Acc|Number=Sing | один | одну | одно, одного |
| Animacy=Inan|Case=Dat|Number=Sing | одному | одной | |
| Animacy=Inan|Case=Gen|Number=Sing | одного | одной | одного |
| Animacy=Inan|Case=Ins|Number=Sing | одним | одной | одним |
| Animacy=Inan|Case=Loc|Number=Sing | одном | одной | одном |
| Animacy=Inan|Case=Loc|Number=Plur | одних | ||
| Animacy=Inan|Case=Nom|Number=Sing | один | одна | одно |
Gender seems to be lexical feature of NUM. 93% lemmas (125) occur only with one value of Gender.
AUX
579 AUX tokens (72% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Aspect=Imp (579; 100%), Number=Sing (579; 100%), Tense=Past (579; 100%), Mood=Ind (577; 100%), VerbForm=Fin (577; 100%).
AUX tokens may have the following values of Gender:
Fem(135; 23% of non-emptyGender): былаMasc(315; 54% of non-emptyGender): был, бывшего, бывшимNeut(129; 22% of non-emptyGender): былоEMPTY(229): были, быть, будет, будучи, будут, бы, есть, бывшие
| Paradigm быть | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Gen|VerbForm=Part|Voice=Act | бывшего | ||
| Animacy=Anim|Case=Ins|VerbForm=Part|Voice=Act | бывшим | ||
| Mood=Ind|VerbForm=Fin | был | была | было |
| Mood=Ind|VerbForm=Fin|Voice=Act | был | было |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (7460; 76%),
NOUN –[conj]–> NOUN (1108; 55%),
PROPN –[flat:name]–> PROPN (964; 99%),
NOUN –[appos]–> PROPN (790; 69%),
NOUN –[det]–> DET (656; 51%),
NOUN –[acl]–> VERB (509; 53%),
VERB –[nsubj]–> PROPN (470; 69%),
VERB –[aux:pass]–> AUX (405; 95%),
NOUN –[appos]–> NOUN (404; 52%),
VERB –[nsubj:pass]–> NOUN (388; 71%).