Treebank Statistics: UD_Russian: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
51179 tokens (51%) have a non-empty value of Gender.
25253 types (84%) occur at least once with a non-empty value of Gender.
15578 lemmas (83%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (27196; 27% instances), ADJ (9591; 10% instances), PROPN (7074; 7% instances), VERB (3835; 4% instances), PRON (1411; 1% instances), DET (851; 1% instances), AUX (620; 1% instances), NUM (601; 1% instances).
NOUN
27196 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (23437; 86%), Number=Sing (20472; 75%).
NOUN tokens may have the following values of Gender:
Fem(8344; 31% of non-emptyGender): области, войны, реки, территории, часть, части, группы, компании, площадь, армииMasc(13648; 50% of non-emptyGender): года, году, лет, человек, год, км, города, г., районе, составNeut(5204; 19% of non-emptyGender): время, население, населения, название, место, начале, качестве, село, времени, даннымEMPTY(55): No, n, C, T, f, i, x, С, AFe, B
| Paradigm WINDOWS | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc|Number=Sing | Windows | ||
| Case=Loc|Number=Plur | Windows | ||
| Case=Nom|Number=Plur | Windows |
Gender seems to be lexical feature of NOUN. 99% lemmas (6313) occur only with one value of Gender.
ADJ
9591 ADJ tokens (78% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (9590; 100%), Animacy=Inan (8715; 91%).
ADJ tokens may have the following values of Gender:
Fem(2743; 29% of non-emptyGender): второй, российской, й, первой, я, отечественной, большую, мировой, новой, центральнойMasc(5119; 53% of non-emptyGender): 2008, 2010, 2004, первый, 2012, 2006, 2009, 2011, 2007, 2001Neut(1729; 18% of non-emptyGender): 1, 12, настоящее, 15, 14, 11, 21, 23, 29, первоеEMPTY(2756): х, других, различных, многие, первые, самых, новые, первых, новых, известных
| Paradigm ПЕРВЫЙ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Gen | первого | первой | |
| Animacy=Anim|Case=Ins | первым | ||
| Animacy=Anim|Case=Nom | первый | ||
| Animacy=Inan|Case=Acc | первый | первую | первое |
| Animacy=Inan|Case=Dat | первому | ||
| Animacy=Inan|Case=Gen | первого | первой | первого |
| Animacy=Inan|Case=Ins | первым | первой | первым |
| Animacy=Inan|Case=Loc | первом | первой | первом |
| Animacy=Inan|Case=Nom | первый | первая | первое |
PROPN
7074 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (6837; 97%), Animacy=Inan (3654; 52%).
PROPN tokens may have the following values of Gender:
Fem(1921; 27% of non-emptyGender): России, Украины, Франции, Германии, Европы, Испании, РФ, Москве, Франция, АнглииMasc(4907; 69% of non-emptyGender): США, СССР, де, Александра, Владимир, Александр, Джон, КОАТУУ, Карл, КрымаNeut(246; 3% of non-emptyGender): ISO, Дубно, Евровидение, Марокко, ЦРУ, IPO, MonaVie, Григорово, Динамо, Домодедово
| Paradigm ДЕ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | де | ||
| Animacy=Anim|Case=Gen | де | ||
| Animacy=Anim|Case=Ins | де | де | |
| Animacy=Anim|Case=Loc | де | ||
| Animacy=Anim|Case=Nom | де | ||
| Animacy=Inan|Case=Loc | Де | ||
| Animacy=Inan|Case=Nom | де |
Gender seems to be lexical feature of PROPN. 99% lemmas (4836) occur only with one value of Gender.
VERB
3835 VERB tokens (46% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (3835; 100%), Person=EMPTY (3835; 100%), Tense=Past (3592; 94%), Variant=EMPTY (3083; 80%), Aspect=Perf (2611; 68%), Animacy=EMPTY (2415; 63%), Case=EMPTY (2415; 63%), Mood=Ind (2415; 63%), VerbForm=Fin (2415; 63%).
VERB tokens may have the following values of Gender:
Fem(933; 24% of non-emptyGender): стала, получила, основана, была, расположена, создана, вошла, появилась, вышла, род.Masc(2303; 60% of non-emptyGender): получил, стал, родился, начал, работал, окончил, участвовал, был, вышел, назначенNeut(599; 16% of non-emptyGender): было, составляло, удалось, стало, привело, расположено, принято, пришлось, проживало, произошлоEMPTY(4589): составляет, может, находится, входит, можно, имеет, есть, занимает, могут, относится
| Paradigm БЫТЬ | Masc | Fem | Neut |
|---|---|---|---|
| был | была | было |
PRON
1411 PRON tokens (73% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (1411; 100%), Person=EMPTY (773; 55%).
PRON tokens may have the following values of Gender:
Fem(265; 19% of non-emptyGender): она, которой, которая, ней, её, неё, которую, ей, нее, ееMasc(647; 46% of non-emptyGender): он, который, его, ему, которого, него, ним, котором, им, нёмNeut(499; 35% of non-emptyGender): это, того, что, тем, том, этом, то, этого, которое, всегоEMPTY(511): которые, они, которых, себя, их, собой, них, я, им, мы
| Paradigm КОТОРЫЙ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | которого, который | которую | |
| Animacy=Anim|Case=Dat | которому | ||
| Animacy=Anim|Case=Gen | которого | которой | |
| Animacy=Anim|Case=Ins | которым | которой | |
| Animacy=Anim|Case=Nom | который | которая | |
| Animacy=Inan|Case=Acc | который | которую | которое, которого |
| Animacy=Inan|Case=Dat | которому | которой | которому |
| Animacy=Inan|Case=Gen | которого | которой | которого |
| Animacy=Inan|Case=Ins | которым | которой | |
| Animacy=Inan|Case=Loc | котором | которой | котором |
| Animacy=Inan|Case=Nom | который | которая | которое |
Gender seems to be lexical feature of PRON. 92% lemmas (12) occur only with one value of Gender.
DET
851 DET tokens (53% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (851; 100%), Person=EMPTY (814; 96%), Animacy=Inan (767; 90%), Reflex=EMPTY (651; 76%).
DET tokens may have the following values of Gender:
Fem(253; 30% of non-emptyGender): своей, свою, этой, эта, всей, эту, н., всю, каждая, каждойMasc(354; 42% of non-emptyGender): этот, этого, свой, the, этом, своего, тот, каждый, весь, томNeut(244; 29% of non-emptyGender): то, это, том, этого, своё, что, свое, всё, своего, тогоEMPTY(747): его, её, их, все, всех, некоторые, эти, этих, своих, свои
| Paradigm ЭТОТ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | этого | ||
| Animacy=Anim|Case=Gen | этого | ||
| Animacy=Anim|Case=Loc | этом | ||
| Animacy=Anim|Case=Nom | этот | ||
| Animacy=Inan|Case=Acc | этот | эту | это |
| Animacy=Inan|Case=Dat | этому | этой | этому |
| Animacy=Inan|Case=Gen | этого | этой, это | этого |
| Animacy=Inan|Case=Ins | этим | этой | этим |
| Animacy=Inan|Case=Loc | этом | этой | этом |
| Animacy=Inan|Case=Nom | этот | эта | это |
AUX
620 AUX tokens (62% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Person=EMPTY (620; 100%), Number=Sing (619; 100%), Tense=Past (617; 100%), Mood=Ind (614; 99%), VerbForm=Fin (614; 99%), Voice=EMPTY (593; 96%), Aspect=Imp (590; 95%).
AUX tokens may have the following values of Gender:
Fem(149; 24% of non-emptyGender): была, стала, являлась, оказалась, песни, явиласьMasc(336; 54% of non-emptyGender): был, являлся, стал, бывшего, бывшим, назначен, оказался, состоял, финишировал, являющегосяNeut(135; 22% of non-emptyGender): было, стало, явилось, являющеесяEMPTY(385): были, является, быть, будет, это, являются, будучи, будут, bin, есть
| Paradigm БЫТЬ | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Gen|VerbForm=Part|Voice=Act | бывшего | ||
| Animacy=Anim|Case=Ins|VerbForm=Part|Voice=Act | бывшим | ||
| Mood=Ind|VerbForm=Fin | был | была | было |
NUM
601 NUM tokens (30% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (601; 100%), Animacy=Inan (485; 81%), Number=Sing (303; 50%).
NUM tokens may have the following values of Gender:
Fem(141; 23% of non-emptyGender): одной, две, одна, двух, одну, 2, 1, обе, двум, двумяMasc(428; 71% of non-emptyGender): один, два, 2, 1, одного, двух, одним, 22, оба, 21Neut(32; 5% of non-emptyGender): одно, одним, одного, 2, два, двух, одном, 1, 12, 22EMPTY(1427): несколько, 10, 4, три, 3, 5, 20, 6, четыре, 16
| Paradigm ОДИН | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | одного | ||
| Animacy=Anim|Case=Dat|Number=Sing | одному | ||
| Animacy=Anim|Case=Gen|Number=Sing | одного | одного | |
| Animacy=Anim|Case=Ins|Number=Sing | одним | одной | |
| Animacy=Anim|Case=Nom|Number=Sing | один | одна | |
| Animacy=Inan|Case=Acc|Number=Sing | один | одну | одно, одного |
| Animacy=Inan|Case=Dat|Number=Sing | одному | одной | |
| Animacy=Inan|Case=Gen|Number=Sing | одного | одной | одного |
| Animacy=Inan|Case=Ins|Number=Sing | одним | одной | одним |
| Animacy=Inan|Case=Loc|Number=Sing | одном | одной | одном |
| Animacy=Inan|Case=Loc|Number=Plur | одних | ||
| Animacy=Inan|Case=Nom|Number=Sing | один | одна | одно |
Gender seems to be lexical feature of NUM. 93% lemmas (124) occur only with one value of Gender.
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (7216; 73%),
NOUN –[conj]–> NOUN (1103; 55%),
PROPN –[flat]–> PROPN (984; 99%),
NOUN –[appos]–> PROPN (843; 67%),
NOUN –[det]–> DET (657; 51%),
NOUN –[acl]–> VERB (514; 53%),
NOUN –[appos]–> NOUN (483; 53%),
VERB –[nsubj]–> PROPN (465; 68%),
PROPN –[conj]–> PROPN (424; 74%),
VERB –[aux:pass]–> AUX (402; 95%).