Treebank Statistics: UD_Russian-SynTagRus: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
635498 tokens (42%) have a non-empty value of Gender
.
109813 types (78%) occur at least once with a non-empty value of Gender
.
41810 lemmas (79%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (360669; 24% instances), ADJ (91801; 6% instances), VERB (55679; 4% instances), PROPN (44965; 3% instances), PRON (39232; 3% instances), DET (32356; 2% instances), AUX (6205; 0% instances), NUM (4591; 0% instances).
NOUN
360669 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (311282; 86%), Number=Sing (254830; 71%).
NOUN
tokens may have the following values of Gender
:
Fem
(123813; 34% of non-emptyGender
): жизни, власти, страны, жизнь, деньги, работы, стороны, часть, экономики, странеMasc
(161459; 45% of non-emptyGender
): года, лет, году, человек, раз, людей, люди, человека, случае, годNeut
(75397; 21% of non-emptyGender
): время, дело, времени, развития, государства, место, числе, образования, общества, делеEMPTY
(1724): данным, данные, ВВП, данных, НДС, млрд, НКО, г., СМИ, трлн
Paradigm спецпитание | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | спецпитание | ||
Case=Gen | спецпитания | спецпитания |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (18960) occur only with one value of Gender
.
ADJ
91801 ADJ tokens (65% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (91801; 100%), Degree=Pos (90767; 99%).
ADJ
tokens may have the following values of Gender
:
Fem
(33086; 36% of non-emptyGender
): российской, должна, новой, первую, политической, первой, государственной, большой, новая, второйMasc
(35500; 39% of non-emptyGender
): должен, первый, новый, маленький, второй, нового, главный, последний, первого, большойNeut
(23215; 25% of non-emptyGender
): нужно, известно, невозможно, необходимо, должно, важно, трудно, равно, понятно, последнееEMPTY
(48792): должны, новые, последние, новых, разных, российских, первые, лучше, разные, различных
Paradigm новый | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | нового | ||
Animacy=Inan|Case=Acc | новый | ||
Case=Acc | новую | новое | |
Case=Dat | новому | новой | новому |
Case=Gen | нового | новой | нового |
Case=Ins | новым | новой | новым |
Case=Loc | новом | новой | новом |
Case=Nom | новый | новая | новое |
Variant=Short | нов | нова | ново |
VERB
55679 VERB tokens (32% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (55679; 100%), Person=EMPTY (55679; 100%), Tense=Past (51968; 93%), Mood=Ind (40915; 73%), VerbForm=Fin (40915; 73%), Aspect=Perf (35086; 63%), Voice=Act (33362; 60%).
VERB
tokens may have the following values of Gender
:
Fem
(14736; 26% of non-emptyGender
): стала, сказала, могла, была, оказалась, шла, началась, появилась, начала, пришлаMasc
(29768; 53% of non-emptyGender
): сказал, стал, мог, заявил, говорил, был, видел, знал, оказался, спросилNeut
(11175; 20% of non-emptyGender
): было, стало, удалось, казалось, оказалось, пришлось, произошло, хотелось, могло, прошлоEMPTY
(117172): может, есть, нет, могут, является, быть, говорит, стали, стоит, сказать
Paradigm мочь | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Case=Acc|Tense=Pres|VerbForm=Part | могущую | ||
Aspect=Imp|Case=Nom|Tense=Pres|VerbForm=Part | могущее | ||
Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin | смог | смогла | смогло |
PROPN
44965 PROPN tokens (90% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (44433; 99%), Animacy=Anim (24982; 56%).
PROPN
tokens may have the following values of Gender
:
Fem
(14204; 32% of non-emptyGender
): России, Россия, Москве, Москвы, Германии, Россию, РФ, Европе, Европы, ЗемлиMasc
(29768; 66% of non-emptyGender
): СССР, Путин, Владимир, Сергей, Путина, Александр, Галилей, Медведев, Борис, НиколайNeut
(993; 2% of non-emptyGender
): МВД, Солнца, СНГ, Солнце, Минэкономразвития, НАТО, МЧС, Минобороны, Политбюро, НТВEMPTY
(5215): США, В., А., СССР, М., С., И., Н., РАН, П.
Paradigm Ельцин | Masc | Neut |
---|---|---|
Case=Acc | Ельцина | |
Case=Dat | Ельцину | |
Case=Gen | Ельцина | Ельцина |
Case=Ins | Ельциным | |
Case=Loc | Ельцине | |
Case=Nom | Ельцин |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (7976) occur only with one value of Gender
.
PRON
39232 PRON tokens (59% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (39221; 100%), Person=EMPTY (23347; 60%), Animacy=Inan (20912; 53%).
PRON
tokens may have the following values of Gender
:
Fem
(4633; 12% of non-emptyGender
): она, ее, ней, нее, ей, ею, её, нею, неё, темMasc
(12915; 33% of non-emptyGender
): он, его, ему, кто, него, никто, ним, нем, кого, кто-тоNeut
(21684; 55% of non-emptyGender
): это, что, то, все, того, том, этом, тем, этого, всегоEMPTY
(26942): я, мы, они, их, мне, нас, них, меня, себя, вы
Paradigm то | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | том | то | |
Case=Dat|ExtPos=ADV | тому | ||
Case=Dat|ExtPos=NOUN | т. | ||
Case=Dat | тому, т. | ||
Case=Gen|ExtPos=ADV | того | ||
Case=Gen | того | того | |
Case=Ins|ExtPos=ADV | тем | тем | |
Case=Ins|ExtPos=SCONJ | тем | ||
Case=Ins | тем | тем | |
Case=Loc|ExtPos=PRON | том | ||
Case=Loc|ExtPos=VERB | том | ||
Case=Loc | том | ||
Case=Nom|ExtPos=CCONJ | то, т., т | ||
Case=Nom|ExtPos=PART | то | ||
Case=Nom|ExtPos=SCONJ | то | ||
Case=Nom | то |
Gender
seems to be lexical feature of PRON
. 93% lemmas (26) occur only with one value of Gender
.
DET
32356 DET tokens (59% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (32354; 100%), Poss=EMPTY (26441; 82%).
DET
tokens may have the following values of Gender
:
Fem
(11415; 35% of non-emptyGender
): этой, которая, своей, свою, которой, эта, эту, нашей, другой, которуюMasc
(13067; 40% of non-emptyGender
): который, этот, тот, сам, этом, этого, такой, каждый, свой, такимNeut
(7874; 24% of non-emptyGender
): это, все, такое, то, том, которое, свое, самом, самое, этогоEMPTY
(22389): его, которые, все, их, эти, ее, которых, всех, тех, других
Paradigm этот | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | этого | ||
Animacy=Inan|Case=Acc | этот | ||
Case=Acc | этот, это | эту | это |
Case=Dat | этому | этой | этому |
Case=Gen | этого | этой | этого |
Case=Ins | этим | этой | этим |
Case=Loc | этом | этой | этом |
Case=Nom | этот | эта | это |
AUX
6205 AUX tokens (45% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Number=Sing (6205; 100%), Person=EMPTY (6205; 100%), Tense=Past (6205; 100%), Voice=Act (6205; 100%), Mood=Ind (6200; 100%), VerbForm=Fin (6200; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(1396; 22% of non-emptyGender
): былаMasc
(2278; 37% of non-emptyGender
): был, бывший, бывшемNeut
(2531; 41% of non-emptyGender
): былоEMPTY
(7535): бы, были, будет, быть, будут, есть, будем, буду, будучи, будь
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
Case=Loc|VerbForm=Part | бывшем | ||
Case=Nom|VerbForm=Part | бывший | ||
Mood=Ind|VerbForm=Fin | был | была | было |
NUM
4591 NUM tokens (26% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (4591; 100%), NumType=Card (4500; 98%), Animacy=EMPTY (3670; 80%), Number=Sing (2695; 59%).
NUM
tokens may have the following values of Gender
:
Fem
(1521; 33% of non-emptyGender
): одной, две, одна, одну, двух, обе, двумя, обеих, двум, обеимиMasc
(2532; 55% of non-emptyGender
): один, два, одного, двух, одним, одном, полтора, оба, двумя, одномуNeut
(538; 12% of non-emptyGender
): одно, два, одним, одного, двух, одном, одному, оба, двумя, полтораEMPTY
(13318): несколько, три, 1, 10, 20, 2, 15, 5, 3, четыре
Paradigm один | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | одного | ||
Animacy=Inan|Case=Acc|ExtPos=NUM | один | ||
Animacy=Inan|Case=Acc | один | ||
Case=Acc|ExtPos=ADV | один | ||
Case=Acc|ExtPos=NUM | одну | ||
Case=Acc|ExtPos=PRON | одну | одно | |
Case=Acc | одну | одно | |
Case=Dat | одному | одной | одному |
Case=Gen|ExtPos=NUM | одного | ||
Case=Gen | одного | одной | одного |
Case=Ins | одним, одними | одной, одною | одним |
Case=Loc|ExtPos=NUM | одном | одной | |
Case=Loc | одном | одной | одном |
Case=Nom|ExtPos=NUM | один | одна | Одно |
Case=Nom|ExtPos=PRON | один | ||
Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (69187; 65%),
NOUN –[det]–> DET (21824; 58%),
PROPN –[flat:name]–> PROPN (5762; 85%),
VERB –[conj]–> VERB (5528; 55%),
VERB –[nsubj]–> PROPN (4609; 67%),
NOUN –[appos]–> PROPN (4254; 75%),
ADJ –[nsubj]–> NOUN (3609; 62%),
ADJ –[conj]–> ADJ (3359; 94%),
NOUN –[amod]–> VERB (2683; 61%),
NOUN –[appos]–> NOUN (2066; 58%).