Treebank Statistics: UD_Russian-SynTagRus: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
629742 tokens (42%) have a non-empty value of Gender
.
110073 types (78%) occur at least once with a non-empty value of Gender
.
42366 lemmas (81%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (358921; 24% instances), ADJ (95431; 6% instances), VERB (55693; 4% instances), PROPN (49816; 3% instances), PRON (35076; 2% instances), DET (24512; 2% instances), AUX (6196; 0% instances), NUM (4097; 0% instances).
NOUN
358921 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (309383; 86%), Number=Sing (253320; 71%).
NOUN
tokens may have the following values of Gender
:
Fem
(123098; 34% of non-emptyGender
): жизни, власти, страны, жизнь, деньги, работы, стороны, часть, экономики, странеMasc
(160545; 45% of non-emptyGender
): года, лет, году, человек, раз, людей, люди, человека, случае, годNeut
(75278; 21% of non-emptyGender
): время, дело, времени, развития, государства, место, числе, образования, деле, обществаEMPTY
(1106): данным, данные, данных, млрд, г., СМИ, трлн, ВВП, данными, км
Paradigm о | Masc | Fem | Neut |
---|---|---|---|
Case=Acc|Number=Sing | о | ||
Case=Acc|Number=Plur | о. | ||
Case=Nom|Number=Sing | О | о |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (18953) occur only with one value of Gender
.
ADJ
95431 ADJ tokens (65% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (95431; 100%), Degree=Pos (94911; 99%).
ADJ
tokens may have the following values of Gender
:
Fem
(34160; 36% of non-emptyGender
): российской, должна, новой, другой, первую, политической, первой, самой, государственной, большойMasc
(36983; 39% of non-emptyGender
): должен, первый, сам, новый, маленький, второй, самый, другой, нового, главныйNeut
(24288; 25% of non-emptyGender
): нужно, известно, невозможно, необходимо, должно, самом, важно, трудно, самое, равноEMPTY
(50301): других, должны, другие, новые, последние, новых, разных, сами, российских, первые
Paradigm новый | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Degree=Pos | нового | ||
Animacy=Inan|Case=Acc|Degree=Pos | новый | ||
Case=Acc|Degree=Pos | новую | новое | |
Case=Acc|Degree=Sup | новейшую | новейшее | |
Case=Dat|Degree=Pos | новому | новой | новому |
Case=Gen|Degree=Pos | нового | новой | нового |
Case=Gen|Degree=Sup | новейшего | ||
Case=Ins|Degree=Pos | новым | новой | новым |
Case=Ins|Degree=Sup | новейшей | новейшим | |
Case=Loc|Degree=Pos | новом | новой | новом |
Case=Loc|Degree=Sup | новейшем | новейшей | |
Case=Nom|Degree=Pos | новый | новая | новое |
Case=Nom|Degree=Sup | новейшая | новейшее | |
Degree=Pos|Variant=Short | нов | нова | ново |
VERB
55693 VERB tokens (32% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (55693; 100%), Person=EMPTY (55693; 100%), Tense=Past (51982; 93%), Mood=Ind (40924; 73%), VerbForm=Fin (40924; 73%), Aspect=Perf (35091; 63%), Voice=Act (33371; 60%).
VERB
tokens may have the following values of Gender
:
Fem
(14736; 26% of non-emptyGender
): стала, сказала, могла, была, оказалась, шла, началась, появилась, начала, пришлаMasc
(29768; 53% of non-emptyGender
): сказал, стал, мог, заявил, говорил, был, видел, знал, оказался, спросилNeut
(11189; 20% of non-emptyGender
): было, стало, удалось, казалось, оказалось, пришлось, произошло, хотелось, могло, прошлоEMPTY
(117133): может, есть, нет, могут, является, быть, говорит, стали, стоит, сказать
Paradigm мочь | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Case=Acc|Tense=Pres|VerbForm=Part | могущую | ||
Aspect=Imp|Case=Nom|Tense=Pres|VerbForm=Part | могущее | ||
Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin | смог | смогла | смогло |
PROPN
49816 PROPN tokens (89% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (48942; 98%), Animacy=Anim (26589; 53%).
PROPN
tokens may have the following values of Gender
:
Fem
(15340; 31% of non-emptyGender
): России, Россия, Москве, Москвы, Германии, Россию, РФ, Европе, Европы, ЗемлиMasc
(32940; 66% of non-emptyGender
): СССР, Путин, Владимир, В., Сергей, А., Путина, Александр, Института, ГалилейNeut
(1536; 3% of non-emptyGender
): РИА, МВД, Солнца, СНГ, Солнце, Минэкономразвития, НАТО, МЧС, Министерства, МинистерствоEMPTY
(5939): США, СССР, РАН, С., РФ, А., Южной, НАТО, Б., Западной
Paradigm GONGO | Masc | Fem | Neut |
---|---|---|---|
Case=Gen|Number=Sing | GONGO | ||
Case=Ins|Number=Plur | GONGO | ||
Case=Nom|Number=Plur | GONGO |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (8578) occur only with one value of Gender
.
PRON
35076 PRON tokens (48% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (35073; 100%), Person=EMPTY (19190; 55%).
PRON
tokens may have the following values of Gender
:
Fem
(5067; 14% of non-emptyGender
): она, ее, ней, нее, ей, которая, которой, которую, ею, еёMasc
(11897; 34% of non-emptyGender
): он, его, ему, него, который, ним, кто, нем, им, никтоNeut
(18112; 52% of non-emptyGender
): это, то, все, того, том, этом, что, тем, этого, всегоEMPTY
(37869): я, мы, они, что, которые, их, мне, нас, них, меня
Paradigm который | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | которого | ||
Animacy=Inan|Case=Acc | который | ||
Case=Acc | которую | которое | |
Case=Dat | которому | которой | которому |
Case=Gen | которого | которой | которого |
Case=Ins | которым | которой | которым |
Case=Loc | котором | которой | котором |
Case=Nom | который | которая | которое |
DET
24512 DET tokens (60% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (24510; 100%), Poss=EMPTY (20550; 84%).
DET
tokens may have the following values of Gender
:
Fem
(8661; 35% of non-emptyGender
): этой, своей, свою, эта, эту, нашей, такой, такая, той, всейMasc
(9661; 39% of non-emptyGender
): этот, тот, этом, этого, такой, каждый, свой, таким, своего, мойNeut
(6190; 25% of non-emptyGender
): это, все, такое, то, том, свое, этого, этом, своего, нашеEMPTY
(16627): его, все, их, эти, ее, всех, тех, свои, этих, те
Paradigm этот | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | этого | ||
Animacy=Inan|Case=Acc | этот | ||
Case=Acc | эту | это | |
Case=Acc|PronType=Dem | этот, этого, это | эту | это |
Case=Dat | этому | этой | этому |
Case=Dat|PronType=Dem | этому | этой | этому |
Case=Gen | этого | этой | этого |
Case=Gen|PronType=Dem | этого | этой | этого |
Case=Ins | этим | этой | этим |
Case=Ins|PronType=Dem | этим | этой | этим |
Case=Loc | этом | этой | этом |
Case=Loc|PronType=Dem | этом | этой | этом |
Case=Nom | этот | эта | это |
Case=Nom|PronType=Dem | этот | эта | это |
AUX
6196 AUX tokens (45% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (6196; 100%), Number=Sing (6196; 100%), Person=EMPTY (6196; 100%), Tense=Past (6196; 100%), Voice=Act (6196; 100%), Mood=Ind (6191; 100%), VerbForm=Fin (6191; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(1396; 23% of non-emptyGender
): былаMasc
(2278; 37% of non-emptyGender
): был, бывший, бывшемNeut
(2522; 41% of non-emptyGender
): былоEMPTY
(7531): бы, были, будет, быть, будут, есть, будем, буду, будучи, будь
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
Case=Loc|VerbForm=Part | бывшем | ||
Case=Nom|VerbForm=Part | бывший | ||
Mood=Ind|VerbForm=Fin | был | была | было |
NUM
4097 NUM tokens (21% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Animacy=EMPTY (3177; 78%), NumType=Card (2992; 73%).
NUM
tokens may have the following values of Gender
:
Fem
(1338; 33% of non-emptyGender
): одной, две, одна, одну, обе, обеих, двух, обеими, обеим, полторыMasc
(2273; 55% of non-emptyGender
): один, два, одного, одним, одном, полтора, оба, одному, обоих, двухNeut
(486; 12% of non-emptyGender
): одно, два, одним, одного, одном, одному, оба, полтора, обоихEMPTY
(15334): несколько, три, многие, 1, 10, двух, 20, 2, 15, многих
Paradigm один | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | одного | ||
Animacy=Anim|Case=Acc|NumType=Card | одного | ||
Animacy=Inan|Case=Acc | один | ||
Animacy=Inan|Case=Acc|Number=Sing | один | ||
Animacy=Inan|Case=Acc|NumType=Card | один | ||
Case=Acc | одну | одно | |
Case=Acc|Number=Sing | один | ||
Case=Acc|NumType=Card | одну | одно | |
Case=Dat | одному | одной | одному |
Case=Dat|NumType=Card | одному | одной | одному |
Case=Gen | одного | одной | одного |
Case=Gen|NumType=Card | одного | одной | одного |
Case=Ins | одним | одной, одною | одним |
Case=Ins|NumType=Card | одним | одной | одним |
Case=Loc | одном | одной | одном |
Case=Loc|NumType=Card | одном | одной | одном |
Case=Nom | один | одна | одно |
Case=Nom|NumType=Card | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (70123; 65%),
NOUN –[det]–> DET (20216; 59%),
PROPN –[flat:name]–> PROPN (7056; 97%),
VERB –[conj]–> VERB (5528; 55%),
VERB –[nsubj]–> PROPN (4797; 66%),
NOUN –[appos]–> PROPN (4552; 79%),
ADJ –[nsubj]–> NOUN (3751; 62%),
ADJ –[conj]–> ADJ (3393; 94%),
NOUN –[amod]–> VERB (2669; 61%),
PROPN –[amod]–> ADJ (2208; 92%).