Gender
: gender
Gender is a lexical feature of nouns and inflectional feature of other parts of speech (adjectives, verbs) that mark agreement with nouns. There are three values of gender: masculine, feminine, and neuter.
See also the related feature of Animacy.
Masc
: masculine gender
Nouns denoting male persons are masculine. Other nouns may be also grammatically masculine, without any relation to sex.
Examples
- мужчина “man”
- замок “castle”
- грузовик “truck”
- председатель “chairman”
- судья “judge”
Fem
: feminine gender
Nouns denoting female persons are feminine. Other nouns may be also grammatically feminine, without any relation to sex.
Examples
- женщина “woman”
- роза “rose”
- песня “song”
- кость “bone”
Neut
: neuter gender
This third gender is for nouns that are neither masculine nor feminine (grammatically). Nouns whose nominative suffix is -о or -е (including a large group of deverbative nouns denoting actions) are usually neuter.
Examples
- место “place”
- море “sea”
- мясо “meat”
- здание “building”
Treebank Statistics (UD_Russian)
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
51180 tokens (51%) have a non-empty value of Gender
.
25253 types (84%) occur at least once with a non-empty value of Gender
.
15578 lemmas (83%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: ru-pos/NOUN (27197; 27% instances), ru-pos/ADJ (9591; 10% instances), ru-pos/PROPN (7074; 7% instances), ru-pos/VERB (4010; 4% instances), ru-pos/PRON (1412; 1% instances), ru-pos/DET (851; 1% instances), ru-pos/NUM (601; 1% instances), ru-pos/AUX (444; 0% instances).
NOUN
27197 ru-pos/NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (23438; 86%), Number=Sing (20473; 75%).
NOUN
tokens may have the following values of Gender
:
Fem
(8344; 31% of non-emptyGender
): области, войны, реки, территории, часть, части, группы, компании, площадь, армииMasc
(13649; 50% of non-emptyGender
): года, году, лет, человек, год, км, города, г., районе, составNeut
(5204; 19% of non-emptyGender
): время, население, населения, название, место, начале, качестве, село, времени, даннымEMPTY
(55): No, n, C, T, f, i, x, С, AFe, B
Paradigm WINDOWS | Masc | Fem | Neut |
---|---|---|---|
Case=Acc|Number=Sing | Windows | ||
Case=Loc|Number=Plur | Windows | ||
Case=Nom|Number=Plur | Windows |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (6314) occur only with one value of Gender
.
ADJ
9591 ru-pos/ADJ tokens (78% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (9590; 100%), Animacy=Inan (8715; 91%), Variant=Full (6889; 72%).
ADJ
tokens may have the following values of Gender
:
Fem
(2743; 29% of non-emptyGender
): второй, российской, й, первой, я, отечественной, большую, мировой, новой, центральнойMasc
(5119; 53% of non-emptyGender
): 2008, 2010, 2004, первый, 2012, 2006, 2009, 2011, 2007, 2001Neut
(1729; 18% of non-emptyGender
): 1, 12, настоящее, 15, 14, 11, 21, 23, 29, первоеEMPTY
(2754): х, других, различных, многие, первые, самых, новые, первых, новых, известных
Paradigm ПЕРВЫЙ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Gen | первого | первой | |
Animacy=Anim|Case=Ins | первым | ||
Animacy=Anim|Case=Nom | первый | ||
Animacy=Inan|Case=Acc | первый | первую | первое |
Animacy=Inan|Case=Dat | первому | ||
Animacy=Inan|Case=Gen | первого | первой | первого |
Animacy=Inan|Case=Ins | первым | первой | первым |
Animacy=Inan|Case=Loc | первом | первой | первом |
Animacy=Inan|Case=Nom | первый | первая | первое |
PROPN
7074 ru-pos/PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (6837; 97%), Animacy=Inan (3654; 52%).
PROPN
tokens may have the following values of Gender
:
Fem
(1921; 27% of non-emptyGender
): России, Украины, Франции, Германии, Европы, Испании, РФ, Москве, Франция, АнглииMasc
(4907; 69% of non-emptyGender
): США, СССР, де, Александра, Владимир, Александр, Джон, КОАТУУ, Карл, КрымаNeut
(246; 3% of non-emptyGender
): ISO, Дубно, Евровидение, Марокко, ЦРУ, IPO, MonaVie, Григорово, Динамо, Домодедово
Paradigm ДЕ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | де | ||
Animacy=Anim|Case=Gen | де | ||
Animacy=Anim|Case=Ins | де | де | |
Animacy=Anim|Case=Loc | де | ||
Animacy=Anim|Case=Nom | де | ||
Animacy=Inan|Case=Loc | Де | ||
Animacy=Inan|Case=Nom | де |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (4836) occur only with one value of Gender
.
VERB
4010 ru-pos/VERB tokens (46% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (4010; 100%), Person=EMPTY (4010; 100%), Tense=Past (3765; 94%), Variant=EMPTY (3257; 81%), Aspect=Perf (2640; 66%), Animacy=EMPTY (2587; 65%), VerbForm=Fin (2587; 65%), Mood=Ind (2587; 65%), Case=EMPTY (2587; 65%), Voice=EMPTY (2587; 65%).
VERB
tokens may have the following values of Gender
:
Fem
(975; 24% of non-emptyGender
): была, стала, получила, основана, расположена, создана, вошла, появилась, вышла, род.Masc
(2405; 60% of non-emptyGender
): был, стал, получил, родился, начал, работал, окончил, назначен, участвовал, вышелNeut
(630; 16% of non-emptyGender
): было, составляло, стало, удалось, привело, расположено, принято, пришлось, проживало, произошлоEMPTY
(4770): является, составляет, были, может, находится, входит, можно, имеет, есть, занимает
Paradigm БЫТЬ | Masc | Fem | Neut |
---|---|---|---|
был | была | было |
PRON
1412 ru-pos/PRON tokens (74% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (1412; 100%), Person=EMPTY (774; 55%).
PRON
tokens may have the following values of Gender
:
Fem
(265; 19% of non-emptyGender
): она, которой, которая, ней, её, неё, которую, ей, нее, ееMasc
(647; 46% of non-emptyGender
): он, который, его, ему, которого, него, ним, котором, им, нёмNeut
(500; 35% of non-emptyGender
): это, того, что, тем, том, этом, то, этого, которое, всегоEMPTY
(503): которые, они, которых, себя, их, собой, них, я, им, мы
Paradigm КОТОРЫЙ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | которого, который | которую | |
Animacy=Anim|Case=Dat | которому | ||
Animacy=Anim|Case=Gen | которого | которой | |
Animacy=Anim|Case=Ins | которым | которой | |
Animacy=Anim|Case=Nom | который | которая | |
Animacy=Inan|Case=Acc | который | которую | которое, которого |
Animacy=Inan|Case=Dat | которому | которой | которому |
Animacy=Inan|Case=Gen | которого | которой | которого |
Animacy=Inan|Case=Ins | которым | которой | |
Animacy=Inan|Case=Loc | котором | которой | котором |
Animacy=Inan|Case=Nom | который | которая | которое |
Gender
seems to be lexical feature of PRON
. 92% lemmas (12) occur only with one value of Gender
.
DET
851 ru-pos/DET tokens (53% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (851; 100%), Person=EMPTY (814; 96%), Animacy=Inan (767; 90%), Reflex=EMPTY (651; 76%).
DET
tokens may have the following values of Gender
:
Fem
(253; 30% of non-emptyGender
): своей, свою, этой, эта, всей, эту, н., всю, каждая, каждойMasc
(354; 42% of non-emptyGender
): этот, этого, свой, the, этом, своего, тот, каждый, весь, томNeut
(244; 29% of non-emptyGender
): то, это, том, этого, своё, что, свое, всё, своего, тогоEMPTY
(747): его, её, их, все, всех, некоторые, эти, этих, своих, свои
Paradigm ЭТОТ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | этого | ||
Animacy=Anim|Case=Gen | этого | ||
Animacy=Anim|Case=Loc | этом | ||
Animacy=Anim|Case=Nom | этот | ||
Animacy=Inan|Case=Acc | этот | эту | это |
Animacy=Inan|Case=Dat | этому | этой | этому |
Animacy=Inan|Case=Gen | этого | этой, это | этого |
Animacy=Inan|Case=Ins | этим | этой | этим |
Animacy=Inan|Case=Loc | этом | этой | этом |
Animacy=Inan|Case=Nom | этот | эта | это |
NUM
601 ru-pos/NUM tokens (30% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Animacy=Inan (485; 81%), Number=Sing (303; 50%).
NUM
tokens may have the following values of Gender
:
Fem
(141; 23% of non-emptyGender
): одной, две, одна, двух, одну, 2, 1, обе, двум, двумяMasc
(428; 71% of non-emptyGender
): один, два, 2, 1, одного, двух, одним, 22, оба, 21Neut
(32; 5% of non-emptyGender
): одно, одним, одного, 2, два, двух, одном, 1, 12, 22EMPTY
(1427): несколько, 10, 4, три, 3, 5, 20, 6, четыре, 16
Paradigm ОДИН | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | одного | ||
Animacy=Anim|Case=Dat|Number=Sing | одному | ||
Animacy=Anim|Case=Gen|Number=Sing | одного | одного | |
Animacy=Anim|Case=Ins|Number=Sing | одним | одной | |
Animacy=Anim|Case=Nom|Number=Sing | один | одна | |
Animacy=Inan|Case=Acc|Number=Sing | один | одну | одно, одного |
Animacy=Inan|Case=Dat|Number=Sing | одному | одной | |
Animacy=Inan|Case=Gen|Number=Sing | одного | одной | одного |
Animacy=Inan|Case=Ins|Number=Sing | одним | одной | одним |
Animacy=Inan|Case=Loc|Number=Sing | одном | одной | одном |
Animacy=Inan|Case=Loc|Number=Plur | одних | ||
Animacy=Inan|Case=Nom|Number=Sing | один | одна | одно |
Gender
seems to be lexical feature of NUM
. 93% lemmas (124) occur only with one value of Gender
.
AUX
444 ru-pos/AUX tokens (72% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (444; 100%), Tense=Past (444; 100%), Number=Sing (444; 100%), VerbForm=Fin (442; 100%), Mood=Ind (442; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(106; 24% of non-emptyGender
): былаMasc
(234; 53% of non-emptyGender
): был, бывшего, бывшимNeut
(104; 23% of non-emptyGender
): былоEMPTY
(176): были, быть, будет, будут, будучи, Be, Don, Has, est, re
Paradigm БЫТЬ | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Gen|VerbForm=Part|Voice=Act | бывшего | ||
Animacy=Anim|Case=Ins|VerbForm=Part|Voice=Act | бывшим | ||
Mood=Ind|VerbForm=Fin | был | была | было |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (7454; 73%),
NOUN –[conj]–> NOUN (1019; 55%),
PROPN –[name]–> PROPN (987; 99%),
NOUN –[appos]–> PROPN (869; 67%),
NOUN –[det]–> DET (662; 52%),
NOUN –[acl]–> VERB (518; 53%),
NOUN –[appos]–> NOUN (479; 52%),
VERB –[nsubj]–> PROPN (456; 68%),
PROPN –[conj]–> PROPN (428; 74%),
VERB –[auxpass]–> AUX (401; 95%).
Treebank Statistics (UD_Russian-SynTagRus)
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
439285 tokens (41%) have a non-empty value of Gender
.
88407 types (78%) occur at least once with a non-empty value of Gender
.
33405 lemmas (80%) occur at least once with a non-empty value of Gender
.
The feature is used with 7 part-of-speech tags: ru-pos/NOUN (269867; 25% instances), ru-pos/ADJ (76038; 7% instances), ru-pos/PROPN (36956; 3% instances), ru-pos/VERB (36725; 3% instances), ru-pos/DET (12735; 1% instances), ru-pos/AUX (4089; 0% instances), ru-pos/NUM (2875; 0% instances).
NOUN
269867 ru-pos/NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (233902; 87%), Number=Sing (191750; 71%).
NOUN
tokens may have the following values of Gender
:
Fem
(88255; 33% of non-emptyGender
): жизни, власти, страны, деньги, работы, системы, жизнь, экономики, стране, частьMasc
(116701; 43% of non-emptyGender
): года, лет, году, человек, люди, людей, раз, человека, случае, вопросNeut
(64911; 24% of non-emptyGender
): это, время, того, том, этом, все, то, тем, этого, делоEMPTY
(1375): все, тех, всех, данным, те, данные, всем, данных, тем, данными
Paradigm то | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | то | ||
Case=Dat | тому | ||
Case=Gen | того | того | |
Case=Ins | тем | тем | |
Case=Loc | том | ||
Case=Nom | то |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (16405) occur only with one value of Gender
.
ADJ
76038 ru-pos/ADJ tokens (66% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (76038; 100%), Degree=Pos (75767; 100%).
ADJ
tokens may have the following values of Gender
:
Fem
(27335; 36% of non-emptyGender
): которая, которой, российской, которую, должна, другой, новой, самой, государственной, политическойMasc
(29630; 39% of non-emptyGender
): который, сам, должен, первый, которого, новый, самый, другой, котором, новогоNeut
(19073; 25% of non-emptyGender
): нужно, которое, самом, известно, необходимо, самое, невозможно, должно, важно, трудноEMPTY
(39791): которые, которых, других, многие, должны, другие, новые, многих, последние, сами
Paradigm который | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | которого | ||
Animacy=Inan|Case=Acc | который | которые | |
Case=Acc | которую | которое | |
Case=Dat | которому | которой | которому |
Case=Gen | которого | которой | которого |
Case=Ins | которым | которой | которым |
Case=Loc | котором | которой | котором |
Case=Nom | который | которая | которое |
PROPN
36956 ru-pos/PROPN tokens (93% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (35808; 97%), Animacy=Inan (19202; 52%).
PROPN
tokens may have the following values of Gender
:
Fem
(11191; 30% of non-emptyGender
): России, Россия, Москве, Москвы, РФ, Германии, Россию, Земли, Европе, РАНMasc
(24017; 65% of non-emptyGender
): СССР, В., Путин, А., Владимир, Путина, Сергей, Александр, Института, М.Neut
(1748; 5% of non-emptyGender
): СМИ, РИА, МВД, СНГ, Солнца, МЧС, НАТО, Солнце, Минэкономразвития, ИТEMPTY
(2727): США, MBA, FIA, ButtKicker, PM, RoboCup, IT, FOXP2, Weta, XGR
Paradigm gongo | Masc | Fem | Neut |
---|---|---|---|
Case=Gen|Number=Sing | GONGO | ||
Case=Ins|Number=Plur | GONGO | ||
Case=Nom|Number=Plur | GONGO |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (7462) occur only with one value of Gender
.
VERB
36725 ru-pos/VERB tokens (30% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (36725; 100%), Person=EMPTY (36725; 100%), Tense=Past (33933; 92%), Case=EMPTY (29549; 80%), Voice=Act (28776; 78%), Mood=Ind (25810; 70%), VerbForm=Fin (25810; 70%), Aspect=Perf (23217; 63%).
VERB
tokens may have the following values of Gender
:
Fem
(9621; 26% of non-emptyGender
): стала, могла, сказала, была, оказалась, появилась, шла, началась, окружающей, пришлаMasc
(19188; 52% of non-emptyGender
): стал, сказал, мог, заявил, был, сообщил, говорил, оказался, видел, началNeut
(7916; 22% of non-emptyGender
): было, стало, удалось, оказалось, казалось, произошло, пришлось, могло, выяснилось, связаноEMPTY
(83745): может, есть, нет, могут, является, быть, говорит, стоит, стали, сделать
Paradigm мочь | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Case=Acc|Tense=Pres|VerbForm=Part | могущую | ||
Aspect=Imp|Case=Nom|Tense=Pres|VerbForm=Part | могущее | ||
Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin | смог | смогла | смогло |
DET
12735 ru-pos/DET tokens (59% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (12735; 100%).
DET
tokens may have the following values of Gender
:
Fem
(4719; 37% of non-emptyGender
): этой, своей, свою, эта, нашей, эту, всей, такой, такая, всюMasc
(4823; 38% of non-emptyGender
): этот, этом, этого, свой, таким, своего, такой, каждый, наш, тотNeut
(3193; 25% of non-emptyGender
): это, все, том, свое, то, этого, такое, этом, своего, нашеEMPTY
(8984): его, их, все, эти, ее, всех, свои, этих, своих, таких
Paradigm этот | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | этот, этого, это | эту | это |
Case=Dat | этому | этой | этому |
Case=Gen | этого | этой | этого |
Case=Ins | этим | этой | этим |
Case=Loc | этом | этой | этом |
Case=Nom | этот | эта | это |
AUX
4089 ru-pos/AUX tokens (51% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Number=Sing (4089; 100%), Person=EMPTY (4089; 100%), Voice=Act (4089; 100%), Tense=Past (4089; 100%), Aspect=Imp (4089; 100%), Mood=Ind (4086; 100%), VerbForm=Fin (4086; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(918; 22% of non-emptyGender
): былаMasc
(1512; 37% of non-emptyGender
): был, бывший, бывшемNeut
(1659; 41% of non-emptyGender
): былоEMPTY
(3927): были, будет, быть, будут, есть, будем, буду, будучи, будь, будете
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
Case=Loc|VerbForm=Part | бывшем | ||
Case=Nom|VerbForm=Part | бывший | ||
Mood=Ind|VerbForm=Fin | был | была | было |
NUM
2875 ru-pos/NUM tokens (18% of all NUM
tokens) have a non-empty value of Gender
.
NUM
tokens may have the following values of Gender
:
Fem
(929; 32% of non-emptyGender
): одной, две, одна, одну, обе, обеих, обеим, обеими, двух, полторыMasc
(1608; 56% of non-emptyGender
): один, два, одного, одним, одном, полтора, одному, оба, обоих, двухNeut
(338; 12% of non-emptyGender
): одно, два, одним, одного, одном, одному, оба, полтора, обоихEMPTY
(13139): несколько, три, 1, 10, двух, 20, 2, 15, 5, 3
Paradigm один | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | одного | ||
Animacy=Inan|Case=Acc | один | ||
Case=Acc | одну | одно | |
Case=Dat | одному | одной | одному |
Case=Gen | одного | одной | одного |
Case=Ins | одним | одной | одним |
Case=Loc | одном | одной | одном |
Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (54026; 66%),
NOUN –[det]–> DET (12483; 59%),
NOUN –[amod]–> VERB (5837; 56%),
PROPN –[name]–> PROPN (5180; 100%),
NOUN –[appos]–> PROPN (4169; 81%),
ADJ –[nsubj]–> NOUN (3484; 65%),
VERB –[conj]–> VERB (3282; 54%),
ADJ –[conj]–> ADJ (2688; 95%),
VERB –[nsubj]–> PROPN (2418; 59%),
PROPN –[amod]–> ADJ (1851; 90%).
Gender in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]