Treebank Statistics: UD_Russian-SynTagRus: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
633970 tokens (42%) have a non-empty value of Gender.
110069 types (78%) occur at least once with a non-empty value of Gender.
41705 lemmas (79%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (359763; 24% instances), ADJ (92822; 6% instances), VERB (55675; 4% instances), PROPN (43362; 3% instances), PRON (39190; 3% instances), DET (32357; 2% instances), AUX (6210; 0% instances), NUM (4591; 0% instances).
NOUN
359763 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (310448; 86%), Number=Sing (254111; 71%).
NOUN tokens may have the following values of Gender:
Fem(123639; 34% of non-emptyGender): жизни, власти, страны, жизнь, деньги, работы, стороны, часть, экономики, странеMasc(161073; 45% of non-emptyGender): года, лет, году, человек, раз, людей, люди, человека, случае, годNeut(75051; 21% of non-emptyGender): время, дело, времени, развития, государства, место, числе, образования, общества, делеEMPTY(2281): данным, данные, ВВП, СМИ, данных, НДС, млрд, РИА, ЕГЭ, НКО
| Paradigm спецпитание | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | спецпитание | ||
| Case=Gen | спецпитания | спецпитания |
Gender seems to be lexical feature of NOUN. 100% lemmas (18759) occur only with one value of Gender.
ADJ
92822 ADJ tokens (66% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (92822; 100%), Degree=Pos (91388; 98%).
ADJ tokens may have the following values of Gender:
Fem(33513; 36% of non-emptyGender): российской, должна, новой, первую, политической, первой, большой, государственной, новая, второйMasc(35891; 39% of non-emptyGender): должен, первый, новый, маленький, второй, нового, главный, последний, первого, большойNeut(23418; 25% of non-emptyGender): нужно, известно, невозможно, необходимо, должно, важно, трудно, равно, понятно, последнееEMPTY(48839): должны, новые, последние, новых, разных, российских, первые, лучше, разные, различных
| Paradigm новый | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | нового | ||
| Animacy=Inan|Case=Acc | новый | ||
| Case=Acc | новую | новое | |
| Case=Dat | новому | новой | новому |
| Case=Gen | нового | новой | нового |
| Case=Ins | новым | новой | новым |
| Case=Loc | новом | новой | новом |
| Case=Nom | новый | новая | новое |
| Variant=Short | нов | нова | ново |
VERB
55675 VERB tokens (32% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (55675; 100%), Person=EMPTY (55675; 100%), Tense=Past (51964; 93%), Mood=Ind (40910; 73%), VerbForm=Fin (40910; 73%), Aspect=Perf (35086; 63%), Voice=Act (33372; 60%).
VERB tokens may have the following values of Gender:
Fem(14735; 26% of non-emptyGender): стала, сказала, могла, была, оказалась, шла, началась, появилась, начала, пришлаMasc(29768; 53% of non-emptyGender): сказал, стал, мог, заявил, говорил, был, видел, знал, оказался, спросилNeut(11172; 20% of non-emptyGender): было, стало, удалось, казалось, оказалось, пришлось, произошло, хотелось, могло, прошлоEMPTY(120467): может, можно, есть, нет, надо, могут, является, быть, говорит, стали
| Paradigm мочь | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc|Tense=Pres|VerbForm=Part | могущую | ||
| Case=Nom|Tense=Pres|VerbForm=Part | могущее | ||
| Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
PROPN
43362 PROPN tokens (88% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Abbr=EMPTY (43362; 100%), Number=Sing (42847; 99%), Animacy=Anim (25080; 58%).
PROPN tokens may have the following values of Gender:
Fem(13325; 31% of non-emptyGender): России, Россия, Москве, Москвы, Германии, Россию, Европе, Европы, Земли, ФранцииMasc(29349; 68% of non-emptyGender): Путин, Владимир, Сергей, Путина, Александр, Галилей, Медведев, Борис, Николай, ИльяNeut(688; 2% of non-emptyGender): Солнца, Солнце, Минэкономразвития, Минобороны, Политбюро, Минобрнауки, Косово, Возрождения, Подмосковье, ПодмосковьяEMPTY(6057): США, СССР, В., А., РФ, РАН, М., С., И., Н.
| Paradigm Ельцин | Masc | Neut |
|---|---|---|
| Case=Acc | Ельцина | |
| Case=Dat | Ельцину | |
| Case=Gen | Ельцина, ЕЛЬЦИНА | Ельцина |
| Case=Ins | Ельциным | |
| Case=Loc | Ельцине | |
| Case=Nom | Ельцин |
Gender seems to be lexical feature of PROPN. 99% lemmas (7927) occur only with one value of Gender.
PRON
39190 PRON tokens (59% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (39179; 100%), Person=EMPTY (23312; 59%), Animacy=Inan (20879; 53%).
PRON tokens may have the following values of Gender:
Fem(4633; 12% of non-emptyGender): она, ее, ней, нее, ей, ею, её, нею, неё, темMasc(12906; 33% of non-emptyGender): он, его, ему, кто, него, никто, ним, нем, кого, кто-тоNeut(21651; 55% of non-emptyGender): это, что, то, все, того, том, этом, тем, этого, всегоEMPTY(26961): я, мы, они, их, мне, нас, них, меня, себя, вы
| Paradigm то | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | том | то | |
| Case=Dat|ExtPos=ADV | тому | ||
| Case=Dat|ExtPos=NOUN | т. | ||
| Case=Dat | тому | ||
| Case=Gen|ExtPos=ADV | того | ||
| Case=Gen | того | того | |
| Case=Ins|ExtPos=ADV | тем | тем | |
| Case=Ins|ExtPos=SCONJ | тем | ||
| Case=Ins | тем | тем | |
| Case=Loc|ExtPos=PRON | том | ||
| Case=Loc|ExtPos=VERB | том | ||
| Case=Loc | том | ||
| Case=Nom|ExtPos=CCONJ | то, т., т | ||
| Case=Nom|ExtPos=NOUN | то | ||
| Case=Nom|ExtPos=PART | то | ||
| Case=Nom|ExtPos=SCONJ | то | ||
| Case=Nom | то |
Gender seems to be lexical feature of PRON. 93% lemmas (26) occur only with one value of Gender.
DET
32357 DET tokens (59% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (32355; 100%), Poss=EMPTY (26442; 82%).
DET tokens may have the following values of Gender:
Fem(11415; 35% of non-emptyGender): этой, которая, своей, свою, которой, эта, эту, нашей, другой, которуюMasc(13067; 40% of non-emptyGender): который, этот, тот, сам, этом, этого, такой, каждый, свой, такимNeut(7875; 24% of non-emptyGender): это, все, такое, то, том, которое, свое, самом, самое, этогоEMPTY(22391): его, которые, все, их, эти, ее, которых, всех, тех, других
| Paradigm этот | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | этого | ||
| Animacy=Inan|Case=Acc | этот | ||
| Case=Acc | этот, это | эту | это |
| Case=Dat | этому | этой | этому |
| Case=Gen | этого | этой | этого |
| Case=Ins | этим | этой | этим |
| Case=Loc | этом | этой | этом |
| Case=Nom | этот | эта | это |
AUX
6210 AUX tokens (45% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Number=Sing (6210; 100%), Person=EMPTY (6210; 100%), Tense=Past (6210; 100%), Voice=Act (6210; 100%), Mood=Ind (6205; 100%), VerbForm=Fin (6205; 100%).
AUX tokens may have the following values of Gender:
Fem(1396; 22% of non-emptyGender): былаMasc(2280; 37% of non-emptyGender): был, бывший, бывшемNeut(2534; 41% of non-emptyGender): былоEMPTY(7535): бы, были, будет, быть, будут, есть, будем, буду, будучи, будь
| Paradigm быть | Masc | Fem | Neut |
|---|---|---|---|
| Case=Loc|VerbForm=Part | бывшем | ||
| Case=Nom|VerbForm=Part | бывший | ||
| Mood=Ind|VerbForm=Fin | был | была | было |
NUM
4591 NUM tokens (26% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (4591; 100%), NumType=Card (4500; 98%), Animacy=EMPTY (3670; 80%), Number=Sing (2695; 59%).
NUM tokens may have the following values of Gender:
Fem(1521; 33% of non-emptyGender): одной, две, одна, одну, двух, обе, двумя, обеих, двум, обеимиMasc(2532; 55% of non-emptyGender): один, два, одного, двух, одним, одном, полтора, оба, двумя, одномуNeut(538; 12% of non-emptyGender): одно, два, одним, одного, двух, одном, одному, оба, двумя, полтораEMPTY(13325): несколько, три, 1, 10, 20, 2, 15, 5, 3, четыре
| Paradigm один | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | одного | ||
| Animacy=Inan|Case=Acc|ExtPos=NUM | один | ||
| Animacy=Inan|Case=Acc | один | ||
| Case=Acc|ExtPos=ADV | один | ||
| Case=Acc|ExtPos=NUM | одну | ||
| Case=Acc|ExtPos=PRON | одну | одно | |
| Case=Acc | одну | одно | |
| Case=Dat | одному | одной | одному |
| Case=Gen|ExtPos=NUM | одного | ||
| Case=Gen | одного | одной | одного |
| Case=Ins | одним, одними | одной, одною | одним |
| Case=Loc|ExtPos=NUM | одном | одной | |
| Case=Loc | одном | одной | одном |
| Case=Nom|ExtPos=ADV | один | ||
| Case=Nom|ExtPos=NUM | один | одна | Одно |
| Case=Nom|ExtPos=PRON | один | ||
| Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (69767; 65%),
NOUN –[det]–> DET (21807; 58%),
PROPN –[flat:name]–> PROPN (5836; 86%),
VERB –[conj]–> VERB (5530; 55%),
VERB –[nsubj]–> PROPN (4571; 67%),
NOUN –[appos]–> PROPN (4319; 75%),
ADJ –[nsubj]–> NOUN (3605; 61%),
ADJ –[conj]–> ADJ (3421; 94%),
NOUN –[amod]–> VERB (2684; 61%),
NOUN –[appos]–> NOUN (2030; 58%).