Treebank Statistics: UD_Russian-Poetry: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
25353 tokens (40%) have a non-empty value of Gender
.
13575 types (75%) occur at least once with a non-empty value of Gender
.
7152 lemmas (72%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (15618; 24% instances), ADJ (4419; 7% instances), VERB (2263; 4% instances), DET (1243; 2% instances), PRON (1122; 2% instances), PROPN (529; 1% instances), AUX (105; 0% instances), NUM (54; 0% instances).
NOUN
15618 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (14003; 90%), Number=Sing (11309; 72%).
NOUN
tokens may have the following values of Gender
:
Fem
(6516; 42% of non-emptyGender
): жизнь, ночь, руки, жизни, любовь, любви, душа, земли, душе, ночиMasc
(6710; 43% of non-emptyGender
): день, ветер, мир, вечер, свет, глаза, час, дни, лет, людиNeut
(2392; 15% of non-emptyGender
): сердце, солнце, небо, слова, счастье, время, море, небе, лицо, небесEMPTY
(7): Кн., г., СБ., громом, пр.
Paradigm полчаса | Masc | Fem | Neut |
---|---|---|---|
полчаса | полчаса | полчаса |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (3988) occur only with one value of Gender
.
ADJ
4419 ADJ tokens (73% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (4414; 100%), Degree=Pos (4339; 98%), Variant=EMPTY (3736; 85%).
ADJ
tokens may have the following values of Gender
:
Fem
(1588; 36% of non-emptyGender
): милая, белая, милой, золотая, полна, святая, теплой, черной, голубая, осеннейMasc
(2266; 51% of non-emptyGender
): тихий, белый, последний, первый, черный, хорошо, холодный, милый, синий, старыйNeut
(565; 13% of non-emptyGender
): равно, голубое, чужое, белое, гусиное, вечное, закатное, злое, синее, беломEMPTY
(1601): золотые, белые, лучше, белых, I, тихие, синие, зеленые, серые, темные
Paradigm белый | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | белый | ||
Case=Acc | белый | белую | белое |
Case=Gen | белого | белой | |
Case=Ins | белым | белою, белой | белым |
Case=Loc | белом | белой | белом |
Case=Nom | белый | белая | белое |
Variant=Short | бел | бела |
VERB
2263 VERB tokens (27% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=EMPTY (2263; 100%), Number=Sing (2262; 100%), Tense=Past (2117; 94%), Mood=Ind (1589; 70%), VerbForm=Fin (1589; 70%), Voice=Act (1511; 67%), Aspect=Perf (1471; 65%).
VERB
tokens may have the following values of Gender
:
Fem
(743; 33% of non-emptyGender
): стала, шла, пела, легла, любила, ушла, могла, пришла, стояла, былаMasc
(1250; 55% of non-emptyGender
): стал, был, видел, сказал, жил, забыл, любил, знал, мог, шелNeut
(270; 12% of non-emptyGender
): было, казалось, стало, бывало, дано, сказано, хотелось, приказано, показалось, БилоEMPTY
(5971): нет, знаю, может, надо, стоит, быть, жить, есть, люблю, вижу
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
был | была | было |
DET
1243 DET tokens (69% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (1243; 100%), Animacy=EMPTY (1100; 88%), Poss=EMPTY (658; 53%).
DET
tokens may have the following values of Gender
:
Fem
(501; 40% of non-emptyGender
): моя, моей, свою, вся, своей, всю, какая, этой, твоя, твоейMasc
(571; 46% of non-emptyGender
): мой, твой, тот, этот, свой, весь, каждый, наш, сам, одинNeut
(171; 14% of non-emptyGender
): мое, твое, все, свое, одно, всё, какое, такое, то, этоEMPTY
(563): их, все, его, эти, ее, мои, твои, твоих, всех, тех
Paradigm мой | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | мой | ||
Case=Acc | мою | мое | |
Case=Dat | моему | моей | моему |
Case=Gen | моего | моей | моего |
Case=Ins | моим | моей | |
Case=Loc | моем | моей | моем |
Case=Nom | мой | моя | мое |
PRON
1122 PRON tokens (32% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (1122; 100%), Person=EMPTY (659; 59%), Case=Nom (634; 57%).
PRON
tokens may have the following values of Gender
:
Fem
(167; 15% of non-emptyGender
): она, ней, ей, ее, нее, нею, еюMasc
(405; 36% of non-emptyGender
): он, кто, его, ему, ним, нем, кого, кто-то, никто, негоNeut
(550; 49% of non-emptyGender
): что, все, это, всё, то, чем, оно, ничего, что-то, темEMPTY
(2411): я, ты, мне, мы, меня, тебя, нам, нас, тебе, них
Paradigm что | Masc | Neut |
---|---|---|
Animacy=Anim|Case=Nom|PronType=Rel | что | |
Animacy=Inan|Case=Acc|PronType=Int | что | |
Animacy=Inan|Case=Acc|PronType=Neg | что | |
Animacy=Inan|Case=Acc|PronType=Rel | что | |
Animacy=Inan|Case=Dat|PronType=Int | чему | |
Animacy=Inan|Case=Dat|PronType=Rel | чему | |
Animacy=Inan|Case=Gen|PronType=Int | чего | |
Animacy=Inan|Case=Gen|PronType=Rel | чего | |
Animacy=Inan|Case=Ins|PronType=Int | чем | |
Animacy=Inan|Case=Ins|PronType=Rel | чем | |
Animacy=Inan|Case=Loc|PronType=Int | чем, чём | |
Animacy=Inan|Case=Loc|PronType=Rel | чем | |
Animacy=Inan|Case=Nom|PronType=Exc | что | |
Animacy=Inan|Case=Nom|PronType=Int | что | |
Animacy=Inan|Case=Nom|PronType=Rel | что |
PROPN
529 PROPN tokens (90% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (519; 98%), Animacy=Anim (327; 62%).
PROPN
tokens may have the following values of Gender
:
Fem
(191; 36% of non-emptyGender
): Волге, Анжелина, Москва, Москве, Русь, Россию, Россия, Руси, Сулико, ИзабеллаMasc
(335; 63% of non-emptyGender
): Воронский, Восток, Иуда, Париж, Ара, Петроград, ВЛАДИМИРА, Владимир, Геркулес, ГинсбургNeut
(3; 1% of non-emptyGender
): Замоскворечья, Монако, ПолесьемEMPTY
(59): А., В., Н., М., П., С., Т., Д., И., К.
Paradigm Лакримоза | Masc | Fem |
---|---|---|
Animacy=Anim|Case=Nom|NameType=Giv | Лакримоза | |
Animacy=Inan|Case=Gen|NameType=Geo | Лакримоза |
Gender
seems to be lexical feature of PROPN
. 100% lemmas (350) occur only with one value of Gender
.
AUX
105 AUX tokens (31% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Mood=Ind (105; 100%), Number=Sing (105; 100%), Person=EMPTY (105; 100%), Tense=Past (105; 100%), VerbForm=Fin (105; 100%), Voice=Act (105; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(20; 19% of non-emptyGender
): былаMasc
(55; 52% of non-emptyGender
): былNeut
(30; 29% of non-emptyGender
): былоEMPTY
(231): бы, будет, б, быть, буду, были, будут, будь, будем, будешь
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
был | была | было |
NUM
54 NUM tokens (21% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (54; 100%), NumType=Card (51; 94%), Case=Nom (33; 61%).
NUM
tokens may have the following values of Gender
:
Fem
(21; 39% of non-emptyGender
): две, одна, одной, однуMasc
(24; 44% of non-emptyGender
): два, один, двух, оба, единый, обоим, однимNeut
(9; 17% of non-emptyGender
): два, одним, одноEMPTY
(198): много, сколько, три, 1, 3, пять, четыре, 2, двух, мало
Paradigm два | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | двух | ||
Animacy=Inan|Case=Acc | два | две | |
Case=Nom | два | две | два |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (3037; 71%),
NOUN –[det]–> DET (921; 65%),
ADJ –[conj]–> ADJ (315; 90%),
ADJ –[nsubj]–> NOUN (255; 68%),
NOUN –[amod]–> VERB (197; 62%),
NOUN –[acl]–> VERB (185; 63%),
NOUN –[appos]–> NOUN (123; 71%),
VERB –[nsubj:pass]–> NOUN (74; 61%),
PROPN –[amod]–> ADJ (58; 97%),
ADJ –[det]–> DET (44; 100%).