Treebank Statistics: UD_Russian-Poetry: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
25361 tokens (40%) have a non-empty value of Gender.
13577 types (75%) occur at least once with a non-empty value of Gender.
7149 lemmas (72%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (15618; 24% instances), ADJ (4419; 7% instances), VERB (2263; 4% instances), DET (1244; 2% instances), PRON (1121; 2% instances), PROPN (530; 1% instances), AUX (105; 0% instances), NUM (61; 0% instances).
NOUN
15618 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (14003; 90%), Number=Sing (11310; 72%).
NOUN tokens may have the following values of Gender:
Fem(6515; 42% of non-emptyGender): жизнь, ночь, руки, жизни, любовь, любви, душа, земли, душе, ночиMasc(6710; 43% of non-emptyGender): день, ветер, мир, вечер, свет, глаза, час, дни, лет, людиNeut(2393; 15% of non-emptyGender): сердце, солнце, небо, слова, счастье, время, море, небе, лицо, небесEMPTY(7): Кн., г., СБ., громом, пр.
| Paradigm полчаса | Masc | Fem | Neut |
|---|---|---|---|
| полчаса | полчаса | полчаса |
Gender seems to be lexical feature of NOUN. 99% lemmas (3987) occur only with one value of Gender.
ADJ
4419 ADJ tokens (73% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (4414; 100%), Degree=Pos (4339; 98%), Variant=EMPTY (3735; 85%).
ADJ tokens may have the following values of Gender:
Fem(1588; 36% of non-emptyGender): милая, белая, милой, золотая, полна, святая, теплой, черной, голубая, осеннейMasc(2267; 51% of non-emptyGender): тихий, белый, последний, первый, черный, хорошо, холодный, милый, синий, старыйNeut(564; 13% of non-emptyGender): равно, голубое, чужое, белое, гусиное, вечное, закатное, злое, синее, беломEMPTY(1601): золотые, белые, лучше, белых, I, тихие, синие, зеленые, серые, темные
| Paradigm белый | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc | белый | ||
| Case=Acc | белый | белую | белое |
| Case=Gen | белого | белой | |
| Case=Ins | белым | белою, белой | белым |
| Case=Loc | белом | белой | белом |
| Case=Nom | белый | белая | белое |
| Variant=Short | бел | бела |
VERB
2263 VERB tokens (27% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=EMPTY (2263; 100%), Number=Sing (2262; 100%), Tense=Past (2117; 94%), Mood=Ind (1589; 70%), VerbForm=Fin (1589; 70%), Voice=Act (1511; 67%), Aspect=Perf (1471; 65%).
VERB tokens may have the following values of Gender:
Fem(743; 33% of non-emptyGender): стала, шла, пела, легла, любила, ушла, могла, пришла, стояла, былаMasc(1250; 55% of non-emptyGender): стал, был, видел, сказал, жил, забыл, любил, знал, мог, шелNeut(270; 12% of non-emptyGender): было, казалось, стало, бывало, дано, сказано, хотелось, приказано, показалось, БилоEMPTY(5973): нет, знаю, может, надо, стоит, быть, жить, есть, люблю, вижу
| Paradigm быть | Masc | Fem | Neut |
|---|---|---|---|
| был | была | было |
DET
1244 DET tokens (69% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (1244; 100%), Animacy=EMPTY (1100; 88%), Poss=EMPTY (659; 53%).
DET tokens may have the following values of Gender:
Fem(501; 40% of non-emptyGender): моя, моей, свою, вся, своей, всю, какая, этой, твоя, твоейMasc(571; 46% of non-emptyGender): мой, твой, тот, этот, свой, весь, каждый, наш, сам, одинNeut(172; 14% of non-emptyGender): мое, все, твое, свое, одно, всё, какое, такое, то, этоEMPTY(564): их, все, его, эти, ее, мои, твои, твоих, всех, тех
| Paradigm мой | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc | мой | ||
| Case=Acc | мою | мое | |
| Case=Dat | моему | моей | моему |
| Case=Gen | моего | моей | моего |
| Case=Ins | моим | моей | |
| Case=Loc | моем | моей | моем |
| Case=Nom | мой | моя | мое |
PRON
1121 PRON tokens (32% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (1121; 100%), Person=EMPTY (658; 59%), Case=Nom (634; 57%).
PRON tokens may have the following values of Gender:
Fem(167; 15% of non-emptyGender): она, ней, ей, ее, нее, нею, еюMasc(405; 36% of non-emptyGender): он, кто, его, ему, ним, нем, кого, кто-то, никто, негоNeut(549; 49% of non-emptyGender): что, все, это, всё, то, чем, оно, ничего, что-то, темEMPTY(2410): я, ты, мне, мы, меня, тебя, нам, нас, тебе, них
| Paradigm что | Masc | Neut |
|---|---|---|
| Animacy=Anim|Case=Nom|PronType=Rel | что | |
| Animacy=Inan|Case=Acc|PronType=Int | что | |
| Animacy=Inan|Case=Acc|PronType=Neg | что | |
| Animacy=Inan|Case=Acc|PronType=Rel | что | |
| Animacy=Inan|Case=Dat|PronType=Int | чему | |
| Animacy=Inan|Case=Dat|PronType=Rel | чему | |
| Animacy=Inan|Case=Gen|PronType=Int | чего | |
| Animacy=Inan|Case=Gen|PronType=Rel | чего | |
| Animacy=Inan|Case=Ins|PronType=Int | чем | |
| Animacy=Inan|Case=Ins|PronType=Rel | чем | |
| Animacy=Inan|Case=Loc|PronType=Int | чем, чём | |
| Animacy=Inan|Case=Loc|PronType=Rel | чем | |
| Animacy=Inan|Case=Nom|ExtPos=ADV|PronType=Rel | что | |
| Animacy=Inan|Case=Nom|ExtPos=DET|PronType=Exc | Что | |
| Animacy=Inan|Case=Nom|ExtPos=DET|PronType=Rel | что | |
| Animacy=Inan|Case=Nom|PronType=Exc | что | |
| Animacy=Inan|Case=Nom|PronType=Int | что | |
| Animacy=Inan|Case=Nom|PronType=Rel | что |
PROPN
530 PROPN tokens (90% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (520; 98%), Animacy=Anim (327; 62%).
PROPN tokens may have the following values of Gender:
Fem(192; 36% of non-emptyGender): Волге, Анжелина, Москва, Москве, Русь, Россию, Россия, Руси, Сулико, ИзабеллаMasc(335; 63% of non-emptyGender): Воронский, Восток, Иуда, Париж, Ара, Петроград, ВЛАДИМИРА, Владимир, Геркулес, ГинсбургNeut(3; 1% of non-emptyGender): Замоскворечья, Монако, ПолесьемEMPTY(59): А., В., Н., М., П., С., Т., Д., И., К.
| Paradigm Кастусь | Masc | Fem |
|---|---|---|
| Кастусь | Кастусь |
Gender seems to be lexical feature of PROPN. 99% lemmas (348) occur only with one value of Gender.
AUX
105 AUX tokens (31% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Mood=Ind (105; 100%), Number=Sing (105; 100%), Person=EMPTY (105; 100%), Tense=Past (105; 100%), VerbForm=Fin (105; 100%), Voice=Act (105; 100%).
AUX tokens may have the following values of Gender:
Fem(20; 19% of non-emptyGender): былаMasc(55; 52% of non-emptyGender): былNeut(30; 29% of non-emptyGender): былоEMPTY(231): бы, будет, б, быть, буду, были, будут, будь, будем, будешь
| Paradigm быть | Masc | Fem | Neut |
|---|---|---|---|
| был | была | было |
NUM
61 NUM tokens (24% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (61; 100%), NumType=Card (58; 95%), Case=Nom (33; 54%).
NUM tokens may have the following values of Gender:
Fem(23; 38% of non-emptyGender): две, одна, одной, двух, однуMasc(26; 43% of non-emptyGender): два, один, двух, оба, двумя, единый, обоим, однимNeut(12; 20% of non-emptyGender): два, двух, одним, одноEMPTY(191): много, сколько, три, 1, 3, пять, четыре, 2, мало, сто
| Paradigm два | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | двух | ||
| Animacy=Inan|Case=Acc | два | две | |
| Case=Gen | двух | двух | двух |
| Case=Ins | двумя | ||
| Case=Loc | двух | ||
| Case=Nom | два | две | два |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (3037; 71%),
NOUN –[det]–> DET (921; 65%),
ADJ –[conj]–> ADJ (316; 90%),
ADJ –[nsubj]–> NOUN (255; 68%),
NOUN –[amod]–> VERB (197; 62%),
NOUN –[acl]–> VERB (185; 63%),
NOUN –[appos]–> NOUN (124; 70%),
VERB –[nsubj:pass]–> NOUN (74; 61%),
PROPN –[amod]–> ADJ (58; 97%),
ADJ –[det]–> DET (45; 100%).