Treebank Statistics: UD_Russian-Taiga: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
76248 tokens (39%) have a non-empty value of Gender
.
28179 types (74%) occur at least once with a non-empty value of Gender
.
14248 lemmas (70%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (43554; 22% instances), ADJ (12181; 6% instances), PRON (6148; 3% instances), VERB (5885; 3% instances), PROPN (3792; 2% instances), DET (3745; 2% instances), AUX (585; 0% instances), NUM (358; 0% instances).
NOUN
43554 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (37106; 85%), Number=Sing (31846; 73%).
NOUN
tokens may have the following values of Gender
:
Fem
(15191; 35% of non-emptyGender
): цены, очереди, деньги, правда, жизни, воды, жизнь, парковка, работы, ценаMasc
(21167; 49% of non-emptyGender
): магазин, день, раз, лет, выбор, персонал, года, ассортимент, люди, человекNeut
(7196; 17% of non-emptyGender
): время, место, спасибо, фото, обслуживание, времени, качество, кафе, месте, делоEMPTY
(702): тц, г., см, мл, кг, с., р, р., км, м
Paradigm цена | Fem | Neut |
---|---|---|
Case=Acc|Number=Sing | цену | цена |
Case=Acc|Number=Plur | цены | |
Case=Dat|Number=Sing | цене | |
Case=Dat|Number=Plur | ценам | |
Case=Gen|Number=Sing | цены | |
Case=Gen|Number=Plur | цен | |
Case=Ins|Number=Sing | ценой | |
Case=Ins|Number=Plur | ценами | |
Case=Loc|Number=Sing | цене | |
Case=Loc|Number=Plur | ценах | |
Case=Nom|Number=Sing | цена | |
Case=Nom|Number=Plur | цены |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (7814) occur only with one value of Gender
.
ADJ
12181 ADJ tokens (72% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (12179; 100%), Degree=Pos (11975; 98%), Variant=EMPTY (10073; 83%).
ADJ
tokens may have the following values of Gender
:
Fem
(3415; 28% of non-emptyGender
): хорошая, вкусная, большая, отличная, удобная, обычная, нужна, должна, новой, большойMasc
(5191; 43% of non-emptyGender
): хороший, большой, отличный, неплохой, вежливый, обычный, добрый, первый, нужен, красивыйNeut
(3575; 29% of non-emptyGender
): нужно, хорошо, хорошее, дорого, вкусно, удобно, удобное, чисто, отличное, интересноEMPTY
(4703): лучше, хорошие, вежливые, грамотные, доступные, низкие, разных, большие, приемлемые, супер
Paradigm хороший | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | хороший | ||
Case=Acc | хорошую | хорошее | |
Case=Dat | хорошей | ||
Case=Gen | хорошего | хорошей | хорошего |
Case=Ins | хорошим | хорошей | хорошим |
Case=Loc | хорошем | хорошем | |
Case=Nom | хороший, хоро, хорошии | хорошая, Шорошая | хорошее |
Case=Nom|Typo=Yes | Хорлший | Хорошое | |
Variant=Short | хорош | хороша | хорошо |
PRON
6148 PRON tokens (55% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (6146; 100%), Person=EMPTY (4078; 66%), Animacy=Inan (3394; 55%), Case=Nom (3126; 51%).
PRON
tokens may have the following values of Gender
:
Fem
(867; 14% of non-emptyGender
): она, ей, ее, ней, её, которая, нее, неё, которой, которуюMasc
(1846; 30% of non-emptyGender
): он, кто, его, ему, него, который, ним, никто, кого, которогоNeut
(3435; 56% of non-emptyGender
): это, что, все, всё, то, ничего, этого, чем, того, что-тоEMPTY
(5066): я, мне, меня, они, мы, вы, ты, нас, их, вам
Paradigm который | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | которого | ||
Animacy=Anim|Case=Ins|Number=Sing | которым | ||
Animacy=Inan|Case=Acc|Number=Sing | который | которое | |
Animacy=Inan|Case=Ins|Number=Sing | которым | ||
Animacy=Inan|Case=Nom|Number=Sing | которое | ||
Case=Acc|Number=Sing | который | которую | которое |
Case=Dat|Number=Sing | которому | которой | |
Case=Gen|Number=Sing | которого | которой | которого |
Case=Ins|Number=Sing | которым | которой | |
Case=Loc|Number=Sing | котором | которой | |
Case=Nom|Number=Sing | который | которая | которое |
Case=Nom|Number=Plur|Typo=Yes | клторые |
VERB
5885 VERB tokens (24% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (5885; 100%), Person=EMPTY (5885; 100%), Tense=Past (5698; 97%), Mood=Ind (4828; 82%), VerbForm=Fin (4827; 82%), Aspect=Perf (3998; 68%), Voice=Act (3896; 66%).
VERB
tokens may have the following values of Gender
:
Fem
(1888; 32% of non-emptyGender
): была, сказала, стала, начала, написала, хотела, могла, решила, понравилась, появиласьMasc
(3004; 51% of non-emptyGender
): сказал, стал, был, понравился, видел, начал, решил, получил, хотел, могNeut
(993; 17% of non-emptyGender
): было, понравилось, стало, хотелось, получилось, осталось, пришлось, прошло, написано, удалосьEMPTY
(18863): есть, можно, нет, может, надо, могу, делать, хочу, здравствуйте, нравится
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
Case=Nom|VerbForm=Part | бывший | ||
Mood=Ind|Typo=Yes|VerbForm=Fin | был | ||
Mood=Ind|VerbForm=Fin | был | была | было |
PROPN
3792 PROPN tokens (85% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (3726; 98%), Animacy=Anim (1986; 52%).
PROPN
tokens may have the following values of Gender
:
Fem
(1256; 33% of non-emptyGender
): россии, Россия, Москве, Ирина, москвы, Катя, Русь, Елена, Надя, АлександровнаMasc
(2411; 64% of non-emptyGender
): Петрович, жириновский, парнас, сочи, Убейд, Генрих, Петровича, крым, Петя, александрNeut
(125; 3% of non-emptyGender
): яблоко, яблока, Девяткино, Сити, Стереолето, авито, Билибино, Внуково, Динамо, ДомодедовоEMPTY
(668): @xxxxxx, сша, ЛДПР, М., СССР, РФ, @yabloko, А., кпрф, спб
Paradigm Франция | Masc | Fem |
---|---|---|
Case=Acc | Францию | |
Case=Gen | франции | Франции |
Case=Loc | Франции | |
Case=Nom | Франция |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (1813) occur only with one value of Gender
.
DET
3745 DET tokens (66% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (3743; 100%), Animacy=EMPTY (3236; 86%), Poss=EMPTY (2886; 77%).
DET
tokens may have the following values of Gender
:
Fem
(1259; 34% of non-emptyGender
): этой, такая, эту, своей, сама, моя, эта, какая, свою, всейMasc
(1666; 44% of non-emptyGender
): этот, мой, сам, такой, один, каждый, этом, какой, тот, свойNeut
(820; 22% of non-emptyGender
): это, такое, все, самое, всё, одно, то, такого, какое, своеEMPTY
(1953): все, его, эти, их, всех, такие, какие, других, ее, мои
Paradigm этот | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | этого | ||
Animacy=Inan|Case=Acc | этот | ||
Case=Acc | эту | это | |
Case=Acc|Typo=Yes | это | ||
Case=Dat | этому | этой | этому |
Case=Gen | этого | этой | этого |
Case=Ins | этим | этой | этим |
Case=Loc | этом | этой | этом |
Case=Nom | этот | эта | это |
Case=Nom|Typo=Yes | это |
AUX
585 AUX tokens (37% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (585; 100%), Number=Sing (585; 100%), Person=EMPTY (585; 100%), Tense=Past (585; 100%), Voice=Act (585; 100%), Mood=Ind (583; 100%), VerbForm=Fin (583; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(138; 24% of non-emptyGender
): была, бывшаяMasc
(209; 36% of non-emptyGender
): был, бывшийNeut
(238; 41% of non-emptyGender
): былоEMPTY
(988): бы, будет, есть, были, быть, будут, буду, будем, б, будете
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
Case=Nom|VerbForm=Part | бывший | бывшая | |
Mood=Ind|VerbForm=Fin | был | была | было |
NUM
358 NUM tokens (12% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (356; 99%), NumType=Card (322; 90%).
NUM
tokens may have the following values of Gender
:
Fem
(106; 30% of non-emptyGender
): две, одной, одна, одну, обеих, двух, обе, двумя, обеим, полторыMasc
(201; 56% of non-emptyGender
): один, два, одного, оба, обоих, одном, полтора, двух, 2-х, ОбоимNeut
(51; 14% of non-emptyGender
): одно, одном, два, одного, одним, обаEMPTY
(2727): много, 2, 3, 1, 5, несколько, 4, сколько, 10, три
Paradigm один | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | одного | ||
Animacy=Inan|Case=Acc | один | ||
Animacy=Inan|Case=Acc|Typo=Yes | оден | ||
Case=Acc | один | одну | одно |
Case=Dat | одному | одной | |
Case=Gen | одного | одной | одного |
Case=Ins | одним | одной | одним |
Case=Loc | одном | одной | одном |
Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (7772; 72%),
NOUN –[det]–> DET (2746; 64%),
ADJ –[nsubj]–> NOUN (832; 58%),
ADJ –[conj]–> ADJ (571; 81%),
PROPN –[flat:name]–> PROPN (401; 84%),
ADJ –[nsubj]–> PRON (362; 75%),
NOUN –[appos]–> NOUN (274; 55%),
VERB –[nsubj]–> PROPN (272; 54%),
NOUN –[appos]–> PROPN (235; 59%),
VERB –[nsubj:pass]–> NOUN (232; 51%).