Treebank Statistics: UD_Russian-Taiga: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
706305 tokens (40%) have a non-empty value of Gender
.
117458 types (78%) occur at least once with a non-empty value of Gender
.
42993 lemmas (78%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (373634; 21% instances), ADJ (106254; 6% instances), VERB (76144; 4% instances), PROPN (54575; 3% instances), PRON (47130; 3% instances), DET (38369; 2% instances), AUX (6055; 0% instances), NUM (4144; 0% instances).
NOUN
373634 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (310893; 83%), Number=Sing (272831; 73%).
NOUN
tokens may have the following values of Gender
:
Fem
(133660; 36% of non-emptyGender
): жизни, мама, речи, жизнь, литературы, руки, девочка, истории, правда, формыMasc
(159098; 43% of non-emptyGender
): языка, раз, человек, языке, язык, человека, день, глаза, людей, летNeut
(80876; 22% of non-emptyGender
): слова, время, слово, слов, искусства, времени, место, дело, произведения, значениеEMPTY
(4488): в., г., гг., э., вв., с., т., тыс., ч., см
Paradigm время | Fem | Neut |
---|---|---|
Case=Acc|ExtPos=ADV|Number=Sing | время | |
Case=Acc|Number=Sing | время | |
Case=Acc|Number=Sing|Typo=Yes | всемя | |
Case=Acc|Number=Plur | времена | |
Case=Dat|Number=Sing | времени | |
Case=Dat|Number=Plur | временам | |
Case=Gen|Number=Sing | времни | времени |
Case=Gen|Number=Plur | времен, времён, времени | |
Case=Ins|Number=Sing | временем | |
Case=Ins|Number=Plur | временами | |
Case=Loc|Number=Sing | времени | |
Case=Loc|Number=Plur | временах | |
Case=Nom|Number=Sing | время | |
Case=Nom|Number=Plur | времена |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (19090) occur only with one value of Gender
.
ADJ
106254 ADJ tokens (69% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (106245; 100%), Degree=Pos (102004; 96%).
ADJ
tokens may have the following values of Gender
:
Fem
(36269; 34% of non-emptyGender
): русской, художественной, должна, первой, большую, маленькая, первая, большая, древней, новойMasc
(41620; 39% of non-emptyGender
): русского, первый, русском, большой, хороший, должен, русский, новый, старый, добрыйNeut
(28365; 27% of non-emptyGender
): нужно, хорошо, равно, должно, новое, трудно, видно, большое, интересно, известноEMPTY
(48821): XIX, разных, п., XVIII, лучше, новые, разные, XX, различных, должны
Paradigm русский | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | русского | ||
Animacy=Inan|Case=Acc | русский, русская | ||
Case=Acc | русскую | русское | |
Case=Acc|Typo=Yes | Рускую | ||
Case=Dat | русскому | русской | русскому |
Case=Gen | русского | русской, Русския | русского |
Case=Gen|Typo=Yes | Рускыя | ||
Case=Ins | русским | русской | русским |
Case=Loc | русском | русской | русском |
Case=Nom | русский | русская | русское |
VERB
76144 VERB tokens (36% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=EMPTY (76144; 100%), Number=Sing (76143; 100%), Tense=Past (72619; 95%), Mood=Ind (61568; 81%), VerbForm=Fin (61567; 81%), Voice=Act (52449; 69%), Aspect=Perf (50360; 66%).
VERB
tokens may have the following values of Gender
:
Fem
(27069; 36% of non-emptyGender
): сказала, стала, могла, произнесла, спросила, хотела, говорила, стояла, видела, увиделаMasc
(37091; 49% of non-emptyGender
): сказал, стал, мог, спросил, говорил, писал, произнес, ответил, хотел, зналNeut
(11984; 16% of non-emptyGender
): было, стало, казалось, хотелось, случилось, пришлось, могло, связано, оказалось, осталосьEMPTY
(135488): есть, может, можно, надо, нет, значит, сказать, стали, быть, говорит
Paradigm мочь | Masc | Fem | Neut |
---|---|---|---|
Case=Acc|Tense=Pres|VerbForm=Part | могущее | ||
Case=Gen|Tense=Pres|VerbForm=Part | могущего | могущего | |
Case=Nom|Tense=Pres|VerbForm=Part | могущий | могущая | |
Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
PROPN
54575 PROPN tokens (81% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Abbr=EMPTY (54564; 100%), Number=Sing (54034; 99%), Animacy=Anim (45261; 83%), Case=Nom (29185; 53%).
PROPN
tokens may have the following values of Gender
:
Fem
(18266; 33% of non-emptyGender
): россии, Алёна, Лиза, Анна, Сибирочка, Мэри, Руси, Соня, Фрося, ФранцииMasc
(35768; 66% of non-emptyGender
): Толик, Мишка, Кузька, Пушкина, Толика, иван, Пушкин, Вовка, Юра, КриволапычNeut
(541; 1% of non-emptyGender
): Возрождения, Папаново, яблоко, Прадо, Полево, Двуречья, Перу, Просвещения, Двуречье, КонгоEMPTY
(12832): А., В., И., Н., М., С., П., Ф., Г., К.
Paradigm Чили | Masc | Fem | Neut |
---|---|---|---|
Case=Gen | Чили | Чили | Чили |
Case=Loc | Чили | Чили |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (7876) occur only with one value of Gender
.
PRON
47130 PRON tokens (53% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (47125; 100%), Case=Nom (23868; 51%), Animacy=EMPTY (23722; 50%), Person=3 (23722; 50%), PronType=Prs (23722; 50%).
PRON
tokens may have the following values of Gender
:
Fem
(9393; 20% of non-emptyGender
): она, ее, ей, ней, нее, её, неё, нею, ею, еëMasc
(15964; 34% of non-emptyGender
): он, его, ему, него, кто, ним, никто, нем, им, немуNeut
(21773; 46% of non-emptyGender
): это, что, то, все, оно, ничего, всё, того, том, темEMPTY
(41695): я, мы, они, ты, мне, меня, вы, нас, их, них
Paradigm он | Masc | Neut |
---|---|---|
Case=Acc | его, него, Эго | его |
Case=Dat | ему, нему | |
Case=Gen | него, его | |
Case=Ins | ним, им | ним |
Case=Loc | нем, нём, нëм | |
Case=Nom | он | |
Case=Nom|Typo=Yes | она, от |
DET
38369 DET tokens (60% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (38365; 100%), Animacy=EMPTY (34944; 91%), Poss=EMPTY (29930; 78%).
DET
tokens may have the following values of Gender
:
Fem
(13427; 35% of non-emptyGender
): своей, свою, этой, эта, эту, которой, которая, всю, сама, мояMasc
(15186; 40% of non-emptyGender
): этот, который, сам, тот, один, такой, мой, свой, каждый, этогоNeut
(9756; 25% of non-emptyGender
): это, все, такое, то, свое, этого, одно, которое, самое, своегоEMPTY
(25464): его, ее, их, все, которые, эти, всех, других, такие, этих
Paradigm этот | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | этого | ||
Animacy=Inan|Case=Acc|ExtPos=DET | этот | ||
Animacy=Inan|Case=Acc | этот | ||
Animacy=Inan|Case=Gen | этого | ||
Animacy=Inan|Case=Nom | этот | ||
Case=Acc|ExtPos=DET | эту | это | |
Case=Acc | эту | это | |
Case=Acc|Typo=Yes | это | ||
Case=Dat|ExtPos=DET | этому | этой | этому |
Case=Dat | этому | этой | этому |
Case=Gen|ExtPos=DET | этого | этой | этого |
Case=Gen | этого | этой | этого |
Case=Gen|Typo=Yes | этово | ||
Case=Ins|ExtPos=DET | этим | этой | этим |
Case=Ins | этим | этой, этою | этим |
Case=Loc|ExtPos=DET | этом | этой | |
Case=Loc | этом | этой | этом |
Case=Nom|ExtPos=DET | этот | эта | Это |
Case=Nom | этот, Это | эта | это |
Case=Nom|Typo=Yes | это |
AUX
6055 AUX tokens (47% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Number=Sing (6055; 100%), Person=EMPTY (6055; 100%), Tense=Past (6055; 100%), Voice=Act (6055; 100%), Mood=Ind (6051; 100%), VerbForm=Fin (6051; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(1504; 25% of non-emptyGender
): была, бывшаяMasc
(2040; 34% of non-emptyGender
): был, бывший, бывшегоNeut
(2511; 41% of non-emptyGender
): былоEMPTY
(6932): бы, были, быть, будет, есть, буду, будут, будем, будешь, будь
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Aspect=Imp|Case=Acc|VerbForm=Part | бывшего | ||
Aspect=Imp|Case=Nom|VerbForm=Part | бывший | бывшая | |
Aspect=Imp|Mood=Ind|VerbForm=Fin | был | была | было |
Mood=Ind|VerbForm=Fin | был, бывший | была, бывшая | было |
NUM
4144 NUM tokens (32% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (4142; 100%), NumType=Card (3703; 89%), Number=EMPTY (2243; 54%).
NUM
tokens may have the following values of Gender
:
Fem
(1419; 34% of non-emptyGender
): две, одной, одну, одна, обе, двух, двумя, обеих, обеими, двумMasc
(2033; 49% of non-emptyGender
): два, один, двух, одного, оба, двумя, одним, одном, обоих, одномуNeut
(692; 17% of non-emptyGender
): одно, два, двух, одном, одного, двумя, одним, оба, одному, двумEMPTY
(8705): много, несколько, три, 2, 1, 3, сколько, 5, 4, пять
Paradigm один | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | одного | ||
Animacy=Inan|Case=Acc|ExtPos=PRON | один | ||
Animacy=Inan|Case=Acc | один | ||
Animacy=Inan|Case=Acc|Typo=Yes | оден | ||
Case=Acc | один | одну | одно |
Case=Dat | одному | одной | одному |
Case=Gen | одного | одной | одного |
Case=Ins|ExtPos=NUM | одним | ||
Case=Ins | одним | одной | одним |
Case=Loc | одном | одной | одном |
Case=Nom|ExtPos=NUM | Одна | ||
Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (74269; 69%),
NOUN –[det]–> DET (25471; 57%),
VERB –[nsubj]–> PROPN (10379; 80%),
VERB –[conj]–> VERB (9871; 64%),
ADJ –[conj]–> ADJ (7117; 94%),
NOUN –[acl]–> VERB (5868; 51%),
NOUN –[appos]–> PROPN (4353; 73%),
ADJ –[nsubj]–> NOUN (3831; 62%),
PROPN –[amod]–> ADJ (2337; 88%),
NOUN –[nummod]–> NUM (2242; 69%).