Treebank Statistics: UD_Russian-Taiga: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
706306 tokens (40%) have a non-empty value of Gender.
117458 types (78%) occur at least once with a non-empty value of Gender.
42991 lemmas (78%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (373634; 21% instances), ADJ (106254; 6% instances), VERB (76144; 4% instances), PROPN (54575; 3% instances), PRON (47131; 3% instances), DET (38369; 2% instances), AUX (6055; 0% instances), NUM (4144; 0% instances).
NOUN
373634 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (310893; 83%), Number=Sing (272831; 73%).
NOUN tokens may have the following values of Gender:
Fem(133660; 36% of non-emptyGender): жизни, мама, речи, жизнь, литературы, руки, девочка, истории, правда, формыMasc(159098; 43% of non-emptyGender): языка, раз, человек, языке, язык, человека, день, глаза, людей, летNeut(80876; 22% of non-emptyGender): слова, время, слово, слов, искусства, времени, место, дело, произведения, значениеEMPTY(4488): в., г., гг., э., вв., с., т., тыс., ч., см
| Paradigm время | Fem | Neut |
|---|---|---|
| Case=Acc|ExtPos=ADV|Number=Sing | время | |
| Case=Acc|Number=Sing | время | |
| Case=Acc|Number=Sing|Typo=Yes | всемя | |
| Case=Acc|Number=Plur | времена | |
| Case=Dat|Number=Sing | времени | |
| Case=Dat|Number=Plur | временам | |
| Case=Gen|Number=Sing | времни | времени |
| Case=Gen|Number=Plur | времен, времён, времени | |
| Case=Ins|Number=Sing | временем | |
| Case=Ins|Number=Plur | временами | |
| Case=Loc|Number=Sing | времени | |
| Case=Loc|Number=Plur | временах | |
| Case=Nom|Number=Sing | время | |
| Case=Nom|Number=Plur | времена |
Gender seems to be lexical feature of NOUN. 99% lemmas (19090) occur only with one value of Gender.
ADJ
106254 ADJ tokens (69% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (106245; 100%), Degree=Pos (101988; 96%).
ADJ tokens may have the following values of Gender:
Fem(36269; 34% of non-emptyGender): русской, художественной, должна, первой, большую, маленькая, первая, большая, древней, новойMasc(41620; 39% of non-emptyGender): русского, первый, русском, большой, хороший, должен, русский, новый, старый, добрыйNeut(28365; 27% of non-emptyGender): нужно, хорошо, равно, должно, новое, трудно, видно, большое, интересно, известноEMPTY(48821): XIX, разных, п., XVIII, лучше, новые, разные, XX, различных, должны
| Paradigm русский | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | русского | ||
| Animacy=Inan|Case=Acc | русский, русская | ||
| Case=Acc | русскую | русское | |
| Case=Acc|Typo=Yes | Рускую | ||
| Case=Dat | русскому | русской | русскому |
| Case=Gen | русского | русской, Русския | русского |
| Case=Gen|Typo=Yes | Рускыя | ||
| Case=Ins | русским | русской | русским |
| Case=Loc | русском | русской | русском |
| Case=Nom | русский | русская | русское |
VERB
76144 VERB tokens (36% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=EMPTY (76144; 100%), Number=Sing (76143; 100%), Tense=Past (72619; 95%), Mood=Ind (61568; 81%), VerbForm=Fin (61567; 81%), Voice=Act (52449; 69%), Aspect=Perf (50360; 66%).
VERB tokens may have the following values of Gender:
Fem(27069; 36% of non-emptyGender): сказала, стала, могла, произнесла, спросила, хотела, говорила, стояла, видела, увиделаMasc(37091; 49% of non-emptyGender): сказал, стал, мог, спросил, говорил, писал, произнес, ответил, хотел, зналNeut(11984; 16% of non-emptyGender): было, стало, казалось, хотелось, случилось, пришлось, могло, связано, оказалось, осталосьEMPTY(135502): есть, может, можно, надо, нет, значит, сказать, стали, быть, говорит
| Paradigm мочь | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc|Tense=Pres|VerbForm=Part | могущее | ||
| Case=Gen|Tense=Pres|VerbForm=Part | могущего | могущего | |
| Case=Nom|Tense=Pres|VerbForm=Part | могущий | могущая | |
| Mood=Ind|Tense=Past|VerbForm=Fin | мог | могла | могло |
PROPN
54575 PROPN tokens (81% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Abbr=EMPTY (54564; 100%), Number=Sing (54034; 99%), Animacy=Anim (45261; 83%), Case=Nom (29185; 53%).
PROPN tokens may have the following values of Gender:
Fem(18266; 33% of non-emptyGender): россии, Алёна, Лиза, Анна, Сибирочка, Мэри, Руси, Соня, Фрося, ФранцииMasc(35768; 66% of non-emptyGender): Толик, Мишка, Кузька, Пушкина, Толика, иван, Пушкин, Вовка, Юра, КриволапычNeut(541; 1% of non-emptyGender): Возрождения, Папаново, яблоко, Прадо, Полево, Двуречья, Перу, Просвещения, Двуречье, КонгоEMPTY(12832): А., В., И., Н., М., С., П., Ф., Г., К.
| Paradigm Чили | Masc | Fem | Neut |
|---|---|---|---|
| Case=Gen | Чили | Чили | Чили |
| Case=Loc | Чили | Чили |
Gender seems to be lexical feature of PROPN. 98% lemmas (7876) occur only with one value of Gender.
PRON
47131 PRON tokens (53% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (47126; 100%), Case=Nom (23867; 51%), Animacy=EMPTY (23722; 50%), Person=3 (23722; 50%), PronType=Prs (23722; 50%).
PRON tokens may have the following values of Gender:
Fem(9393; 20% of non-emptyGender): она, ее, ей, ней, нее, её, неё, нею, ею, еëMasc(15964; 34% of non-emptyGender): он, его, ему, него, кто, ним, никто, нем, им, немуNeut(21774; 46% of non-emptyGender): это, что, то, все, оно, ничего, всё, того, том, темEMPTY(41695): я, мы, они, ты, мне, меня, вы, нас, их, них
| Paradigm он | Masc | Neut |
|---|---|---|
| Case=Acc | его, него, Эго | его |
| Case=Dat | ему, нему | |
| Case=Gen | него, его | |
| Case=Ins | ним, им | ним |
| Case=Loc | нем, нём, нëм | |
| Case=Nom | он | |
| Case=Nom|Typo=Yes | она, от |
DET
38369 DET tokens (60% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (38365; 100%), Animacy=EMPTY (34944; 91%), Poss=EMPTY (29930; 78%).
DET tokens may have the following values of Gender:
Fem(13427; 35% of non-emptyGender): своей, свою, этой, эта, эту, которой, которая, всю, сама, мояMasc(15186; 40% of non-emptyGender): этот, который, сам, тот, один, такой, мой, свой, каждый, этогоNeut(9756; 25% of non-emptyGender): это, все, такое, то, свое, этого, одно, которое, самое, своегоEMPTY(25464): его, ее, их, все, которые, эти, всех, других, такие, этих
| Paradigm этот | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | этого | ||
| Animacy=Inan|Case=Acc|ExtPos=DET | этот | ||
| Animacy=Inan|Case=Acc | этот | ||
| Animacy=Inan|Case=Gen | этого | ||
| Animacy=Inan|Case=Nom | этот | ||
| Case=Acc|ExtPos=DET | эту | это | |
| Case=Acc | эту | это | |
| Case=Acc|Typo=Yes | это | ||
| Case=Dat|ExtPos=DET | этому | этой | этому |
| Case=Dat | этому | этой | этому |
| Case=Gen|ExtPos=DET | этого | этой | этого |
| Case=Gen | этого | этой | этого |
| Case=Gen|Typo=Yes | этово | ||
| Case=Ins|ExtPos=DET | этим | этой | этим |
| Case=Ins | этим | этой, этою | этим |
| Case=Loc|ExtPos=DET | этом | этой | |
| Case=Loc | этом | этой | этом |
| Case=Nom|ExtPos=DET | этот | эта | Это |
| Case=Nom | этот, Это | эта | это |
| Case=Nom|Typo=Yes | это |
AUX
6055 AUX tokens (47% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Number=Sing (6055; 100%), Person=EMPTY (6055; 100%), Tense=Past (6055; 100%), Voice=Act (6055; 100%), Mood=Ind (6051; 100%), VerbForm=Fin (6051; 100%).
AUX tokens may have the following values of Gender:
Fem(1504; 25% of non-emptyGender): была, бывшаяMasc(2040; 34% of non-emptyGender): был, бывший, бывшегоNeut(2511; 41% of non-emptyGender): былоEMPTY(6932): бы, были, быть, будет, есть, буду, будут, будем, будешь, будь
| Paradigm быть | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Aspect=Imp|Case=Acc|VerbForm=Part | бывшего | ||
| Aspect=Imp|Case=Nom|VerbForm=Part | бывший | бывшая | |
| Aspect=Imp|Mood=Ind|VerbForm=Fin | был | была | было |
| Mood=Ind|VerbForm=Fin | был, бывший | была, бывшая | было |
NUM
4144 NUM tokens (32% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (4142; 100%), NumType=Card (3703; 89%), Number=EMPTY (2243; 54%).
NUM tokens may have the following values of Gender:
Fem(1419; 34% of non-emptyGender): две, одной, одну, одна, обе, двух, двумя, обеих, обеими, двумMasc(2033; 49% of non-emptyGender): два, один, двух, одного, оба, двумя, одним, одном, обоих, одномуNeut(692; 17% of non-emptyGender): одно, два, двух, одном, одного, двумя, одним, оба, одному, двумEMPTY(8704): много, несколько, три, 2, 1, 3, сколько, 5, 4, пять
| Paradigm один | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | одного | ||
| Animacy=Inan|Case=Acc|ExtPos=PRON | один | ||
| Animacy=Inan|Case=Acc | один | ||
| Animacy=Inan|Case=Acc|Typo=Yes | оден | ||
| Case=Acc | один | одну | одно |
| Case=Dat | одному | одной | одному |
| Case=Gen | одного | одной | одного |
| Case=Ins|ExtPos=NUM | одним | ||
| Case=Ins | одним | одной | одним |
| Case=Loc | одном | одной | одном |
| Case=Nom|ExtPos=NUM | Одна | ||
| Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (74269; 69%),
NOUN –[det]–> DET (25471; 57%),
VERB –[nsubj]–> PROPN (10379; 80%),
VERB –[conj]–> VERB (9871; 64%),
ADJ –[conj]–> ADJ (7117; 94%),
NOUN –[acl]–> VERB (5868; 51%),
NOUN –[appos]–> PROPN (4353; 73%),
ADJ –[nsubj]–> NOUN (3831; 62%),
PROPN –[amod]–> ADJ (2337; 88%),
NOUN –[nummod]–> NUM (2242; 69%).