Treebank Statistics: UD_Russian-PUD: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
9006 tokens (47%) have a non-empty value of Gender.
5708 types (74%) occur at least once with a non-empty value of Gender.
3792 lemmas (74%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (4892; 25% instances), ADJ (1274; 7% instances), PROPN (1101; 6% instances), VERB (811; 4% instances), PRON (446; 2% instances), DET (262; 1% instances), AUX (155; 1% instances), NUM (65; 0% instances).
NOUN
4892 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (4263; 87%), Number=Sing (3522; 72%).
NOUN tokens may have the following values of Gender:
Fem(1523; 31% of non-emptyGender): войны, компании, часть, страны, жизни, истории, мере, части, э., партииMasc(2207; 45% of non-emptyGender): году, года, лет, людей, города, результате, века, человек, год, людиNeut(1162; 24% of non-emptyGender): время, течение, качестве, влияние, основном, море, внимание, место, начале, имяEMPTY(5): Film, Wi-Fi, GIF
| Paradigm представитель | Masc | Fem |
|---|---|---|
| Case=Gen|Number=Plur | представителей | |
| Case=Nom|Number=Sing | Представитель | Представитель |
| Case=Nom|Number=Plur | представители |
Gender seems to be lexical feature of NOUN. 100% lemmas (1903) occur only with one value of Gender.
ADJ
1274 ADJ tokens (61% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (1273; 100%), Degree=Pos (1267; 99%).
ADJ tokens may have the following values of Gender:
Fem(507; 40% of non-emptyGender): первой, Северной, крайней, большая, другой, южной, новой, южная, американской, большойMasc(439; 34% of non-emptyGender): новый, первого, последний, самым, большой, британский, бывший, высокий, главным, единственныйNeut(328; 26% of non-emptyGender): нужно, самое, самым, большое, возможно, должно, необходимо, самом, известно, настоящееEMPTY(815): другие, других, многие, новые, новых, последние, должны, 2014, 2015, III
| Paradigm новый | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc | новый | ||
| Case=Acc | новую | новое | |
| Case=Dat | новому | ||
| Case=Gen | нового | новой | нового |
| Case=Ins | новой | ||
| Case=Loc | Новой | ||
| Case=Nom | новый | новая | новое |
PROPN
1101 PROPN tokens (91% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (1051; 95%), Animacy=Anim (577; 52%).
PROPN tokens may have the following values of Gender:
Fem(357; 32% of non-emptyGender): Великобритании, Америки, Италии, Австралии, Европы, Клинтон, Америке, Англии, Германии, МакедонииMasc(728; 66% of non-emptyGender): США, Китай, Онтарио, Ахеменидов, Даневирке, Китая, Трампа, Валентино, Гонконг, ДжонNeut(16; 1% of non-emptyGender): ЗППНС, Средиземноморью, Загорья, Закавказье, МГБ, Монте-Карло, НАТО, По, СФНО, СолнцаEMPTY(108): BBC, CNN, RECO, Spotify, Twitter, Uber, Academy, Adidas, Agora, Assistant
| Paradigm Трамп | Masc | Fem |
|---|---|---|
| Case=Acc | Трампа | |
| Case=Dat | Трампу | |
| Case=Gen | Трампа | |
| Case=Ins | Трампом | |
| Case=Loc | Трампе | |
| Case=Nom | Трамп | Трамп |
Gender seems to be lexical feature of PROPN. 99% lemmas (729) occur only with one value of Gender.
VERB
811 VERB tokens (38% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (811; 100%), Person=EMPTY (811; 100%), Tense=Past (756; 93%), Mood=Ind (585; 72%), VerbForm=Fin (585; 72%), Aspect=Perf (576; 71%), Voice=Act (482; 59%).
VERB tokens may have the following values of Gender:
Fem(221; 27% of non-emptyGender): сказала, начала, привела, стала, могла, началась, показала, сыграла, вернулась, включалаMasc(440; 54% of non-emptyGender): сказал, заявил, стал, принял, начал, мог, получил, жил, оставался, вернулсяNeut(150; 18% of non-emptyGender): стало, привело, позволило, удалось, началось, получило, потраченное, произошло, имело, использовалосьEMPTY(1304): является, может, говорит, могут, можно, находится, имеет, сделать, получили, нет
| Paradigm стать | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|VerbForm=Part|Voice=Mid | ставшего | ||
| Case=Gen|VerbForm=Part|Voice=Mid | ставшей | ||
| Mood=Ind|VerbForm=Fin|Voice=Act | стал | ||
| Mood=Ind|VerbForm=Fin|Voice=Mid | стал | стала | стало |
PRON
446 PRON tokens (56% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (446; 100%), Case=Nom (256; 57%), Person=EMPTY (226; 51%).
PRON tokens may have the following values of Gender:
Fem(95; 21% of non-emptyGender): она, которая, ее, которой, ей, которую, нее, ней, ею, неёMasc(162; 36% of non-emptyGender): он, его, ему, него, котором, который, нем, ним, им, которогоNeut(189; 42% of non-emptyGender): это, того, то, том, которое, тем, этого, все, этом, всегоEMPTY(348): они, которые, я, который, мы, что, себя, них, кто, мне
| Paradigm который | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc | который | ||
| Case=Acc | которую | которое | |
| Case=Dat | которому | ||
| Case=Gen | которого | которой | |
| Case=Ins | которым | ||
| Case=Loc | котором | которой | котором |
| Case=Nom | который | которая | которое |
Gender seems to be lexical feature of PRON. 93% lemmas (13) occur only with one value of Gender.
DET
262 DET tokens (53% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (262; 100%).
DET tokens may have the following values of Gender:
Fem(100; 38% of non-emptyGender): своей, н., этой, свою, эта, эту, всей, нашей, всю, каждойMasc(93; 35% of non-emptyGender): этот, этого, том, этом, каждый, тот, своего, свой, таким, всемуNeut(69; 26% of non-emptyGender): это, то, наше, свое, своего, своем, тем, этого, всего, всемуEMPTY(231): его, их, ее, такие, свои, некоторые, эти, всех, своих, таких
| Paradigm этот | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc | этот | ||
| Case=Acc | эту | это | |
| Case=Dat | этой | этому | |
| Case=Gen | этого | этой | этого |
| Case=Loc | этом | этой | |
| Case=Nom | этот | эта | это |
AUX
155 AUX tokens (52% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Aspect=Imp (155; 100%), Mood=Ind (155; 100%), Number=Sing (155; 100%), Person=EMPTY (155; 100%), Tense=Past (155; 100%), VerbForm=Fin (155; 100%), Voice=Act (155; 100%).
AUX tokens may have the following values of Gender:
Fem(32; 21% of non-emptyGender): былаMasc(74; 48% of non-emptyGender): былNeut(49; 32% of non-emptyGender): былоEMPTY(141): были, будет, бы, быть, есть, будут, будучи, буду, будь
| Paradigm быть | Masc | Fem | Neut |
|---|---|---|---|
| был | была | было |
NUM
65 NUM tokens (22% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Animacy=EMPTY (52; 80%), Number=Sing (40; 62%).
NUM tokens may have the following values of Gender:
Fem(25; 38% of non-emptyGender): две, одной, одну, обе, однаMasc(37; 57% of non-emptyGender): один, два, одного, обоих, одним, оба, одном, одному, двух, полтораNeut(3; 5% of non-emptyGender): Одним, одно, одногоEMPTY(225): несколько, больше, много, три, двух, 3, четыре, 1, десяти, нескольких
| Paradigm один | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | одного | ||
| Case=Acc | одну | ||
| Case=Dat | одному | ||
| Case=Gen | одного | одной | одного |
| Case=Ins | одним | одной | Одним |
| Case=Loc | одном | одной | |
| Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (962; 58%),
NOUN –[det]–> DET (242; 54%),
VERB –[nsubj]–> PROPN (132; 70%),
VERB –[nsubj]–> PRON (127; 59%),
PROPN –[flat:name]–> PROPN (102; 99%),
NOUN –[flat:name]–> PROPN (92; 96%),
VERB –[aux:pass]–> AUX (80; 88%),
PROPN –[amod]–> ADJ (67; 97%),
VERB –[nsubj:pass]–> NOUN (66; 55%),
VERB –[conj]–> VERB (57; 52%).