Treebank Statistics: UD_Russian-PUD: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
9006 tokens (47%) have a non-empty value of Gender
.
5708 types (74%) occur at least once with a non-empty value of Gender
.
3792 lemmas (74%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (4892; 25% instances), ADJ (1274; 7% instances), PROPN (1101; 6% instances), VERB (811; 4% instances), PRON (446; 2% instances), DET (262; 1% instances), AUX (155; 1% instances), NUM (65; 0% instances).
NOUN
4892 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (4263; 87%), Number=Sing (3522; 72%).
NOUN
tokens may have the following values of Gender
:
Fem
(1523; 31% of non-emptyGender
): войны, компании, часть, страны, жизни, истории, мере, части, э., партииMasc
(2207; 45% of non-emptyGender
): году, года, лет, людей, города, результате, века, человек, год, людиNeut
(1162; 24% of non-emptyGender
): время, течение, качестве, влияние, основном, море, внимание, место, начале, имяEMPTY
(5): Film, Wi-Fi, GIF
Paradigm представитель | Masc | Fem |
---|---|---|
Case=Gen|Number=Plur | представителей | |
Case=Nom|Number=Sing | Представитель | Представитель |
Case=Nom|Number=Plur | представители |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (1903) occur only with one value of Gender
.
ADJ
1274 ADJ tokens (61% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (1273; 100%), Degree=Pos (1267; 99%).
ADJ
tokens may have the following values of Gender
:
Fem
(507; 40% of non-emptyGender
): первой, Северной, крайней, большая, другой, южной, новой, южная, американской, большойMasc
(439; 34% of non-emptyGender
): новый, первого, последний, самым, большой, британский, бывший, высокий, главным, единственныйNeut
(328; 26% of non-emptyGender
): нужно, самое, самым, большое, возможно, должно, необходимо, самом, известно, настоящееEMPTY
(815): другие, других, многие, новые, новых, последние, должны, 2014, 2015, III
Paradigm новый | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | новый | ||
Case=Acc | новую | новое | |
Case=Dat | новому | ||
Case=Gen | нового | новой | нового |
Case=Ins | новой | ||
Case=Loc | Новой | ||
Case=Nom | новый | новая | новое |
PROPN
1101 PROPN tokens (91% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (1051; 95%), Animacy=Anim (577; 52%).
PROPN
tokens may have the following values of Gender
:
Fem
(357; 32% of non-emptyGender
): Великобритании, Америки, Италии, Австралии, Европы, Клинтон, Америке, Англии, Германии, МакедонииMasc
(728; 66% of non-emptyGender
): США, Китай, Онтарио, Ахеменидов, Даневирке, Китая, Трампа, Валентино, Гонконг, ДжонNeut
(16; 1% of non-emptyGender
): ЗППНС, Средиземноморью, Загорья, Закавказье, МГБ, Монте-Карло, НАТО, По, СФНО, СолнцаEMPTY
(108): BBC, CNN, RECO, Spotify, Twitter, Uber, Academy, Adidas, Agora, Assistant
Paradigm Трамп | Masc | Fem |
---|---|---|
Case=Acc | Трампа | |
Case=Dat | Трампу | |
Case=Gen | Трампа | |
Case=Ins | Трампом | |
Case=Loc | Трампе | |
Case=Nom | Трамп | Трамп |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (729) occur only with one value of Gender
.
VERB
811 VERB tokens (38% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (811; 100%), Person=EMPTY (811; 100%), Tense=Past (756; 93%), Mood=Ind (585; 72%), VerbForm=Fin (585; 72%), Aspect=Perf (576; 71%), Voice=Act (482; 59%).
VERB
tokens may have the following values of Gender
:
Fem
(221; 27% of non-emptyGender
): сказала, начала, привела, стала, могла, началась, показала, сыграла, вернулась, включалаMasc
(440; 54% of non-emptyGender
): сказал, заявил, стал, принял, начал, мог, получил, жил, оставался, вернулсяNeut
(150; 18% of non-emptyGender
): стало, привело, позволило, удалось, началось, получило, потраченное, произошло, имело, использовалосьEMPTY
(1304): является, может, говорит, могут, можно, находится, имеет, сделать, получили, нет
Paradigm стать | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|VerbForm=Part|Voice=Mid | ставшего | ||
Case=Gen|VerbForm=Part|Voice=Mid | ставшей | ||
Mood=Ind|VerbForm=Fin|Voice=Act | стал | ||
Mood=Ind|VerbForm=Fin|Voice=Mid | стал | стала | стало |
PRON
446 PRON tokens (56% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (446; 100%), Case=Nom (256; 57%), Person=EMPTY (226; 51%).
PRON
tokens may have the following values of Gender
:
Fem
(95; 21% of non-emptyGender
): она, которая, ее, которой, ей, которую, нее, ней, ею, неёMasc
(162; 36% of non-emptyGender
): он, его, ему, него, котором, который, нем, ним, им, которогоNeut
(189; 42% of non-emptyGender
): это, того, то, том, которое, тем, этого, все, этом, всегоEMPTY
(348): они, которые, я, который, мы, что, себя, них, кто, мне
Paradigm который | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | который | ||
Case=Acc | которую | которое | |
Case=Dat | которому | ||
Case=Gen | которого | которой | |
Case=Ins | которым | ||
Case=Loc | котором | которой | котором |
Case=Nom | который | которая | которое |
Gender
seems to be lexical feature of PRON
. 93% lemmas (13) occur only with one value of Gender
.
DET
262 DET tokens (53% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (262; 100%).
DET
tokens may have the following values of Gender
:
Fem
(100; 38% of non-emptyGender
): своей, н., этой, свою, эта, эту, всей, нашей, всю, каждойMasc
(93; 35% of non-emptyGender
): этот, этого, том, этом, каждый, тот, своего, свой, таким, всемуNeut
(69; 26% of non-emptyGender
): это, то, наше, свое, своего, своем, тем, этого, всего, всемуEMPTY
(231): его, их, ее, такие, свои, некоторые, эти, всех, своих, таких
Paradigm этот | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | этот | ||
Case=Acc | эту | это | |
Case=Dat | этой | этому | |
Case=Gen | этого | этой | этого |
Case=Loc | этом | этой | |
Case=Nom | этот | эта | это |
AUX
155 AUX tokens (52% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (155; 100%), Mood=Ind (155; 100%), Number=Sing (155; 100%), Person=EMPTY (155; 100%), Tense=Past (155; 100%), VerbForm=Fin (155; 100%), Voice=Act (155; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(32; 21% of non-emptyGender
): былаMasc
(74; 48% of non-emptyGender
): былNeut
(49; 32% of non-emptyGender
): былоEMPTY
(141): были, будет, бы, быть, есть, будут, будучи, буду, будь
Paradigm быть | Masc | Fem | Neut |
---|---|---|---|
был | была | было |
NUM
65 NUM tokens (22% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Animacy=EMPTY (52; 80%), Number=Sing (40; 62%).
NUM
tokens may have the following values of Gender
:
Fem
(25; 38% of non-emptyGender
): две, одной, одну, обе, однаMasc
(37; 57% of non-emptyGender
): один, два, одного, обоих, одним, оба, одном, одному, двух, полтораNeut
(3; 5% of non-emptyGender
): Одним, одно, одногоEMPTY
(225): несколько, больше, много, три, двух, 3, четыре, 1, десяти, нескольких
Paradigm один | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | одного | ||
Case=Acc | одну | ||
Case=Dat | одному | ||
Case=Gen | одного | одной | одного |
Case=Ins | одним | одной | Одним |
Case=Loc | одном | одной | |
Case=Nom | один | одна | одно |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (962; 58%),
NOUN –[det]–> DET (242; 52%),
VERB –[nsubj]–> PROPN (132; 70%),
VERB –[nsubj]–> PRON (127; 59%),
PROPN –[flat:name]–> PROPN (102; 99%),
NOUN –[flat:name]–> PROPN (92; 96%),
VERB –[aux:pass]–> AUX (80; 88%),
PROPN –[amod]–> ADJ (67; 97%),
VERB –[nsubj:pass]–> NOUN (66; 55%),
VERB –[conj]–> VERB (57; 52%).