Treebank Statistics: UD_Belarusian-HSE: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
126684 tokens (42%) have a non-empty value of Gender
.
37280 types (72%) occur at least once with a non-empty value of Gender
.
18186 lemmas (62%) occur at least once with a non-empty value of Gender
.
The feature is used with 11 part-of-speech tags: NOUN (71309; 23% instances), PROPN (18880; 6% instances), ADJ (17063; 6% instances), VERB (8179; 3% instances), PRON (5554; 2% instances), DET (4294; 1% instances), AUX (848; 0% instances), NUM (516; 0% instances), ADV (32; 0% instances), SYM (8; 0% instances), CCONJ (1; 0% instances).
NOUN
71309 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (59189; 83%), Number=Sing (50949; 71%).
NOUN
tokens may have the following values of Gender
:
Fem
(25820; 36% of non-emptyGender
): сядзіба, мовы, абароны, варта, тысяч, гісторыі, мову, волі, працы, моваMasc
(37028; 52% of non-emptyGender
): дзень, людзей, чалавек, годзе, гадоў, час, людзі, года, год, годуNeut
(8461; 12% of non-emptyGender
): відэа, месца, фота, імя, радыё, жыццё, дзяцей, месцы, кіно, праваEMPTY
(1244): Арт, г., вул., км, смі, ст., BYN, АМАП, рэж., в.
Paradigm месца | Masc | Fem | Neut |
---|---|---|---|
Case=Acc|Number=Sing | месца | ||
Case=Acc|Number=Plur | месцы | месцы | |
Case=Dat|Number=Sing | месцу | ||
Case=Dat|Number=Plur | месцам | ||
Case=Gen|Number=Sing | месца | ||
Case=Gen|Number=Plur | месцаў, месц | ||
Case=Ins|Number=Sing | месцам | ||
Case=Ins|Number=Plur | Месцамі | ||
Case=Loc|Number=Sing | месцы | месцы | |
Case=Loc|Number=Plur | месцах | ||
Case=Nom|Number=Sing | меца | месца | |
Case=Nom|Number=Sing|Typo=Yes | месяца | ||
Case=Nom|Number=Plur | месцы |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (8869) occur only with one value of Gender
.
PROPN
18880 PROPN tokens (92% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (17747; 94%), Animacy=Anim (10699; 57%).
PROPN
tokens may have the following values of Gender
:
Fem
(7102; 38% of non-emptyGender
): Беларусі, Беларусь, Курапатах, Курапатаў, Курапаты, Расеі, Горадні, Ціханоўскай, Свабоды, РасеяMasc
(11335; 60% of non-emptyGender
): Менску, Лукашэнка, Лукашэнкі, Менск, Лукашэнку, Сяргей, Ціханоўскага, Аляксандар, Андрэй, МашэраваNeut
(443; 2% of non-emptyGender
): Берасьці, МУТНАЕВОКА, мінздароўя, Дынама, БелТА, Берасьця, Гродна, Берасьце, Еўрарадыё, МутнаевокаEMPTY
(1632): ЗША, COVID, БНР, БССР, БНФ, КДБ, ЦВК, ссср, БРСМ, А.
Paradigm Курапаты | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Nom|Number=Sing | КУРАПАТАЎ | ||
Animacy=Inan|Case=Acc|Number=Plur | Курапаты, КУРАПАТЫ | ||
Animacy=Inan|Case=Gen|Number=Plur | КУРАПАТАЎ | Курапатаў, Курапат, КУРАПАТАЎ | |
Animacy=Inan|Case=Ins|Number=Plur | Курапатамі | ||
Animacy=Inan|Case=Loc|Number=Plur | Курапатах, КУРАПАТАХ | курапатах | |
Animacy=Inan|Case=Nom|Number=Plur | Курапаты, КУРАПАТЫ |
Gender
seems to be lexical feature of PROPN
. 97% lemmas (3653) occur only with one value of Gender
.
ADJ
17063 ADJ tokens (64% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (17061; 100%), Degree=Pos (16899; 99%), Animacy=EMPTY (15299; 90%).
ADJ
tokens may have the following values of Gender
:
Fem
(6765; 40% of non-emptyGender
): беларускай, беларускую, беларуская, роднай, першай, народнай, першая, курапацкай, новая, новуюMasc
(7754; 45% of non-emptyGender
): новы, беларускі, першы, добры, беларускага, вялікі, былы, другі, новага, вольныNeut
(2544; 15% of non-emptyGender
): вядома, магчыма, важна, першае, цывільным, цікава, галоўнае, вялікае, годна, беларускаеEMPTY
(9748): надзвычайных, беларускіх, беларускія, 2019, розных, 2018, новыя, 12, 23, 1
Paradigm беларускі | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | беларускага | ||
Animacy=Inan|Case=Acc | беларускі | беларускае | |
Case=Acc | беларускую | ||
Case=Dat | беларускаму | беларускай | беларускаму |
Case=Gen | беларускага | беларускай, беларускае, беларуская | беларускага |
Case=Gen|Typo=Yes | беларускай | ||
Case=Ins | беларускім | беларускай | беларускім |
Case=Loc | беларускім | беларускай | беларускім |
Case=Nom | беларускі, Беларускi | беларуская | беларускае |
VERB
8179 VERB tokens (26% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Person=EMPTY (8177; 100%), Number=Sing (8174; 100%), Tense=Past (8151; 100%), Mood=Ind (6747; 82%), VerbForm=Fin (6747; 82%), Aspect=Perf (6534; 80%), Voice=Act (5259; 64%).
VERB
tokens may have the following values of Gender
:
Fem
(2523; 31% of non-emptyGender
): стала, адбылася, сказала, была, выйшла, расказала, пачала, памерла, прайшла, паведамілаMasc
(4656; 57% of non-emptyGender
): сказаў, стаў, памёр, атрымаў, заявіў, расказаў, прайшоў, мог, адказаў, заклікаўNeut
(1000; 12% of non-emptyGender
): было, адбылося, стала, засталося, пачалося, атрымалася, выйшла, зроблена, адбывалася, прайшлоEMPTY
(22913): можна, трэба, можа, жыве, няма, мае, адбудзецца, затрымалі, кажа, пачалі
Paradigm магчы | Masc | Fem | Neut |
---|---|---|---|
мог | магла | магло |
PRON
5554 PRON tokens (54% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (5551; 100%), Person=EMPTY (4055; 73%), Case=Nom (2908; 52%).
PRON
tokens may have the following values of Gender
:
Fem
(821; 15% of non-emptyGender
): яна, якая, яе, якой, ёй, якую, ёю, беларуска, вышынёй, сабойMasc
(2190; 39% of non-emptyGender
): ён, які, хто, яго, яму, якім, ім, якога, каго, ніхтоNeut
(2543; 46% of non-emptyGender
): гэта, што, тое, таго, тым, ўсё, усё, нічога, чым, гэтымEMPTY
(4773): мы, я, якія, яны, вы, нас, іх, вас, нам, мяне
Paradigm які | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing|PronType=Rel | якога | якога | |
Animacy=Anim|Case=Ins|Number=Sing|PronType=Rel | якiм | ||
Animacy=Inan|Case=Acc|Number=Sing|PronType=Rel | які, якi | якое | |
Animacy=Inan|Case=Dat|Number=Sing|PronType=Rel | якому | ||
Case=Acc|Number=Sing | якую | ||
Case=Acc|Number=Sing|PronType=Rel | якую | ||
Case=Dat|Number=Sing|PronType=Rel | якому | якой | |
Case=Dat|Number=Plur|PronType=Rel | якім | ||
Case=Gen|Number=Sing|PronType=Rel | якога | якой | якога |
Case=Ins|Number=Sing|PronType=Rel | якім | якой, якою | Якім |
Case=Loc|Number=Sing|PronType=Rel | якім | якой | якім |
Case=Nom|Number=Sing | якая | ||
Case=Nom|Number=Sing|PronType=Rel | які, якi | якая | якое |
DET
4294 DET tokens (64% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (4289; 100%), Reflex=EMPTY (3742; 87%), Animacy=EMPTY (3455; 80%), Poss=EMPTY (2748; 64%).
DET
tokens may have the following values of Gender
:
Fem
(1482; 35% of non-emptyGender
): сваю, сваёй, нашай, гэтую, гэтай, наша, адной, гэтая, такая, такойMasc
(2159; 50% of non-emptyGender
): гэты, наш, свой, кожны, адзін, той, тым, гэтым, нашым, гэтагаNeut
(653; 15% of non-emptyGender
): самае, такое, сваё, гэтае, ўсё, усё, іншае, адно, гэтым, маёEMPTY
(2437): яго, яе, іх, свае, іншых, усе, іншыя, гэтыя, тых, ўсе
Paradigm наш | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Poss=Yes|PronType=Prs | нашага | ||
Animacy=Inan|Case=Acc | нам | ||
Animacy=Inan|Case=Acc|Poss=Yes|PronType=Prs | наш | нашае, наша | |
Case=Acc|Poss=Yes|PronType=Prs | нашу, нашую | ||
Case=Dat|Poss=Yes|PronType=Prs | нашаму | нашай | |
Case=Gen|Poss=Yes|PronType=Prs | нашага, наша | нашай, нашае | нашага |
Case=Ins|Poss=Yes|PronType=Prs | нашым | нашай | нашым |
Case=Loc|Poss=Yes|PronType=Prs | нашым | нашай | нашым |
Case=Nom|Poss=Yes|PronType=Prs | наш, НАШЫ | наша, нашая, Ніша | наша, нашае, Наше |
AUX
848 AUX tokens (41% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Number=Sing (848; 100%), Person=EMPTY (848; 100%), Mood=Ind (845; 100%), Tense=Past (845; 100%), VerbForm=Fin (845; 100%), Voice=Act (845; 100%), Aspect=EMPTY (675; 80%).
AUX
tokens may have the following values of Gender
:
Fem
(144; 17% of non-emptyGender
): была, будуMasc
(349; 41% of non-emptyGender
): быў, БУДЗЕNeut
(355; 42% of non-emptyGender
): было, былаEMPTY
(1236): будзе, былі, будуць, б, быць, будзем, ёсць, бы, буду, будзеш
Paradigm быць | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | буду | ||
Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | быў | была | было, была |
Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | Быў | ||
Case=Loc | БУДЗЕ | ||
Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | быў | была | было, была |
NUM
516 NUM tokens (9% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (498; 97%).
NUM
tokens may have the following values of Gender
:
Fem
(136; 26% of non-emptyGender
): адна, дзьве, дзве, адну, паўтары, дзьвюх, абедзьве, дзвюма, дзвюх, аднойMasc
(354; 69% of non-emptyGender
): два, адзін, двух, аднаго, паўтара, двума, абодва, абодвух, двум, паўтарыNeut
(26; 5% of non-emptyGender
): адно, аднаго, адным, Два, ОбаEMPTY
(5329): 10, 2, 5, некалькі, 1, тры, 20, 3, 100, колькі
Paradigm два | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|NumType=Card | двух | дзьвюх | |
Animacy=Inan|Case=Acc|NumType=Card | два | дзьве, дзве, две | |
Case=Dat|NumType=Card | двум | ||
Case=Gen|NumType=Card | двух, дзвюх | дзвюх, дзьвюх | |
Case=Ins|NumType=Card | двума | дзьвюма | |
Case=Loc|NumType=Card | двух | дзвюх, двух, дзьвюх | |
Case=Nom | два | дзве | |
Case=Nom|NumType=Card | два | дзьве, дзве | Два |
ADV
32 ADV tokens (0% of all ADV
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADV
and Gender
co-occurred: Degree=Pos (32; 100%).
ADV
tokens may have the following values of Gender
:
Fem
(12; 38% of non-emptyGender
): Абавязкова, канчаткова, цікава, абавязковы, крута, незвычаяна, сезонна, сьветапоглядна, эмацыйнаMasc
(17; 53% of non-emptyGender
): годна, палітычна, ўрачыста, пераважна, файна, фізічна, цёпла, эмацыйна, ўважліваNeut
(3; 9% of non-emptyGender
): канчаткова, часоваEMPTY
(11012): як, яшчэ, больш, тут, таксама, так, дзе, таму, ўжо, цяпер
Paradigm канчаткова | Fem | Neut |
---|---|---|
Case=Gen | канчаткова | |
Case=Nom | канчаткова |
SYM
8 SYM tokens (0% of all SYM
tokens) have a non-empty value of Gender
.
SYM
tokens may have the following values of Gender
:
Masc
(8; 100% of non-emptyGender
): °СEMPTY
(2597): %, 📌, >, </a>, ⚡, +, 🔥, ⚡️, №, 👉
CCONJ
1 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Gender
.
CCONJ
tokens may have the following values of Gender
:
Fem
(1; 100% of non-emptyGender
): iEMPTY
(8998): і, а, але, ці, ды, або, й, ні, Таксама, аднак
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (13644; 69%),
PROPN –[flat:name]–> PROPN (3634; 97%),
NOUN –[det]–> DET (3150; 63%),
NOUN –[conj]–> NOUN (2471; 51%),
NOUN –[appos]–> PROPN (1649; 70%),
VERB –[nsubj]–> PROPN (1036; 55%),
PROPN –[conj]–> PROPN (731; 70%),
VERB –[nsubj:pass]–> NOUN (476; 62%),
ADJ –[conj]–> ADJ (440; 91%),
PROPN –[amod]–> ADJ (426; 82%).