Treebank Statistics: UD_Belarusian-HSE: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
126693 tokens (42%) have a non-empty value of Gender.
37281 types (72%) occur at least once with a non-empty value of Gender.
18160 lemmas (62%) occur at least once with a non-empty value of Gender.
The feature is used with 11 part-of-speech tags: NOUN (71396; 23% instances), PROPN (18806; 6% instances), ADJ (17069; 6% instances), VERB (8173; 3% instances), PRON (5554; 2% instances), DET (4290; 1% instances), AUX (848; 0% instances), NUM (516; 0% instances), ADV (32; 0% instances), SYM (8; 0% instances), CCONJ (1; 0% instances).
NOUN
71396 NOUN tokens (98% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (59230; 83%), Number=Sing (51026; 71%).
NOUN tokens may have the following values of Gender:
Fem(25838; 36% of non-emptyGender): сядзіба, мовы, абароны, варта, тысяч, гісторыі, мову, волі, працы, моваMasc(37094; 52% of non-emptyGender): дзень, людзей, чалавек, годзе, гадоў, час, людзі, года, год, годуNeut(8464; 12% of non-emptyGender): відэа, месца, фота, імя, радыё, жыццё, дзяцей, месцы, кіно, праваEMPTY(1300): Арт, г., вул., км, смі, ст., BYN, АМАП, рэж., АЭС
| Paradigm месца | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc|Number=Sing | месца | ||
| Case=Acc|Number=Plur | месцы | месцы | |
| Case=Dat|Number=Sing | месцу | ||
| Case=Dat|Number=Plur | месцам | ||
| Case=Gen|Number=Sing | месца | ||
| Case=Gen|Number=Plur | месцаў, месц | ||
| Case=Ins|Number=Sing | месцам | ||
| Case=Ins|Number=Plur | Месцамі | ||
| Case=Loc|Number=Sing | месцы | месцы | |
| Case=Loc|Number=Plur | месцах | ||
| Case=Nom|Number=Sing | меца | месца | |
| Case=Nom|Number=Sing|Typo=Yes | месяца | ||
| Case=Nom|Number=Plur | месцы |
Gender seems to be lexical feature of NOUN. 99% lemmas (8884) occur only with one value of Gender.
PROPN
18806 PROPN tokens (92% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (17673; 94%), Animacy=Anim (10653; 57%).
PROPN tokens may have the following values of Gender:
Fem(7106; 38% of non-emptyGender): Беларусі, Беларусь, курапатах, Курапатаў, Курапаты, Расеі, Горадні, Ціханоўскай, Свабоды, РасеяMasc(11271; 60% of non-emptyGender): Менску, Лукашэнка, Лукашэнкі, Менск, Лукашэнку, Сяргей, Ціханоўскага, Аляксандар, Андрэй, МашэраваNeut(429; 2% of non-emptyGender): Берасьці, МУТНАЕВОКА, мінздароўя, Дынама, БелТА, Берасьця, Гродна, Берасьце, Еўрарадыё, МутнаевокаEMPTY(1577): ЗША, COVID, БНР, БССР, БНФ, КДБ, ЦВК, ссср, БРСМ, А.
| Paradigm Каляда | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Nom|NameType=Prs|Number=Sing | Каляда | ||
| Animacy=Anim|Case=Nom|NameType=Sur|Number=Sing | Каляда | ||
| Animacy=Inan|Case=Acc|NameType=Oth|Number=Plur | Каляды |
Gender seems to be lexical feature of PROPN. 98% lemmas (3641) occur only with one value of Gender.
ADJ
17069 ADJ tokens (64% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (17066; 100%), Degree=Pos (16852; 99%), Animacy=EMPTY (15303; 90%).
ADJ tokens may have the following values of Gender:
Fem(6766; 40% of non-emptyGender): беларускай, беларускую, беларуская, роднай, першай, народнай, першая, курапацкай, новая, новуюMasc(7754; 45% of non-emptyGender): новы, беларускі, першы, добры, беларускага, вялікі, былы, другі, новага, вольныNeut(2549; 15% of non-emptyGender): вядома, магчыма, важна, першае, цывільным, цікава, галоўнае, вялікае, годна, беларускаеEMPTY(9748): надзвычайных, беларускіх, беларускія, 2019, розных, 2018, новыя, 12, 23, 1
| Paradigm беларускі | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | беларускага | ||
| Animacy=Inan|Case=Acc | беларускі | беларускае | |
| Case=Acc | беларускую | ||
| Case=Dat | беларускаму | беларускай | беларускаму |
| Case=Gen | беларускага | беларускай, беларускае, беларуская | беларускага |
| Case=Gen|Typo=Yes | беларускай | ||
| Case=Ins | беларускім | беларускай | беларускім |
| Case=Loc | беларускім | беларускай | беларускім |
| Case=Nom | беларускі, Беларускi | беларуская | беларускае |
VERB
8173 VERB tokens (26% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=EMPTY (8171; 100%), Number=Sing (8168; 100%), Tense=Past (8145; 100%), Mood=Ind (6740; 82%), VerbForm=Fin (6740; 82%), Aspect=Perf (6530; 80%), Voice=Act (5253; 64%).
VERB tokens may have the following values of Gender:
Fem(2523; 31% of non-emptyGender): стала, адбылася, сказала, была, выйшла, расказала, пачала, памерла, прайшла, паведамілаMasc(4650; 57% of non-emptyGender): сказаў, стаў, памёр, атрымаў, заявіў, расказаў, прайшоў, мог, заклікаў, напісаўNeut(1000; 12% of non-emptyGender): было, адбылося, стала, засталося, пачалося, атрымалася, выйшла, зроблена, адбывалася, прайшлоEMPTY(22910): можна, трэба, можа, жыве, няма, мае, адбудзецца, затрымалі, кажа, пачалі
| Paradigm магчы | Masc | Fem | Neut |
|---|---|---|---|
| мог | магла | магло |
PRON
5554 PRON tokens (54% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (5551; 100%), Person=EMPTY (4055; 73%), Case=Nom (2910; 52%).
PRON tokens may have the following values of Gender:
Fem(820; 15% of non-emptyGender): яна, якая, яе, якой, ёй, якую, ёю, беларуска, вышынёй, штоMasc(2190; 39% of non-emptyGender): ён, які, хто, яго, яму, якім, ім, якога, каго, ніхтоNeut(2544; 46% of non-emptyGender): гэта, што, тое, таго, тым, ўсё, усё, нічога, чым, гэтымEMPTY(4768): мы, я, якія, яны, вы, нас, іх, вас, нам, мяне
| Paradigm які | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing|PronType=Rel | якога | якога | |
| Animacy=Anim|Case=Ins|Number=Sing|PronType=Rel | якiм | ||
| Animacy=Inan|Case=Acc|Number=Sing|PronType=Rel | які, якi | якое | |
| Animacy=Inan|Case=Dat|Number=Sing|PronType=Rel | якому | ||
| Case=Acc|Number=Sing | якую | ||
| Case=Acc|Number=Sing|PronType=Rel | якую | ||
| Case=Dat|Number=Sing|PronType=Rel | якому | якой | |
| Case=Dat|Number=Plur|PronType=Rel | якім | ||
| Case=Gen|Number=Sing|PronType=Rel | якога | якой | якога |
| Case=Ins|Number=Sing|PronType=Rel | якім | якой, якою | Якім |
| Case=Loc|Number=Sing|PronType=Rel | якім | якой | якім |
| Case=Nom|Number=Sing | якая | ||
| Case=Nom|Number=Sing|PronType=Rel | які, якi | якая | якое |
DET
4290 DET tokens (64% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (4286; 100%), Reflex=EMPTY (3738; 87%), Animacy=EMPTY (3453; 80%), Poss=EMPTY (2744; 64%).
DET tokens may have the following values of Gender:
Fem(1481; 35% of non-emptyGender): сваю, сваёй, нашай, гэтую, гэтай, наша, адной, гэтая, такая, такойMasc(2158; 50% of non-emptyGender): гэты, наш, свой, кожны, адзін, той, тым, гэтым, нашым, гэтагаNeut(651; 15% of non-emptyGender): самае, такое, сваё, гэтае, ўсё, усё, іншае, адно, гэтым, маёEMPTY(2441): яго, яе, іх, свае, іншых, усе, іншыя, гэтыя, тых, ўсе
| Paradigm наш | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | нашага | ||
| Animacy=Inan|Case=Acc | наш, нам | нашае, наша | |
| Case=Acc | нашу, нашую | ||
| Case=Dat | нашаму | нашай | |
| Case=Gen | нашага, наша | нашай, нашае | нашага |
| Case=Ins | нашым | нашай | нашым |
| Case=Loc | нашым | нашай | нашым |
| Case=Nom | наш, НАШЫ | наша, нашая, Ніша | наша, нашае, Наше |
AUX
848 AUX tokens (41% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Number=Sing (848; 100%), Person=EMPTY (848; 100%), Mood=Ind (845; 100%), Tense=Past (845; 100%), VerbForm=Fin (845; 100%), Voice=Act (845; 100%), Aspect=EMPTY (675; 80%).
AUX tokens may have the following values of Gender:
Fem(144; 17% of non-emptyGender): была, будуMasc(349; 41% of non-emptyGender): быў, БУДЗЕNeut(355; 42% of non-emptyGender): было, былаEMPTY(1235): будзе, былі, будуць, б, быць, будзем, ёсць, бы, буду, будзеш
| Paradigm быць | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc | буду | ||
| Aspect=Imp|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | быў | была | было, была |
| Aspect=Perf|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | Быў | ||
| Case=Loc | БУДЗЕ | ||
| Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | быў | была | было, была |
NUM
516 NUM tokens (9% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (498; 97%).
NUM tokens may have the following values of Gender:
Fem(136; 26% of non-emptyGender): адна, дзьве, дзве, адну, паўтары, дзьвюх, абедзьве, дзвюма, дзвюх, аднойMasc(354; 69% of non-emptyGender): два, адзін, двух, аднаго, паўтара, двума, абодва, абодвух, двум, паўтарыNeut(26; 5% of non-emptyGender): адно, аднаго, адным, Два, ОбаEMPTY(5330): 10, 2, 5, некалькі, 1, тры, 20, 3, 100, колькі
| Paradigm два | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|NumType=Card | двух | дзьвюх | |
| Animacy=Inan|Case=Acc|NumType=Card | два | дзьве, дзве, две | |
| Case=Dat|NumType=Card | двум | ||
| Case=Gen|NumType=Card | двух, дзвюх | дзвюх, дзьвюх | |
| Case=Ins|NumType=Card | двума | дзьвюма | |
| Case=Loc|NumType=Card | двух | дзвюх, двух, дзьвюх | |
| Case=Nom | два | дзве | |
| Case=Nom|NumType=Card | два | дзьве, дзве | Два |
ADV
32 ADV tokens (0% of all ADV tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADV and Gender co-occurred: Degree=Pos (32; 100%).
ADV tokens may have the following values of Gender:
Fem(12; 38% of non-emptyGender): Абавязкова, канчаткова, цікава, абавязковы, крута, незвычаяна, сезонна, сьветапоглядна, эмацыйнаMasc(17; 53% of non-emptyGender): годна, палітычна, ўрачыста, пераважна, файна, фізічна, цёпла, эмацыйна, ўважліваNeut(3; 9% of non-emptyGender): канчаткова, часоваEMPTY(11006): як, яшчэ, больш, тут, таксама, так, дзе, таму, ўжо, цяпер
| Paradigm канчаткова | Fem | Neut |
|---|---|---|
| Case=Gen | канчаткова | |
| Case=Nom | канчаткова |
SYM
8 SYM tokens (0% of all SYM tokens) have a non-empty value of Gender.
SYM tokens may have the following values of Gender:
Masc(8; 100% of non-emptyGender): °СEMPTY(2604): %, 📌, >, </a>, ⚡, +, 🔥, ⚡️, №, 👉
CCONJ
1 CCONJ tokens (0% of all CCONJ tokens) have a non-empty value of Gender.
CCONJ tokens may have the following values of Gender:
Fem(1; 100% of non-emptyGender): iEMPTY(9000): і, а, але, ці, ды, або, й, ні, Таксама, аднак
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (13660; 69%),
PROPN –[flat:name]–> PROPN (3630; 97%),
NOUN –[det]–> DET (3145; 63%),
NOUN –[conj]–> NOUN (2476; 51%),
NOUN –[appos]–> PROPN (1651; 70%),
VERB –[nsubj]–> PROPN (1029; 55%),
PROPN –[conj]–> PROPN (731; 70%),
VERB –[nsubj:pass]–> NOUN (477; 62%),
ADJ –[conj]–> ADJ (440; 91%),
PROPN –[amod]–> ADJ (412; 82%).