Treebank Statistics: UD_Belarusian: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
3820 tokens (47%) have a non-empty value of Gender
.
2163 types (71%) occur at least once with a non-empty value of Gender
.
1521 lemmas (70%) occur at least once with a non-empty value of Gender
.
The feature is used with 9 part-of-speech tags: NOUN (2087; 26% instances), ADJ (615; 8% instances), PROPN (582; 7% instances), VERB (251; 3% instances), PRON (151; 2% instances), DET (81; 1% instances), AUX (22; 0% instances), NUM (22; 0% instances), X (9; 0% instances).
NOUN
2087 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (1840; 88%), Number=Sing (1488; 71%).
NOUN
tokens may have the following values of Gender
:
Fem
(730; 35% of non-emptyGender
): мова, санкцыі, краіны, краін, зарплата, асоб, вобласці, кампаніі, санкцый, тыс.Masc
(977; 47% of non-emptyGender
): сакавіка, года, рублёў, красавіка, млн, даляраў, лютым, конкурсу, чалавека, часNeut
(380; 18% of non-emptyGender
): дачыненні, выкананне, пакарання, правах, пакаранне, рашэнне, словах, парушэнні, прадпрыемстваў, сярэднімEMPTY
(1): дадзеныя
Paradigm справа | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | справу | |
Case=Gen|Number=Sing | справы | справы |
Case=Gen|Number=Plur | спраў | |
Case=Ins|Number=Sing | справай | |
Case=Loc|Number=Sing | справе | |
Case=Loc|Number=Plur | справах | |
Case=Nom|Number=Plur | справы |
Gender
seems to be lexical feature of NOUN
. 98% lemmas (810) occur only with one value of Gender
.
ADJ
615 ADJ tokens (70% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (615; 100%), Degree=Pos (611; 99%), Animacy=EMPTY (574; 93%).
ADJ
tokens may have the following values of Gender
:
Fem
(217; 35% of non-emptyGender
): беларускай, беларуская, беларускую, замежнай, сярэдняя, фінансавай, чэшская, Віцебскай, Гродзенскай, КастрычніцкаяMasc
(259; 42% of non-emptyGender
): 2012, 2011, беларускі, дзяржаўнага, міжнароднага, чорны, Нацыянальны, беларускім, знешняга, знешнімNeut
(139; 23% of non-emptyGender
): 23, 22, 20, смяротнае, 11, 12, 16, 25, 17, 19EMPTY
(262): беларускіх, замежных, беларускія, павінны, еўрапейскія, знешніх, новыя, апошнія, беларускімі, міжнародных
Paradigm беларускі | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | беларускі | ||
Case=Acc | беларускую | ||
Case=Dat | беларускаму | беларускай | |
Case=Gen | беларускага | беларускай | беларускага |
Case=Ins | беларускім | беларускай | беларускім |
Case=Loc | беларускім | беларускай | беларускім |
Case=Nom | беларускі | беларуская | беларускае |
PROPN
582 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (573; 98%), Animacy=Inan (413; 71%).
PROPN
tokens may have the following values of Gender
:
Fem
(265; 46% of non-emptyGender
): Беларусі, Беларусь, АЭС, Белавія, Беларуссю, Эштан, Кэтрын, ДАІ, Літвы, РасііMasc
(294; 51% of non-emptyGender
): ЕС, Тэлеграф, Уладзіслава, Еўрасаюза, Кавалёва, МЗС, ВВД, Уладзімір, МММ, МінскNeut
(23; 4% of non-emptyGender
): БелТА, МНС, УКДБ, Еўрабачанне, Эспо, БДЭУ, Гродне, Езярышчы, Еўрабачання, МУСEMPTY
(6): Р, В., ЗША, М, П.
Paradigm гродна | Masc | Neut |
---|---|---|
Case=Gen | Гродна | |
Case=Loc | Гродне |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (214) occur only with one value of Gender
.
VERB
251 VERB tokens (30% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (251; 100%), Person=EMPTY (251; 100%), Tense=Past (249; 99%), Mood=Ind (208; 83%), VerbForm=Fin (208; 83%), Aspect=Perf (198; 79%), Voice=Act (172; 69%).
VERB
tokens may have the following values of Gender
:
Fem
(105; 42% of non-emptyGender
): магла, сказала, склала, чула, адзначыла, заявіла, налічаная, зацікавіла, паведаміла, перамаглаMasc
(115; 46% of non-emptyGender
): перадаваў, адзначыў, заявіў, паведамляў, заклікаў, паведаміў, пайшоў, распавёў, сказаў, атрымаўNeut
(31; 12% of non-emptyGender
): атрымалася, Здзейснена, Меркавалася, аказалася, аказвала, выкарыстана, выключана, выявіла, дазволена, даследаванаEMPTY
(588): можа, паведамілі, мае, з’яўляецца, маюць, размаўляць, Гавары, ведаю, веру, вярнуцца
Paradigm паведаміць | Masc | Fem |
---|---|---|
паведаміў | паведаміла |
PRON
151 PRON tokens (48% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (151; 100%), Person=EMPTY (121; 80%), Animacy=EMPTY (80; 53%).
PRON
tokens may have the following values of Gender
:
Fem
(19; 13% of non-emptyGender
): яна, яе, якая, якой, якую, ёйMasc
(37; 25% of non-emptyGender
): які, ён, яго, каго, якім, ім, кім, ніхто, хто, якогаNeut
(95; 63% of non-emptyGender
): гэта, таго, тое, гэтым, тым, што, гэтага, чым, усё, ўсёEMPTY
(162): я, якія, мы, яны, мне, вы, мяне, іх, нас, якіх
Paradigm які | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc|PronType=Rel | які | ||
Case=Acc | якую | ||
Case=Gen|PronType=Rel | якога | якой | |
Case=Ins|PronType=Rel | якім | ||
Case=Loc|PronType=Rel | якім | якой | |
Case=Nom|PronType=Rel | які | якая | якое |
Gender
seems to be lexical feature of PRON
. 92% lemmas (11) occur only with one value of Gender
.
DET
81 DET tokens (57% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (81; 100%), Animacy=EMPTY (69; 85%), Poss=EMPTY (68; 84%).
DET
tokens may have the following values of Gender
:
Fem
(31; 38% of non-emptyGender
): сваю, гэтую, гэтай, сваёй, адной, нашай, Якой, вашай, вашую, гэтаеMasc
(42; 52% of non-emptyGender
): гэтага, гэты, гэтым, тым, адным, любы, свой, ўсім, аднаго, кожныNeut
(8; 10% of non-emptyGender
): сваю, Пэўнае, гэта, гэтым, сваё, усё, ўсёEMPTY
(60): сваіх, яе, свае, іх, гэтых, гэтыя, такія, Усе, гэтымі, нашы
Paradigm гэты | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc|PronType=Dem | гэты | гэта | |
Case=Acc|PronType=Dem | гэтую, гэтае | ||
Case=Gen|PronType=Dem | гэтага | гэтай | |
Case=Ins|PronType=Dem | гэтым | ||
Case=Loc | гэтым | ||
Case=Loc|PronType=Dem | гэтым | гэтай | |
Case=Nom|PronType=Dem | гэты |
AUX
22 AUX tokens (32% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (22; 100%), Mood=Ind (22; 100%), Number=Sing (22; 100%), Person=EMPTY (22; 100%), Tense=Past (22; 100%), VerbForm=Fin (22; 100%), Voice=Act (22; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(4; 18% of non-emptyGender
): былаMasc
(3; 14% of non-emptyGender
): быўNeut
(15; 68% of non-emptyGender
): было, былаEMPTY
(46): будзе, будуць, былі, буду, быць, будзем, ёсць, будзеш
Paradigm быць | Masc | Fem | Neut |
---|---|---|---|
быў | была | было, была |
NUM
22 NUM tokens (15% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (18; 82%).
NUM
tokens may have the following values of Gender
:
Fem
(3; 14% of non-emptyGender
): абедзвюх, абодвух, дзвеMasc
(18; 82% of non-emptyGender
): два, двух, адзін, 1, 2, аднаго, адным, двума, паўтараNeut
(1; 5% of non-emptyGender
): аднагоEMPTY
(120): 10, 2011, 500, некалькі, 1,5, 2,9, 29, многіх, пяць, 11
Paradigm два | Masc | Fem |
---|---|---|
Animacy=Anim|Case=Acc|NumType=Card | двух | |
Animacy=Inan|Case=Acc|NumType=Card | два | |
Case=Gen|NumType=Card | двух | |
Case=Ins|NumType=Card | двума | |
Case=Loc|NumType=Card | двух | |
Case=Nom | два | дзве |
X
9 X tokens (20% of all X
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which X
and Gender
co-occurred: Animacy=Anim (9; 100%), Case=Gen (9; 100%), Number=Sing (9; 100%).
X
tokens may have the following values of Gender
:
Masc
(9; 100% of non-emptyGender
): °СEMPTY
(36): Aju, Daeryook, Firm, Internatonal, Law, Telegraf.by, Litesound, AFP, Are, Daily
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (448; 62%),
PROPN –[flat]–> PROPN (75; 94%),
NOUN –[conj]–> NOUN (74; 56%),
NOUN –[det]–> DET (61; 51%),
PROPN –[conj]–> PROPN (57; 81%),
VERB –[nsubj]–> PROPN (43; 51%),
NOUN –[flat]–> PROPN (27; 63%),
ADJ –[conj]–> ADJ (22; 92%),
VERB –[conj]–> VERB (15; 60%),
NOUN –[appos]–> PROPN (13; 81%).