Treebank Statistics: UD_Ukrainian-IU: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
50617 tokens (41%) have a non-empty value of Gender
.
22990 types (73%) occur at least once with a non-empty value of Gender
.
12963 lemmas (72%) occur at least once with a non-empty value of Gender
.
The feature is used with 9 part-of-speech tags: NOUN (28827; 24% instances), ADJ (8177; 7% instances), VERB (3592; 3% instances), PROPN (3390; 3% instances), DET (2981; 2% instances), PRON (2754; 2% instances), AUX (480; 0% instances), NUM (405; 0% instances), X (11; 0% instances).
NOUN
28827 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Animacy=Inan (24673; 86%), Number=Sing (20705; 72%).
NOUN
tokens may have the following values of Gender
:
Fem
(11220; 39% of non-emptyGender
): людей, люди, мови, грн, області, землі, ради, роботи, тварин, територіїMasc
(12921; 45% of non-emptyGender
): час, року, %, років, часу, №, р, чоловік, році, рікNeut
(4686; 16% of non-emptyGender
): життя, питання, слова, рішення, ст, використання, очі, місце, видання, населенняEMPTY
(480): грошей, даних, виборів, гроші, двері, дані, коштів, ЗМІ, даними, дверей
Paradigm голова | Masc | Fem |
---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | Голову | |
Animacy=Anim|Case=Dat|Number=Sing | голові | |
Animacy=Anim|Case=Gen|Number=Sing | голови | |
Animacy=Anim|Case=Gen|Number=Plur | голів | |
Animacy=Anim|Case=Ins|Number=Sing | головою | |
Animacy=Anim|Case=Nom|Number=Sing | голова | Голова |
Animacy=Inan|Case=Acc|Number=Sing | голову | |
Animacy=Inan|Case=Acc|Number=Plur | голови | |
Animacy=Inan|Case=Gen|Number=Sing | голови | |
Animacy=Inan|Case=Ins|Number=Sing | головою | |
Animacy=Inan|Case=Loc|Number=Sing | голові | |
Animacy=Inan|Case=Nom|Number=Sing | голова | |
Animacy=Inan|Case=Nom|Number=Plur | голови |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (6880) occur only with one value of Gender
.
ADJ
8177 ADJ tokens (68% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (8177; 100%), Animacy=EMPTY (7626; 93%), Aspect=EMPTY (7425; 91%), VerbForm=EMPTY (7425; 91%), Voice=EMPTY (7425; 91%), Degree=EMPTY (5840; 71%).
ADJ
tokens may have the following values of Gender
:
Fem
(3389; 41% of non-emptyGender
): української, державної, національної, українська, великої, Тернопільської, нову, верховної, нова, цілуMasc
(3365; 41% of non-emptyGender
): 2017, 2016, українського, перший, український, цілий, першого, 2015, новий, новогоNeut
(1423; 17% of non-emptyGender
): ціле, 27, XI, нове, 1, 3, 15, 25, державного, 14EMPTY
(3831): різних, українських, перших, різні, нових, нові, місцевих, перші, великі, повинні
Paradigm український | Masc | Fem | Neut |
---|---|---|---|
Animacy=Inan|Case=Acc | український | ||
Case=Acc | українську | українське | |
Case=Dat | українському | українській | Українському |
Case=Gen | українського | української | українського |
Case=Ins | українським | українською | |
Case=Loc | українському | українській | українському |
Case=Nom | український | українська | українське |
VERB
3592 VERB tokens (28% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=Ind (3592; 100%), Number=Sing (3592; 100%), Person=EMPTY (3592; 100%), Tense=Past (3592; 100%), VerbForm=Fin (3592; 100%), Aspect=Perf (1952; 54%).
VERB
tokens may have the following values of Gender
:
Fem
(1090; 30% of non-emptyGender
): була, стала, стояла, мала, знала, любила, зробила, казала, могла, почалаMasc
(1972; 55% of non-emptyGender
): мав, міг, був, почав, сказав, знав, став, хотів, бачив, пішовNeut
(530; 15% of non-emptyGender
): було, стало, виявилося, вдалося, довелося, здавалося, могло, вийшло, хотілося, відбулосяEMPTY
(9250): є, може, має, каже, немає, можуть, мають, були, мали, нема
Paradigm бути | Masc | Fem | Neut |
---|---|---|---|
був | була | було |
PROPN
3390 PROPN tokens (97% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (3368; 99%), Uninflect=EMPTY (2889; 85%), Animacy=Anim (2004; 59%).
PROPN
tokens may have the following values of Gender
:
Fem
(1255; 37% of non-emptyGender
): україни, Україні, Україна, Міра, Росії, Марія, Мотря, Європи, Ради, ЄвропіMasc
(2043; 60% of non-emptyGender
): київ, Києва, Вінстон, Гнат, Києві, Михась, О, ХАІ, Андрій, ЛьвовіNeut
(92; 3% of non-emptyGender
): Закарпаття, Вапліте, Полісся, Сан-Ремо, Токіо, 3G, ЄС, Євро, Дзвонкове, ЗакарпаттіEMPTY
(114): США, в, б, А, Карпати, Черкаси, Карпат, д, с, і
Paradigm І. | Masc | Fem |
---|---|---|
Case=Acc|NameType=Giv | І | |
Case=Gen|NameType=Giv | І | |
Case=Gen|NameType=Pat | І | |
Case=Nom|NameType=Giv | І | І |
Case=Nom|NameType=Pat | І |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (1512) occur only with one value of Gender
.
DET
2981 DET tokens (64% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (2981; 100%), Animacy=EMPTY (2658; 89%), Reflex=EMPTY (2590; 87%), Person=EMPTY (2421; 81%), Poss=EMPTY (2154; 72%).
DET
tokens may have the following values of Gender
:
Fem
(1127; 38% of non-emptyGender
): яка, його, свою, ця, яку, цю, сама, така, цій, цієїMasc
(1360; 46% of non-emptyGender
): який, той, цей, цього, один, його, сам, свій, свого, тогоNeut
(494; 17% of non-emptyGender
): його, все, таке, яке, своє, це, одне, цього, її, томуEMPTY
(1668): які, всі, кілька, інших, ці, яких, ті, всіх, багато, такі
Paradigm який | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|PronType=Rel | якого | ||
Animacy=Inan|Case=Acc|PronType=Ind | який | ||
Animacy=Inan|Case=Acc|PronType=Int | який | ||
Animacy=Inan|Case=Acc|PronType=Rel | який | ||
Case=Acc|PronType=Rel | яку | яке | |
Case=Dat|PronType=Rel | якому | якій | |
Case=Gen|PronType=Ind | будь-якої | ||
Case=Gen|PronType=Int | Якого | якої | |
Case=Gen|PronType=Rel | якого | якої | якого |
Case=Ins|PronType=Ind | яким | ||
Case=Ins|PronType=Rel | яким | якою | яким |
Case=Loc|PronType=Ind | якій | ||
Case=Loc|PronType=Rel | якому | якій | якому |
Case=Nom|PronType=Ind | який | яка | |
Case=Nom|PronType=Int | яка | ||
Case=Nom|PronType=Rel | який | яка | яке |
PRON
2754 PRON tokens (55% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (2754; 100%), Animacy=EMPTY (1382; 50%), Person=3 (1382; 50%), PronType=Prs (1382; 50%).
PRON
tokens may have the following values of Gender
:
Fem
(473; 17% of non-emptyGender
): вона, її, неї, їй, ній, неюMasc
(933; 34% of non-emptyGender
): він, його, йому, хто, нього, ним, кого, кому, ньому, кимNeut
(1348; 49% of non-emptyGender
): це, що, те, того, все, щось, воно, чого, його, цьогоEMPTY
(2292): я, ми, вони, їх, мене, нас, ви, мені, ти, них
Gender
seems to be lexical feature of PRON
. 100% lemmas (21) occur only with one value of Gender
.
AUX
480 AUX tokens (45% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (480; 100%), Mood=Ind (480; 100%), Number=Sing (480; 100%), Person=EMPTY (480; 100%), Tense=Past (480; 100%), VerbForm=Fin (480; 100%).
AUX
tokens may have the following values of Gender
:
Fem
(108; 23% of non-emptyGender
): булаMasc
(142; 30% of non-emptyGender
): бувNeut
(230; 48% of non-emptyGender
): було, бувалоEMPTY
(575): є, були, буде, бути, б, би, будуть, будемо, буду, будете
Paradigm бути | Masc | Fem | Neut |
---|---|---|---|
був | була | було |
NUM
405 NUM tokens (25% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (405; 100%), Case=Nom (210; 52%), Uninflect=EMPTY (208; 51%).
NUM
tokens may have the following values of Gender
:
Fem
(89; 22% of non-emptyGender
): дві, двох, одну, одна, обидві, 2, 1, двома, 22, однійMasc
(288; 71% of non-emptyGender
): 1, 2, два, один, двох, обидва, одного, півтора, 21, 32Neut
(28; 7% of non-emptyGender
): одне, двох, одним, 1, два, Одно, одному, 2, 21, одногоEMPTY
(1233): 5, 3, 7, 4, три, 10, 6, 8, 2, пів
Paradigm два | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | два, двох | дві, двох | два |
Case=Gen | двох | двох | двох |
Case=Ins | двома | двома | |
Case=Loc | двох | двох | |
Case=Nom | два | дві | два |
X
11 X tokens (2% of all X
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which X
and Gender
co-occurred: Foreign=Yes (11; 100%).
X
tokens may have the following values of Gender
:
Fem
(5; 45% of non-emptyGender
): Снарская, блядєй, системы, строгой, частєйMasc
(4; 36% of non-emptyGender
): GMAT, Kapital’у, дождєй, факінґNeut
(2; 18% of non-emptyGender
): крушеніє, местоEMPTY
(585): Office, the, Windows, Amazon, DITIB, cyanus, Centaurea, GFP, mneme, n
Gender
seems to be lexical feature of X
. 100% lemmas (11) occur only with one value of Gender
.
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (6464; 69%),
NOUN –[det]–> DET (2061; 69%),
PROPN –[flat:name]–> PROPN (528; 100%),
VERB –[conj]–> VERB (479; 64%),
ADJ –[conj]–> ADJ (375; 96%),
NOUN –[flat:title]–> PROPN (364; 76%),
ADJ –[nsubj]–> NOUN (317; 65%),
VERB –[nsubj]–> PROPN (292; 65%),
NOUN –[appos]–> NOUN (282; 59%),
PROPN –[conj]–> PROPN (149; 76%).