Treebank Statistics: UD_Ukrainian-IU: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
50784 tokens (41%) have a non-empty value of Gender.
23066 types (73%) occur at least once with a non-empty value of Gender.
13003 lemmas (72%) occur at least once with a non-empty value of Gender.
The feature is used with 9 part-of-speech tags: NOUN (28890; 24% instances), ADJ (8213; 7% instances), VERB (3609; 3% instances), PROPN (3409; 3% instances), DET (2994; 2% instances), PRON (2770; 2% instances), AUX (482; 0% instances), NUM (406; 0% instances), X (11; 0% instances).
NOUN
28890 NOUN tokens (98% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Animacy=Inan (24711; 86%), Number=Sing (20762; 72%).
NOUN tokens may have the following values of Gender:
Fem(11251; 39% of non-emptyGender): людей, люди, мови, грн, області, землі, території, ради, роботи, тваринMasc(12929; 45% of non-emptyGender): час, року, %, років, часу, №, р, рік, чоловік, роціNeut(4710; 16% of non-emptyGender): життя, питання, слова, рішення, ст, використання, очі, місце, видання, населенняEMPTY(481): грошей, даних, виборів, гроші, двері, дані, коштів, ЗМІ, даними, дверей
| Paradigm голова | Masc | Fem |
|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | Голову | |
| Animacy=Anim|Case=Dat|Number=Sing | голові | |
| Animacy=Anim|Case=Gen|Number=Sing | голови | |
| Animacy=Anim|Case=Gen|Number=Plur | голів | |
| Animacy=Anim|Case=Ins|Number=Sing | головою | |
| Animacy=Anim|Case=Ins|Number=Plur | головами | |
| Animacy=Anim|Case=Nom|Number=Sing | голова | Голова |
| Animacy=Inan|Case=Acc|Number=Sing | голову | |
| Animacy=Inan|Case=Acc|Number=Plur | голови | |
| Animacy=Inan|Case=Gen|Number=Sing | голови | |
| Animacy=Inan|Case=Ins|Number=Sing | головою | |
| Animacy=Inan|Case=Loc|Number=Sing | голові | |
| Animacy=Inan|Case=Nom|Number=Sing | голова | |
| Animacy=Inan|Case=Nom|Number=Plur | голови |
Gender seems to be lexical feature of NOUN. 100% lemmas (6895) occur only with one value of Gender.
ADJ
8213 ADJ tokens (68% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (8213; 100%), Animacy=EMPTY (7662; 93%), Aspect=EMPTY (7460; 91%), VerbForm=EMPTY (7460; 91%), Voice=EMPTY (7460; 91%), Degree=EMPTY (5870; 71%).
ADJ tokens may have the following values of Gender:
Fem(3402; 41% of non-emptyGender): української, державної, національної, українська, великої, Тернопільської, нову, верховної, нова, цілуMasc(3381; 41% of non-emptyGender): 2017, 2016, українського, перший, український, цілий, першого, 2015, новий, новогоNeut(1430; 17% of non-emptyGender): ціле, 27, 1, XI, нове, 3, 15, 23, 25, державногоEMPTY(3852): різних, українських, перших, різні, нових, нові, місцевих, перші, повинні, великі
| Paradigm український | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc | український | ||
| Case=Acc | українську | українське | |
| Case=Dat | українському | українській | Українському |
| Case=Gen | українського | української | українського |
| Case=Ins | українським | українською | |
| Case=Loc | українському | українській | українському |
| Case=Nom | український | українська | українське |
VERB
3609 VERB tokens (28% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=Ind (3609; 100%), Number=Sing (3609; 100%), Person=EMPTY (3609; 100%), Tense=Past (3609; 100%), VerbForm=Fin (3609; 100%), Aspect=Perf (1963; 54%).
VERB tokens may have the following values of Gender:
Fem(1098; 30% of non-emptyGender): була, стала, стояла, мала, знала, зробила, любила, казала, могла, почалаMasc(1980; 55% of non-emptyGender): мав, міг, був, сказав, почав, знав, став, хотів, бачив, пішовNeut(531; 15% of non-emptyGender): було, стало, виявилося, вдалося, довелося, здавалося, могло, вийшло, хотілося, відбулосяEMPTY(9292): є, може, має, каже, немає, можуть, мають, були, мали, нема
| Paradigm бути | Masc | Fem | Neut |
|---|---|---|---|
| був | була | було |
PROPN
3409 PROPN tokens (97% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (3386; 99%), Uninflect=EMPTY (2902; 85%), Animacy=Anim (2010; 59%).
PROPN tokens may have the following values of Gender:
Fem(1263; 37% of non-emptyGender): україни, Україні, Україна, Міра, Росії, Марія, Мотря, Європи, Ради, ЄвропіMasc(2052; 60% of non-emptyGender): київ, Києва, Вінстон, Гнат, Києві, Михась, О, ХАІ, Андрій, ЛьвовіNeut(94; 3% of non-emptyGender): Закарпаття, Вапліте, Полісся, Сан-Ремо, Токіо, 3G, ЄС, Євро, Дзвонкове, ЗакарпаттіEMPTY(114): США, в, б, А, Карпати, Черкаси, Карпат, д, с, і
| Paradigm І. | Masc | Fem |
|---|---|---|
| Case=Acc|NameType=Giv | І | |
| Case=Gen|NameType=Giv | І | |
| Case=Gen|NameType=Pat | І | |
| Case=Nom|NameType=Giv | І | І |
| Case=Nom|NameType=Pat | І |
Gender seems to be lexical feature of PROPN. 99% lemmas (1519) occur only with one value of Gender.
DET
2994 DET tokens (64% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (2994; 100%), Animacy=EMPTY (2671; 89%), Reflex=EMPTY (2601; 87%), Person=EMPTY (2432; 81%), Poss=EMPTY (2163; 72%).
DET tokens may have the following values of Gender:
Fem(1133; 38% of non-emptyGender): яка, його, свою, ця, яку, цю, сама, така, цій, цієїMasc(1365; 46% of non-emptyGender): який, той, цей, цього, один, його, сам, свій, свого, тогоNeut(496; 17% of non-emptyGender): його, все, таке, яке, своє, це, одне, цього, її, томуEMPTY(1678): які, всі, кілька, інших, ці, яких, ті, всіх, багато, такі
| Paradigm який | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|PronType=Rel | якого | ||
| Animacy=Inan|Case=Acc|PronType=Ind | який | ||
| Animacy=Inan|Case=Acc|PronType=Int | який | ||
| Animacy=Inan|Case=Acc|PronType=Rel | який | ||
| Case=Acc|PronType=Rel | яку | яке | |
| Case=Dat|PronType=Rel | якому | якій | |
| Case=Gen|PronType=Ind | будь-якої | ||
| Case=Gen|PronType=Int | Якого | якої | |
| Case=Gen|PronType=Rel | якого | якої | якого |
| Case=Ins|PronType=Ind | яким | ||
| Case=Ins|PronType=Rel | яким | якою | яким |
| Case=Loc|PronType=Ind | якій | ||
| Case=Loc|PronType=Rel | якому | якій | якому |
| Case=Nom|PronType=Ind | який | яка | |
| Case=Nom|PronType=Int | яка | ||
| Case=Nom|PronType=Rel | який | яка | яке |
PRON
2770 PRON tokens (55% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (2770; 100%), Animacy=EMPTY (1386; 50%), Person=3 (1386; 50%), PronType=Prs (1386; 50%).
PRON tokens may have the following values of Gender:
Fem(474; 17% of non-emptyGender): вона, її, неї, їй, ній, неюMasc(935; 34% of non-emptyGender): він, його, йому, хто, нього, ним, кого, кому, ньому, кимNeut(1361; 49% of non-emptyGender): це, що, те, того, все, щось, воно, його, цього, чогоEMPTY(2304): я, ми, вони, їх, мене, нас, ви, мені, ти, них
Gender seems to be lexical feature of PRON. 100% lemmas (22) occur only with one value of Gender.
AUX
482 AUX tokens (46% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Aspect=Imp (482; 100%), Mood=Ind (482; 100%), Number=Sing (482; 100%), Person=EMPTY (482; 100%), Tense=Past (482; 100%), VerbForm=Fin (482; 100%).
AUX tokens may have the following values of Gender:
Fem(108; 22% of non-emptyGender): булаMasc(142; 29% of non-emptyGender): бувNeut(232; 48% of non-emptyGender): було, бувалоEMPTY(576): є, були, буде, бути, б, би, будуть, будемо, буду, будете
| Paradigm бути | Masc | Fem | Neut |
|---|---|---|---|
| був | була | було |
NUM
406 NUM tokens (23% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (406; 100%), Case=Nom (210; 52%), Uninflect=EMPTY (209; 51%).
NUM tokens may have the following values of Gender:
Fem(91; 22% of non-emptyGender): дві, двох, одну, одна, обидві, 2, 1, двома, 22, однійMasc(287; 71% of non-emptyGender): 1, 2, два, один, двох, обидва, одного, півтора, 21, 32Neut(28; 7% of non-emptyGender): одне, двох, одним, 1, два, Одно, одному, 2, 21, одногоEMPTY(1359): 5, 3, 7, три, 4, 6, 10, 8, 2, пів
| Paradigm два | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | два, двох | дві, двох | два |
| Case=Gen | двох | двох | двох |
| Case=Ins | двома | двома | |
| Case=Loc | двох | двох | |
| Case=Nom | два | дві | два |
X
11 X tokens (2% of all X tokens) have a non-empty value of Gender.
The most frequent other feature values with which X and Gender co-occurred: Foreign=Yes (11; 100%).
X tokens may have the following values of Gender:
Fem(5; 45% of non-emptyGender): Снарская, блядєй, системы, строгой, частєйMasc(4; 36% of non-emptyGender): GMAT, Kapital’у, дождєй, факінґNeut(2; 18% of non-emptyGender): крушеніє, местоEMPTY(591): Office, the, Windows, Amazon, DITIB, cyanus, Centaurea, GFP, mneme, n
Gender seems to be lexical feature of X. 100% lemmas (11) occur only with one value of Gender.
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (6486; 69%),
NOUN –[det]–> DET (2072; 69%),
PROPN –[flat:name]–> PROPN (530; 100%),
VERB –[conj]–> VERB (481; 64%),
ADJ –[conj]–> ADJ (382; 96%),
NOUN –[flat:title]–> PROPN (364; 76%),
ADJ –[nsubj]–> NOUN (317; 64%),
VERB –[nsubj]–> PROPN (294; 65%),
NOUN –[appos]–> NOUN (277; 57%),
PROPN –[conj]–> PROPN (149; 76%).