Treebank Statistics: UD_Croatian-SET: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
100306 tokens (50%) have a non-empty value of Gender.
32347 types (91%) occur at least once with a non-empty value of Gender.
15628 lemmas (84%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (48386; 24% instances), ADJ (22932; 11% instances), PROPN (12825; 6% instances), DET (7332; 4% instances), VERB (6090; 3% instances), PRON (1515; 1% instances), AUX (615; 0% instances), NUM (611; 0% instances).
NOUN
48386 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (34528; 71%).
NOUN tokens may have the following values of Gender:
Fem(18902; 39% of non-emptyGender): godine, godina, zemlje, kuna, zemalja, stranke, država, strane, vlada, vlastiMasc(22135; 46% of non-emptyGender): milijuna, eura, ljudi, dana, predsjednik, poslova, način, ministar, dio, ponedjeljakNeut(7349; 15% of non-emptyGender): vrijeme, mjesto, prava, pitanje, mjesta, pitanja, ulaganja, rješenje, članstvo, područjuEMPTY(191): dr., kg, GB, prof., m, km, g., kn, cm, mil.
| Paradigm kuna | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing | kunu | |
| Case=Acc|Number=Plur | kune | |
| Case=Gen|Number=Sing | kune | |
| Case=Gen|Number=Plur | kuna | kuna |
| Case=Nom|Number=Plur | kune |
Gender seems to be lexical feature of NOUN. 99% lemmas (6346) occur only with one value of Gender.
ADJ
22932 ADJ tokens (95% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Degree=Pos (21824; 95%), Definite=Def (20684; 90%), Number=Sing (15101; 66%).
ADJ tokens may have the following values of Gender:
Fem(8979; 39% of non-emptyGender): prošle, hrvatske, druge, sve, nove, europske, prva, nova, novu, političkeMasc(10552; 46% of non-emptyGender): novi, prvi, drugi, svi, vanjskih, glavni, hrvatski, bivši, najveći, novogNeut(3401; 15% of non-emptyGender): moguće, potrebno, važno, dobro, drugo, prvo, internetskog, ljudskih, pravo, radnihEMPTY(1207): 1., 2004., 2008., 2007., 2009., 2006., 2., 2005., 2010., 21.
| Paradigm velik | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc|Definite=Def|Degree=Pos|Number=Sing | veliki | ||
| Animacy=Inan|Case=Acc|Definite=Def|Degree=Cmp|Number=Sing | veći | ||
| Animacy=Inan|Case=Acc|Definite=Def|Degree=Sup|Number=Sing | najveći | ||
| Animacy=Inan|Case=Acc|Definite=Ind|Degree=Pos|Number=Sing | velik, veći | ||
| Case=Acc|Definite=Def|Degree=Pos|Number=Sing | veliku | ||
| Case=Acc|Definite=Def|Degree=Pos|Number=Plur | velike | velike | veća |
| Case=Acc|Definite=Def|Degree=Cmp|Number=Sing | veću | veće | |
| Case=Acc|Definite=Def|Degree=Cmp|Number=Plur | veće | veće | |
| Case=Acc|Definite=Def|Degree=Sup|Number=Sing | najveću | najveće | |
| Case=Acc|Definite=Def|Degree=Sup|Number=Plur | najveće | najveća | |
| Case=Dat|Definite=Def|Degree=Pos|Number=Sing | velikom | velikoj | |
| Case=Dat|Definite=Def|Degree=Pos|Number=Plur | velikim | ||
| Case=Dat|Definite=Def|Degree=Cmp|Number=Sing | većoj | ||
| Case=Dat|Definite=Def|Degree=Sup|Number=Sing | najvećem | najvećim | |
| Case=Dat|Definite=Def|Degree=Sup|Number=Plur | najvećim | ||
| Case=Gen|Definite=Def|Degree=Pos|Number=Sing | velikog, velika, velikoga | velike | velikog, najvećeg |
| Case=Gen|Definite=Def|Degree=Pos|Number=Plur | velikih | velikih | velikih |
| Case=Gen|Definite=Def|Degree=Cmp|Number=Sing | većeg | veće | većeg |
| Case=Gen|Definite=Def|Degree=Cmp|Number=Plur | većih | većih | |
| Case=Gen|Definite=Def|Degree=Sup|Number=Sing | najvećeg, najveća | najveće | |
| Case=Gen|Definite=Def|Degree=Sup|Number=Plur | najvećih | najvećih | najvećih |
| Case=Ins|Definite=Def|Degree=Pos|Number=Sing | velikim | velikom | najvećim |
| Case=Ins|Definite=Def|Degree=Pos|Number=Plur | velikim | velikim | |
| Case=Ins|Definite=Def|Degree=Cmp|Number=Sing | većim | većom | |
| Case=Ins|Definite=Def|Degree=Cmp|Number=Plur | većim | ||
| Case=Ins|Definite=Def|Degree=Sup|Number=Sing | najvećim | najvećom | |
| Case=Ins|Definite=Def|Degree=Sup|Number=Plur | najvećim | najvećima | |
| Case=Loc|Definite=Def|Degree=Pos|Number=Sing | velikom | velikoj | velikom |
| Case=Loc|Definite=Def|Degree=Pos|Number=Plur | velikim | velikim | velikim |
| Case=Loc|Definite=Def|Degree=Cmp|Number=Sing | većem | većoj | |
| Case=Loc|Definite=Def|Degree=Sup|Number=Sing | najvećem | najvećoj | |
| Case=Loc|Definite=Def|Degree=Sup|Number=Plur | najvećim | ||
| Case=Nom|Definite=Def|Degree=Pos|Number=Sing | veliki | velika | veliko |
| Case=Nom|Definite=Def|Degree=Pos|Number=Plur | veliki | velike | velika |
| Case=Nom|Definite=Def|Degree=Cmp|Number=Sing | veći | veća | veće |
| Case=Nom|Definite=Def|Degree=Cmp|Number=Plur | veća | ||
| Case=Nom|Definite=Def|Degree=Sup|Number=Sing | najveći | najveća | najveće |
| Case=Nom|Definite=Def|Degree=Sup|Number=Plur | najveći | najveće | najveća |
| Case=Nom|Definite=Ind|Degree=Pos|Number=Sing | velik |
PROPN
12825 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (12511; 98%), Case=Nom (6511; 51%).
PROPN tokens may have the following values of Gender:
Fem(4062; 32% of non-emptyGender): BiH, Hrvatskoj, Srbije, Hrvatska, Srbija, Hrvatske, Europe, Srbiji, Makedonija, TurskeMasc(8339; 65% of non-emptyGender): EU, SETimes, UN-a, Windows, Beogradu, NATO-u, NATO-a, Bog, Zagrebu, ZagrebNeut(424; 3% of non-emptyGender): Kosova, Kosovo, Kosovu, Sarajevu, Skoplju, Kosovom, Skoplja, Skoplje, Jarinje, SarajevoEMPTY(23): R., AMG, B, R, B.o.B., BamS, DI, EBEL, EL, G.
| Paradigm BiH | Masc | Fem |
|---|---|---|
| Case=Acc | BiH | |
| Case=Dat | BiH | |
| Case=Gen | BiH | BiH, BIH |
| Case=Loc | BiH | BiH |
| Case=Nom | BiH |
Gender seems to be lexical feature of PROPN. 98% lemmas (4245) occur only with one value of Gender.
DET
7332 DET tokens (95% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number[psor]=EMPTY (6503; 89%), Person=EMPTY (6503; 89%), Poss=EMPTY (5750; 78%), Number=Sing (5100; 70%).
DET tokens may have the following values of Gender:
Fem(2431; 33% of non-emptyGender): koje, koja, ove, koju, kojoj, svoje, svoju, te, ta, kojimaMasc(3102; 42% of non-emptyGender): koji, svoj, taj, neki, koje, ovaj, ovog, kojem, kojim, kojimaNeut(1799; 25% of non-emptyGender): to, toga, koje, tome, sve, ovo, koja, svoje, time, timEMPTY(352): nekoliko, više, mnogo, pola, puno, manje, malo, koliko, toliko, dosta
| Paradigm koji | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | kojeg, kojega | ||
| Animacy=Inan|Case=Acc|Number=Sing | koji | ||
| Case=Acc|Number=Sing | koju | koje | |
| Case=Acc|Number=Plur | koje | koje | koja |
| Case=Dat|Number=Sing | kojemu, kojem | kojoj | kojem, kojemu |
| Case=Dat|Number=Plur | kojima | kojima | kojima |
| Case=Gen|Number=Sing | kojeg, kojega | koje | kojeg, kojega |
| Case=Gen|Number=Plur | kojih | kojih | kojih |
| Case=Ins|Number=Sing | kojim | kojom | kojim |
| Case=Ins|Number=Plur | kojima | kojima | kojima |
| Case=Loc|Number=Sing | kojem, kojemu, kom | kojoj | kojem, kojemu |
| Case=Loc|Number=Plur | kojima, kojim | kojima, kojim | kojima |
| Case=Nom|Number=Sing | koji | koja | koje |
| Case=Nom|Number=Plur | koji | koje | koja |
VERB
6090 VERB tokens (35% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (6090; 100%), Person=EMPTY (6090; 100%), Tense=Past (6090; 100%), VerbForm=Part (6090; 100%), Voice=Act (6090; 100%), Number=Sing (4412; 72%).
VERB tokens may have the following values of Gender:
Fem(1710; 28% of non-emptyGender): mogla, trebala, izjavila, dobila, priopćila, rekla, postala, imala, kazala, objavilaMasc(3835; 63% of non-emptyGender): izjavio, rekao, kazao, mogli, dodao, mogao, dobili, trebao, trebali, imaliNeut(545; 9% of non-emptyGender): moglo, trebalo, došlo, pokazalo, dogodilo, omogućilo, ostalo, dovelo, počelo, prošloEMPTY(11297): može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju
| Paradigm moći | Masc | Fem | Neut |
|---|---|---|---|
| Number=Sing | mogao | mogla | moglo |
| Number=Plur | mogli | mogle | mogla |
PRON
1515 PRON tokens (29% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (1515; 100%), Person=EMPTY (813; 54%), Number=EMPTY (812; 54%), Case=Nom (771; 51%).
PRON tokens may have the following values of Gender:
Fem(211; 14% of non-emptyGender): ona, joj, je, ju, one, nje, njom, nju, njoj, njomeMasc(583; 38% of non-emptyGender): ga, mu, on, oni, tko, nitko, njega, njemu, netko, svatkoNeut(721; 48% of non-emptyGender): što, ništa, nešto, ono, čime, čega, čemu, ona, išta, nečemuEMPTY(3785): se, ih, mi, im, njih, nam, vam, nas, ja, njima
| Paradigm on | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | ga, njega | je, ju, nju | ga, nj, njega, ono |
| Case=Dat | mu, njemu | joj, njoj | |
| Case=Gen | njega | nje, je | |
| Case=Ins | njim, njime | njom, njome | njime, njim |
| Case=Loc | njemu | njoj | |
| Case=Nom | on | ona | ono |
AUX
615 AUX tokens (5% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Mood=EMPTY (615; 100%), Person=EMPTY (615; 100%), Tense=Past (615; 100%), VerbForm=Part (615; 100%), Number=Sing (489; 80%).
AUX tokens may have the following values of Gender:
Fem(169; 27% of non-emptyGender): bila, bileMasc(280; 46% of non-emptyGender): bio, biliNeut(166; 27% of non-emptyGender): bilo, bilaEMPTY(11951): je, su, će, bi, biti, nije, smo, sam, neće, nisu
| Paradigm biti | Masc | Fem | Neut |
|---|---|---|---|
| Number=Sing | bio | bila | bilo |
| Number=Plur | bili | bile | bila |
NUM
611 NUM tokens (19% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (576; 94%), Number=Sing (433; 71%), Case=Nom (322; 53%).
NUM tokens may have the following values of Gender:
Fem(288; 47% of non-emptyGender): dvije, jedna, jednu, dviju, jedne, obje, jednoj, jednom, obiju, objemaMasc(292; 48% of non-emptyGender): jedan, jednog, jednom, jednim, jedni, oba, dvaju, dvama, obaju, DvaNeut(31; 5% of non-emptyGender): jedno, jednog, jednom, Dvoje, Oba, dva, dvoja, jednogaEMPTY(2537): tri, dva, pet, četiri, 20, 10, šest, deset, 15, 100
| Paradigm jedan | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | jednog | ||
| Animacy=Inan|Case=Acc|Number=Sing | jedan | ||
| Case=Acc|Number=Sing | jednu | jedno | |
| Case=Dat|Number=Sing | jednoj | ||
| Case=Gen|Number=Sing | jednog | jedne | jednog, jednoga |
| Case=Ins|Number=Sing | jednim | jednom | |
| Case=Loc|Number=Sing | jednom, jednome | jednoj | jednom |
| Case=Nom|Number=Sing | jedan | jedna | jedno |
| Case=Nom|Number=Plur | jedni |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (17177; 95%),
NOUN –[det]–> DET (3190; 98%),
PROPN –[flat]–> PROPN (2331; 97%),
ADJ –[nsubj]–> NOUN (1448; 93%),
NOUN –[flat]–> PROPN (1334; 75%),
VERB –[nsubj]–> PROPN (1131; 57%),
ADJ –[conj]–> ADJ (774; 94%),
PROPN –[conj]–> PROPN (726; 75%),
NOUN –[acl]–> ADJ (677; 85%),
VERB –[conj]–> VERB (413; 54%).