Treebank Statistics: UD_Croatian-SET: Features: Case
This feature is universal.
It occurs with 7 different values: Acc, Dat, Gen, Ins, Loc, Nom, Voc.
116493 tokens (58%) have a non-empty value of Case.
30250 types (85%) occur at least once with a non-empty value of Case.
14913 lemmas (80%) occur at least once with a non-empty value of Case.
The feature is used with 7 part-of-speech tags: NOUN (48386; 24% instances), ADJ (22932; 11% instances), ADP (19089; 10% instances), PROPN (12825; 6% instances), DET (7332; 4% instances), PRON (5300; 3% instances), NUM (629; 0% instances).
NOUN
48386 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (34528; 71%).
NOUN tokens may have the following values of Case:
Acc(10766; 22% of non-emptyCase): način, ponedjeljak, vrijeme, srijedu, godinu, utorak, petak, mjesto, četvrtak, pomoćDat(1101; 2% of non-emptyCase): novinarima, zemlji, djeci, građanima, javnosti, integraciji, premijeru, uniji, zajednici, članstvuGen(16635; 34% of non-emptyCase): godine, milijuna, eura, godina, kuna, dana, zemalja, poslova, ljudi, tjednaIns(2463; 5% of non-emptyCase): obzirom, ljudima, predsjednikom, zemljama, nazivom, godinama, kolegom, sporazumom, pritiskom, zakonomLoc(5783; 12% of non-emptyCase): godini, zemlji, svijetu, području, mjestu, slučaju, odnosu, regiji, izvješću, priopćenjuNom(11619; 24% of non-emptyCase): predsjednik, ministar, premijer, dio, vlada, zemlja, ljudi, broj, većina, zemljeVoc(19; 0% of non-emptyCase): gospodine, akademiče, braćo, budale, gospodo, gradonačelniče, kurvo, mediji, ministre, papeEMPTY(191): dr., kg, GB, prof., m, km, g., kn, cm, mil.
| Paradigm zemlja | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Number=Sing | zemlja | zemlju | zemlji | zemlje | zemlji | zemljom |
| Number=Plur | zemlje | zemlje | zemljama | zemalja | zemljama | zemljama |
ADJ
22932 ADJ tokens (95% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Degree=Pos (21824; 95%), Definite=Def (20684; 90%), Number=Sing (15101; 66%).
ADJ tokens may have the following values of Case:
Acc(4237; 18% of non-emptyCase): sve, prvi, novi, novu, nove, druge, veliku, ratne, drugi, brojneDat(511; 2% of non-emptyCase): svim, drugima, europskoj, međunarodnim, svima, drugim, gospodarskom, bivšem, državnim, europskimGen(6402; 28% of non-emptyCase): vanjskih, novih, prošle, svih, drugih, prošlog, novog, unutarnjih, europske, hrvatskeIns(1143; 5% of non-emptyCase): drugim, ostalim, velikim, novim, političkim, brojnim, međunarodnim, samim, većim, najvećimLoc(2073; 9% of non-emptyCase): prvom, svim, drugom, drugim, novom, prvoj, hrvatskom, međunarodnim, svjetskom, tiskovnojNom(8558; 37% of non-emptyCase): svi, drugi, novi, glavni, prvi, hrvatski, bivši, moguće, potrebno, mnogiVoc(8; 0% of non-emptyCase): Najdraži, Nespretni, Uzoriti, dobri, dragi, mala, prvi, svemogućiEMPTY(1207): 1., 2004., 2008., 2007., 2009., 2006., 2., 2005., 2010., 21.
| Paradigm prvi | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
|---|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Sing | prvog | ||||||
| Animacy=Inan|Gender=Masc|Number=Sing | prvi | ||||||
| Gender=Masc|Number=Sing | prvi | prvog, prva, prvoga | prvi | prvom | prvim | ||
| Gender=Masc|Number=Plur | prvi | prve | prvih | prvim | prvima | ||
| Gender=Fem|Number=Sing | prva | prvu | prvoj | prve | prvoj | prvom | |
| Gender=Fem|Number=Plur | prve | prve | prvih | prvim | prvim | ||
| Gender=Neut|Number=Sing | prvo | prvo | prvog, prva | prvom | prvim | ||
| Gender=Neut|Number=Plur | prvim |
ADP
19089 ADP tokens (100% of all ADP tokens) have a non-empty value of Case.
ADP tokens may have the following values of Case:
Acc(5270; 28% of non-emptyCase): za, u, na, uz, kroz, po, pred, pod, među, nadDat(89; 0% of non-emptyCase): unatoč, ka, usprkos, k, nasuprotGen(4767; 25% of non-emptyCase): od, iz, do, nakon, zbog, tijekom, protiv, prije, bez, izmeđuIns(1668; 9% of non-emptyCase): s, sa, među, pod, za, pred, nad, Preda, umjestoLoc(7295; 38% of non-emptyCase): u, na, o, prema, po, pri, ka, naspram, pred
| Paradigm u | Acc | Gen | Loc |
|---|---|---|---|
| u | u | u |
PROPN
12825 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Number=Sing (12511; 98%), Gender=Masc (8339; 65%).
PROPN tokens may have the following values of Case:
Acc(1021; 8% of non-emptyCase): SETimes, EU, Kosovo, Hrvatsku, BiH, Srbiju, Tursku, NATO, Bugarsku, WindowsDat(300; 2% of non-emptyCase): EU, NATO-u, Beogradu, Srbiji, Hrvatskoj, Europi, Kosovu, Vladi, Turskoj, BoguGen(2975; 23% of non-emptyCase): EU, Kosova, Srbije, BiH, UN-a, Hrvatske, Europe, Turske, NATO-a, CrneIns(424; 3% of non-emptyCase): Srbijom, Crnom, Gorom, Grčkom, Kosovom, EU, Hrvatskom, ICTY-em, Makedonijom, BeogradomLoc(1591; 12% of non-emptyCase): Hrvatskoj, Kosovu, Srbiji, Beogradu, EU, Europi, Makedoniji, BiH, NATO-u, ZagrebuNom(6511; 51% of non-emptyCase): Hrvatska, Srbija, Kosovo, Makedonija, Bugarska, Turska, Windows, Vlada, EU, BogVoc(3; 0% of non-emptyCase): Bože, Isuse, RadovićuEMPTY(23): R., AMG, B, R, B.o.B., BamS, DI, EBEL, EL, G.
| Paradigm EU | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Inan|Number=Sing | EU | |||||
| Number=Sing | EU | EU | EU, EU-a | EU, EU-u | EU, EU-om | |
| Number=Plur | EU |
DET
7332 DET tokens (95% of all DET tokens) have a non-empty value of Case.
The most frequent other feature values with which DET and Case co-occurred: Number[psor]=EMPTY (6503; 89%), Person=EMPTY (6503; 89%), Poss=EMPTY (5750; 78%), Number=Sing (5100; 70%).
DET tokens may have the following values of Case:
Acc(1614; 22% of non-emptyCase): to, koje, svoje, koju, svoj, sve, svoju, koji, taj, tuDat(192; 3% of non-emptyCase): tome, kojima, onima, svojim, kojoj, svim, svojoj, kojemu, kojem, tojGen(1238; 17% of non-emptyCase): toga, ove, ovog, tih, svojih, te, tog, kojih, svih, svojeIns(362; 5% of non-emptyCase): kojim, kojima, tim, time, svojim, kojom, svojom, takvim, ovom, nekimLoc(779; 11% of non-emptyCase): kojoj, kojem, tome, tom, kojima, ovom, svojoj, ovoj, svojim, tojNom(3144; 43% of non-emptyCase): koji, to, koja, koje, neki, ta, ovo, sve, taj, oniVoc(3; 0% of non-emptyCase): moj, moja, mojiEMPTY(352): nekoliko, više, mnogo, pola, puno, manje, malo, koliko, toliko, dosta
| Paradigm moj | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
|---|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Sing | mog | ||||||
| Gender=Masc|Number=Sing | moj | mog, moga, mojeg | moj | mojem | |||
| Gender=Masc|Number=Plur | moje | moji | mojim | ||||
| Gender=Fem|Number=Sing | moja | moju | mojoj | moje | moja | ||
| Gender=Fem|Number=Plur | moje | mojih | mojim | ||||
| Gender=Neut|Number=Sing | Moje | mog |
PRON
5300 PRON tokens (100% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: PronType=Prs (4487; 85%), Gender=EMPTY (3785; 71%), Person=EMPTY (3712; 70%), Number=EMPTY (3711; 70%), Reflex=Yes (2899; 55%).
PRON tokens may have the following values of Case:
Acc(3503; 66% of non-emptyCase): se, ga, ih, što, nas, je, ništa, vas, nešto, meDat(518; 10% of non-emptyCase): im, mu, nam, vam, mi, joj, ti, si, nikome, namaGen(176; 3% of non-emptyCase): njih, čega, njega, ih, nas, sebe, nje, koga, nečeg, nečegaIns(106; 2% of non-emptyCase): čime, njima, sobom, njim, njom, nama, njime, kim, kime, mnomLoc(91; 2% of non-emptyCase): njemu, sebi, čemu, njima, nama, njoj, meni, nečemu, nečem, svačemuNom(905; 17% of non-emptyCase): što, on, mi, ona, oni, tko, ono, ja, nitko, netkoVoc(1; 0% of non-emptyCase): ti
| Paradigm on | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Gender=Masc | on | ga, njega | mu, njemu | njega | njemu | njim, njime |
| Gender=Fem | ona | je, ju, nju | joj, njoj | nje, je | njoj | njom, njome |
| Gender=Neut | ono | ga, nj, njega, ono | njime, njim |
NUM
629 NUM tokens (20% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: NumType=Card (594; 94%), Number=Sing (433; 69%).
NUM tokens may have the following values of Case:
Acc(118; 19% of non-emptyCase): jedan, jednu, dvije, jednog, jedno, oba, obje, pedeseti, tridesetDat(5; 1% of non-emptyCase): jednoj, Dvjema, objemaGen(113; 18% of non-emptyCase): dviju, jednog, jedne, triju, dvaju, obiju, četiriju, obaju, desetaka, jednogaIns(20; 3% of non-emptyCase): jednim, jednom, obje, trimaLoc(51; 8% of non-emptyCase): jednom, jednoj, dvama, obje, objema, četirima, jednome, oba, trimaNom(322; 51% of non-emptyCase): jedan, jedna, dvije, jedno, jedni, obje, oba, dva, Dvoje, dvojaEMPTY(2519): tri, dva, pet, četiri, 20, 10, šest, deset, 15, 100
| Paradigm jedan | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Sing | jednog | |||||
| Animacy=Inan|Gender=Masc|Number=Sing | jedan | |||||
| Gender=Masc|Number=Sing | jedan | jednog | jednom, jednome | jednim | ||
| Gender=Masc|Number=Plur | jedni | |||||
| Gender=Fem|Number=Sing | jedna | jednu | jednoj | jedne | jednoj | jednom |
| Gender=Neut|Number=Sing | jedno | jedno | jednog, jednoga | jednom |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[amod]–> ADJ (17187; 95%),
NOUN –[case]–> ADP (14022; 96%),
NOUN –[conj]–> NOUN (3447; 94%),
NOUN –[det]–> DET (3217; 98%),
PROPN –[flat]–> PROPN (2352; 98%),
PROPN –[case]–> ADP (2341; 98%),
ADJ –[nsubj]–> NOUN (1450; 93%),
NOUN –[flat]–> PROPN (1292; 72%),
PROPN –[conj]–> PROPN (959; 99%),
ADJ –[conj]–> ADJ (813; 99%).