Statistics of Case in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Slovenian-SST: Features: `Case`

This feature is universal. It occurs with 6 different values: Acc, Dat, Gen, Ins, Loc, Nom.

32259 tokens (33%) have a non-empty value of Case. 9309 types (70%) occur at least once with a non-empty value of Case. 5219 lemmas (68%) occur at least once with a non-empty value of Case. The feature is used with 7 part-of-speech tags: NOUN (11395; 12% instances), ADP (5646; 6% instances), ADJ (5272; 5% instances), DET (4585; 5% instances), PRON (3042; 3% instances), PROPN (1271; 1% instances), NUM (1048; 1% instances).

`NOUN`

11395 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Case.

The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (8242; 72%).

NOUN tokens may have the following values of Case:

Acc (3119; 27% of non-empty Case): dan, način, leto, primer, čas, leta, otroke, šolo, teden, delo
Dat (209; 2% of non-empty Case): ljudem, bolniku, bogu, boleznim, bolnikom, otrokom, očetu, covidu, državam, gostom
Gen (2445; 21% of non-empty Case): let, leta, otrok, evrov, časa, ljudi, dni, strani, dela, minut
Ins (543; 5% of non-empty Case): leti, ljudmi, stresom, boleznimi, debelostjo, avtobusom, letom, pomočjo, avtom, besedami
Loc (1735; 15% of non-empty Case): bistvu, strani, redu, koncu, času, letih, mestu, šoli, področju, primeru
Nom (3344; 29% of non-empty Case): hvala, ljudje, gospod, del, stvar, otroci, pot, država, gospa, zgodba

Paradigm človek	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Animacy=Anim\|Number=Sing`		človeka
`Number=Sing`	človek		človeku	človeka	človeku	človekom
`Number=Plur`	ljudje	ljudi	ljudem	ljudi		ljudmi

`ADP`

5646 ADP tokens (100% of all ADP tokens) have a non-empty value of Case.

ADP tokens may have the following values of Case:

Acc (1688; 30% of non-empty Case): za, na, v, po, čez, skozi, med, nad, pod, pred
Dat (78; 1% of non-empty Case): proti, k, kljub, h, blizu, navkljub, preblizu
Gen (854; 15% of non-empty Case): od, do, iz, zaradi, brez, z, s, preko, poleg, znotraj
Ins (768; 14% of non-empty Case): z, s, med, pred, pod, za, nad
Loc (2258; 40% of non-empty Case): v, na, po, pri, o, ob, za

Paradigm za	`Acc`	`Loc`	`Ins`
	za	za	za

`ADJ`

5272 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Case.

The most frequent other feature values with which ADJ and Case co-occurred: Degree=Pos (4663; 88%), VerbForm=EMPTY (4609; 87%), Definite=EMPTY (4425; 84%), Number=Sing (3776; 72%).

ADJ tokens may have the following values of Case:

Acc (1086; 21% of non-empty Case): drugo, različne, celo, dobro, dober, drugi, lep, novo, prvo, nove
Dat (66; 1% of non-empty Case): novim, drugemu, ostalim, drugim, zaposlenim, zdravniški, zdravniškim, Evropski, Svetemu, celoviti
Gen (822; 16% of non-empty Case): drugega, različnih, drugih, prve, slovenske, socialnih, javnega, novih, parlamentarne, prvega
Ins (216; 4% of non-empty Case): drugimi, drugim, drugo, kratkim, strokovno, porodniško, različnimi, tretjo, vremenskimi, Slovensko
Loc (582; 11% of non-empty Case): drugi, glavnem, prvi, zadnjem, prvem, osnovni, zadnjih, sami, akademskem, drugem
Nom (2500; 47% of non-empty Case): sam, zanimivo, lepa, dobro, drugi, pomembno, druga, sami, dober, sama

Paradigm drug	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Definite=Def\|Gender=Masc\|Number=Sing`	drugi	drugi
`Definite=Ind\|Gender=Masc\|Number=Sing`	drug	drug
`Gender=Masc\|Number=Sing`		drugega	drugemu	drugega	drugem
`Gender=Masc\|Number=Plur`	drugi	druge	drugim	drugih	drugih	drugimi
`Gender=Fem\|Number=Sing`	druga	drugo		druge	drugi	drugo
`Gender=Fem\|Number=Dual`					drugih
`Gender=Fem\|Number=Plur`	druge	druge		drugih	drugih	drugimi
`Gender=Neut\|Number=Sing`	drugo	drugo		drugega	drugem	drugim
`Gender=Neut\|Number=Plur`	druga	druga	drugim			drugimi

`DET`

4585 DET tokens (83% of all DET tokens) have a non-empty value of Case.

The most frequent other feature values with which DET and Case co-occurred: Number=Sing (3587; 78%), PronType=Dem (2802; 61%).

DET tokens may have the following values of Case:

Acc (1402; 31% of non-empty Case): to, ta, vse, te, tisto, neko, eno, svoje, neki, tiste
Dat (106; 2% of non-empty Case): temu, vsem, tem, vsakemu, našim, tej, enemu, kateremu, mojemu, nekaterim
Gen (590; 13% of non-empty Case): tega, teh, vseh, tistih, te, takega, nekega, nekih, takih, neke
Ins (170; 4% of non-empty Case): tem, temi, katerimi, neko, vsemi, to, svojimi, takimi, katerim, tistim
Loc (377; 8% of non-empty Case): tem, tej, teh, katerih, vseh, nekem, katerem, naši, tistem, kateri
Nom (1940; 42% of non-empty Case): to, ta, vse, tisti, vsi, te, ti, tisto, en, tak
EMPTY (942): pol, malo, več, veliko, nekaj, koliko, dosti, toliko, manj, preveč

Paradigm ta	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Gender=Masc\|Number=Sing`	ta	ta, tega	temu	tega	tem	tem
`Gender=Masc\|Number=Dual`	ta	ta
`Gender=Masc\|Number=Plur`	ti	te	tem	teh	teh	temi
`Gender=Fem\|Number=Sing`	ta	to	tej	te	tej	to
`Gender=Fem\|Number=Dual`	ti
`Gender=Fem\|Number=Plur`	te	te	tem	teh	teh	temi
`Gender=Neut\|Number=Sing`	to	to	temu	tega	tem	tem
`Gender=Neut\|Number=Plur`	ta	ta	tem	teh	teh	temi
`Gender=Neut\|Number=Plur\|Typo=Yes`	ta

`PRON`

3042 PRON tokens (69% of all PRON tokens) have a non-empty value of Case.

The most frequent other feature values with which PRON and Case co-occurred: Reflex=EMPTY (2860; 94%), PronType=Prs (2306; 76%), Number=Sing (2177; 72%), Variant=EMPTY (1936; 64%).

PRON tokens may have the following values of Case:

Acc (882; 29% of non-empty Case): kaj, ga, jih, jo, kar, me, nas, te, nekaj, vas
Dat (726; 24% of non-empty Case): mi, si, ti, nam, meni, vam, jim, mu, ji, njemu
Gen (141; 5% of non-empty Case): jih, ga, je, mene, česa, nas, vas, nje, njih, tebe
Ins (88; 3% of non-empty Case): sabo, nami, njimi, mano, njo, seboj, vami, njim, čim, njima
Loc (61; 2% of non-empty Case): nas, sebi, njej, njem, njih, čemer, vas, kom, meni, tebi
Nom (1144; 38% of non-empty Case): jaz, kaj, ti, mi, kar, kdo, on, vi, ona, oni
EMPTY (1342): se

Paradigm jaz	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Gender=Masc\|Number=Dual`	midva
`Gender=Masc\|Number=Plur`	mi
`Gender=Fem\|Number=Dual`	midve
`Gender=Fem\|Number=Plur`	me
`Number=Sing`	jaz	mene	meni	mene	meni	mano
`Number=Sing\|Variant=Short`		me	mi	me
`Number=Dual`		naju	nama			nama
`Number=Plur`		nas	nam	nas	nas	nami

`PROPN`

1271 PROPN tokens (73% of all PROPN tokens) have a non-empty value of Case.

The most frequent other feature values with which PROPN and Case co-occurred: Number=Sing (1165; 92%), Gender=Masc (693; 55%).

PROPN tokens may have the following values of Case:

Acc (150; 12% of non-empty Case): Nemčijo, Slovenijo, Ljubljano, Triglav, Ameriko, Bruselj, Harvard, Maribor, Paranoid, Celje
Dat (17; 1% of non-empty Case): Ljubljani, Andreju, Antonu, Belvedurju, Dragonji, HPV-ju, Kamniku, Konjičanu, Luciji, Lutahrju
Gen (229; 18% of non-empty Case): Slovenije, Ljubljane, Celja, Evrope, Romov, Antona, Avstrije, Dunaja, Maribora, Kranja
Ins (49; 4% of non-empty Case): Branetom, Špelo, Štefko, Alenko, Alešem, Andersonom, Antoličičem, Avstrijci, Avstrijo, Bennyjem
Loc (258; 20% of non-empty Case): Sloveniji, Ljubljani, Mariboru, Evropi, Nemčiji, Netflixu, Avstriji, Božjah, Bruslju, Iraku
Nom (568; 45% of non-empty Case): Slovenija, Agropop, Ljubljana, Jones, Nigerija, Tom, Bistrica, David, Healy, Alenka
EMPTY (467): [name:personal], [name:surname], [name:organisation], [name:address], si, ngl, [name:place], al, kk

Paradigm Ljubljana	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`
	Ljubljana	Ljubljano	Ljubljani	Ljubljane	Ljubljani

`NUM`

1048 NUM tokens (100% of all NUM tokens) have a non-empty value of Case.

The most frequent other feature values with which NUM and Case co-occurred: NumForm=Word (1047; 100%), NumType=Card (1046; 100%), Number=Plur (682; 65%), Gender=EMPTY (552; 53%).

NUM tokens may have the following values of Case:

Acc (520; 50% of non-empty Case): eno, dva, tri, pet, en, dve, dvajset, tisoč, trideset, štiri
Dat (3; 0% of non-empty Case): devetim, eni, štirim
Gen (48; 5% of non-empty Case): ene, dveh, petih, treh, enega, dvajsetih, dvanajstih, enih, osmih, sedmih
Ins (21; 2% of non-empty Case): enim, sedmimi, tremi, dvema, eno, dvanajstimi, enaindvajsetimi, enainpetdesetimi, petdesetimi, sedemnajstimi
Loc (50; 5% of non-empty Case): eni, dveh, enem, desetih, štirih, treh, devetnajstih, drugem, enajstih, osemnajstih
Nom (406; 39% of non-empty Case): ena, dva, en, tisoč, pet, eden, tri, devet, dvajset, trije

Paradigm en	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Gender=Masc\|Number=Sing`	en	en, enega, een		enega	enem	enim
`Gender=Masc\|Number=Plur`	eni			enih
`Gender=Fem\|Number=Sing`	ena	eno	eni	ene	eni	eno
`Gender=Fem\|Number=Plur`	ene	ene
`Gender=Neut\|Number=Sing`	eno	eno		enega	enem	enim
`Gender=Neut\|Number=Plur`	ena			enih

Relations with Agreement in `Case`

The 10 most frequent relations where parent and child node agree in Case: NOUN –[case]–> ADP (3806; 98%), NOUN –[amod]–> ADJ (3196; 98%), NOUN –[det]–> DET (2033; 89%), NOUN –[conj]–> NOUN (728; 92%), PROPN –[case]–> ADP (460; 91%), DET –[case]–> ADP (370; 95%), NOUN –[nummod]–> NUM (285; 52%), ADJ –[nsubj]–> NOUN (276; 98%), PRON –[case]–> ADP (229; 97%), ADJ –[conj]–> ADJ (206; 98%).

Treebank Statistics: UD_Slovenian-SST: Features: Case

NOUN

ADP

ADJ

DET

PRON

PROPN

NUM

Relations with Agreement in Case