Statistics of Case in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Czech-PUD: Features: `Case`

This feature is universal. It occurs with 7 different values: Acc, Dat, Gen, Ins, Loc, Nom, Voc.

10485 tokens (56%) have a non-empty value of Case. 5469 types (72%) occur at least once with a non-empty value of Case. 3574 lemmas (67%) occur at least once with a non-empty value of Case. The feature is used with 7 part-of-speech tags: NOUN (4315; 23% instances), ADJ (2010; 11% instances), ADP (1833; 10% instances), PROPN (878; 5% instances), DET (735; 4% instances), PRON (574; 3% instances), NUM (140; 1% instances).

`NOUN`

4315 NOUN tokens (96% of all NOUN tokens) have a non-empty value of Case.

The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (3082; 71%), Animacy=EMPTY (2409; 56%).

NOUN tokens may have the following values of Case:

Acc (907; 21% of non-empty Case): místo, den, rok, část, roky, většinu, dluhopisy, lidi, možnost, měsíc
Dat (161; 4% of non-empty Case): dispozici, podnebí, říši, dívkám, konci, obchodu, obsahu, radě, státům, většině
Gen (1247; 29% of non-empty Case): roku, let, století, války, lidí, dolarů, společnosti, doby, eur, liber
Ins (366; 8% of non-empty Case): l, lety, rokem, autorem, cílem, nedostatkem, nemovitostmi, prezidentem, soudem, vedením
Loc (623; 14% of non-empty Case): roce, letech, době, případě, důsledku, oblasti, světě, městě, období, polovině
Nom (1010; 23% of non-empty Case): film, lidé, společnost, vláda, moře, policie, prezident, stát, systém, člověk
Voc (1; 0% of non-empty Case): přátelé
EMPTY (167): Curie, DNA, GCA, MPS, Pebe, Really, m, my, t, A

Paradigm stát	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Number=Sing`	stát	stát		státu		státem
`Number=Plur`	státy		státům	států	státech

`ADJ`

2010 ADJ tokens (89% of all ADJ tokens) have a non-empty value of Case.

The most frequent other feature values with which ADJ and Case co-occurred: Polarity=Pos (1841; 92%), VerbForm=EMPTY (1799; 90%), Voice=EMPTY (1799; 90%), Degree=Pos (1750; 87%), Number=Sing (1347; 67%), Animacy=EMPTY (1198; 60%).

ADJ tokens may have the following values of Case:

Acc (395; 20% of non-empty Case): další, první, vlastní, jiné, novou, nové, hlavní, dlouhé, druhou, nový
Dat (87; 4% of non-empty Case): Osmanské, Spojeným, nížinné, obecné, větší, Alexandrově, Druhé, Mrtvým, Parmské, Starší
Gen (518; 26% of non-empty Case): jiných, nových, prvního, Spojených, amerického, dalších, druhé, nové, první, různých
Ins (167; 8% of non-empty Case): americkou, dalším, velkou, dalšími, hlavním, hongkongským, nejvyšším, největším, politickou, první
Loc (226; 11% of non-empty Case): druhé, posledních, Velké, jižní, první, Nové, Severní, Spojených, bronzové, celém
Nom (617; 31% of non-empty Case): další, první, velká, severní, poslední, jasné, jižní, možné, nové, Průmyslová
EMPTY (259): The, schopen, řečeno, National, propuštěn, rád, El, New, Saint, San

Paradigm velký	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Animacy=Anim\|Degree=Pos\|Gender=Masc\|Number=Plur`	velcí
`Animacy=Anim\|Degree=Sup\|Gender=Masc\|Number=Plur`						největšími
`Animacy=Inan\|Degree=Pos\|Gender=Masc\|Number=Sing`	velký	velký	velkému	velkého
`Animacy=Inan\|Degree=Pos\|Gender=Masc\|Number=Plur`		velké			velkých
`Animacy=Inan\|Degree=Cmp\|Gender=Masc\|Number=Sing`		větší			větším
`Animacy=Inan\|Degree=Sup\|Gender=Masc\|Number=Sing`		největší				největším
`Degree=Pos\|Gender=Fem\|Number=Sing`	velká	velkou	velké		Velké	velkou
`Degree=Pos\|Gender=Fem\|Number=Plur`	velké
`Degree=Pos\|Gender=Neut\|Number=Sing`		velké			velkém	velkým
`Degree=Pos\|Gender=Neut\|Number=Plur`		velká
`Degree=Cmp\|Gender=Fem\|Number=Sing`	Větší	větší	větší	větší
`Degree=Cmp\|Gender=Fem\|Number=Plur`					větších
`Degree=Sup\|Gender=Fem\|Number=Sing`		největší		největší		největší
`Degree=Sup\|Gender=Neut\|Number=Sing`						největším

`ADP`

1833 ADP tokens (100% of all ADP tokens) have a non-empty value of Case.

The most frequent other feature values with which ADP and Case co-occurred: AdpType=Prep (1682; 92%).

ADP tokens may have the following values of Case:

Acc (323; 18% of non-empty Case): na, pro, za, o, v, po, mimo, přes, ve, mezi
Dat (115; 6% of non-empty Case): k, proti, ke, kvůli, díky, vůči, navzdory, oproti
Gen (411; 22% of non-empty Case): z, do, od, ze, během, podle, u, kolem, bez, kromě
Ins (215; 12% of non-empty Case): s, mezi, před, se, pod, př, nad, za
Loc (763; 42% of non-empty Case): v, na, ve, po, o, při, a
Nom (6; 0% of non-empty Case): de
EMPTY (9): vzhledem, Von, of, Di, On

Paradigm za	`Acc`	`Gen`	`Ins`
`AdpType=Prep`	za	za	za
`AdpType=Voc`		za

`PROPN`

878 PROPN tokens (80% of all PROPN tokens) have a non-empty value of Case.

The most frequent other feature values with which PROPN and Case co-occurred: Foreign=EMPTY (842; 96%), Number=Sing (818; 93%), Gender=Masc (591; 67%), Animacy=Anim (447; 51%).

PROPN tokens may have the following values of Case:

Acc (69; 8% of non-empty Case): Německo, Richarda, Trumpa, Abakumova, Aljašku, Alvareze, Andre, Anglii, Annu, Antarktidu
Dat (31; 4% of non-empty Case): Evropě, Itálii, Mundu, Roně, Rusku, Andymu, Benoîtovi, Britům, Churchillovi, Disneyovi
Gen (177; 20% of non-empty Case): Clintonové, Albánie, Ameriky, Afriky, Burgoyna, Disneyho, Donalda, Duffyho, Egypta, Francie
Ins (70; 8% of non-empty Case): Albánií, Bogdgegénem, Kristem, Markem, Alvarezem, Anglií, Asií, Averym, Benátkami, Brantem
Loc (93; 11% of non-empty Case): Británii, Asii, Africe, Americe, Evropě, Facebooku, Glasgow, Itálii, Norsku, Papui
Nom (438; 50% of non-empty Case): Čína, Trump, Bluntová, Británie, Donald, Francie, Mišima, Seagal, Winstone, Wright
EMPTY (214): USA, Čching, BBC, Danevirke, CNN, EU, Aviva, Bank, Brisbane, Company

Paradigm Trump	`Nom`	`Acc`	`Gen`	`Ins`
	Trump	Trumpa	Trumpa	Trumpem

`DET`

735 DET tokens (87% of all DET tokens) have a non-empty value of Case.

The most frequent other feature values with which DET and Case co-occurred: Number[psor]=EMPTY (688; 94%), Person=EMPTY (688; 94%), Reflex=EMPTY (648; 88%), Animacy=EMPTY (640; 87%), Poss=EMPTY (601; 82%), Number=Sing (509; 69%).

DET tokens may have the following values of Case:

Acc (146; 20% of non-empty Case): své, to, svůj, svou, které, několik, který, kterou, mnoho, toto
Dat (27; 4% of non-empty Case): tomu, svým, kterému, své, těm, těmto, jakékoliv, jejím, kterým, svému
Gen (103; 14% of non-empty Case): toho, tohoto, svého, svých, těchto, své, mnoha, té, všech, jejích
Ins (56; 8% of non-empty Case): tím, n, svým, jakým, jejím, mnoha, svou, tou, tímto, těmi
Loc (56; 8% of non-empty Case): této, tom, svém, té, kterém, tomto, kterých, některých, své, svých
Nom (347; 47% of non-empty Case): to, který, která, které, kteří, mnoho, tento, její, každý, toto
EMPTY (106): jeho, jejich, více, její, jejichž, víc, jehož, jejíž, méně

Paradigm který	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Animacy=Anim\|Gender=Masc\|Number=Sing`		kterého
`Animacy=Anim\|Gender=Masc\|Number=Plur`	kteří
`Animacy=Inan\|Gender=Masc\|Number=Sing`		který
`Animacy=Inan\|Gender=Masc\|Number=Plur`	které	které
`Gender=Masc,Neut\|Number=Sing`			kterému	kterého	kterém
`Gender=Masc\|Number=Sing`	který
`Gender=Masc\|Number=Plur`	které	které
`Gender=Fem\|Number=Sing`	která	kterou		které	které
`Gender=Fem\|Number=Plur`	které, která	které
`Gender=Neut\|Number=Sing`	které	které
`Gender=Neut\|Number=Plur`	která	která
`Number=Plur`			kterým	kterých	kterých	kterými

`PRON`

574 PRON tokens (100% of all PRON tokens) have a non-empty value of Case.

The most frequent other feature values with which PRON and Case co-occurred: PrepCase=EMPTY (510; 89%), PronType=Prs (480; 84%), Gender=EMPTY (471; 82%), Person=EMPTY (448; 78%), Number=EMPTY (426; 74%), Variant=Short (379; 66%), Reflex=Yes (354; 62%).

PRON tokens may have the following values of Case:

Acc (370; 64% of non-empty Case): se, ho, co, ji, mě, je, nás, něco, nic, ně
Dat (79; 14% of non-empty Case): si, mu, jí, jim, nám, mi, čemuž, nimž, němu, něčemu
Gen (32; 6% of non-empty Case): nich, ní, něj, jich, nichž, mě, něhož, sebe, jehož, jí
Ins (21; 4% of non-empty Case): ním, nimi, jím, čímž, nikým, ničím, ní, něčím, sebou, čím
Loc (16; 3% of non-empty Case): níž, ní, něm, nich, nichž, něčem, sobě, veškeré
Nom (56; 10% of non-empty Case): což, co, kdo, jenž, někdo, já, nic, on, jež, kdokoli
EMPTY (2): You, me

Paradigm on	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Animacy=Anim\|Gender=Masc\|Number=Plur`	oni
`Gender=Masc,Neut\|Number=Sing`		něj, ho	němu	něj	něm	ním, jím
`Gender=Masc,Neut\|Number=Sing\|Variant=Short`		ho	mu
`Gender=Masc\|Number=Sing`	on
`Gender=Fem\|Number=Sing`	ona	ji	jí	ní, jí	ní	ní
`Gender=Neut\|Number=Sing`		je
`Number=Plur`		je, ně	jim	nich, jich	nich	nimi

`NUM`

140 NUM tokens (31% of all NUM tokens) have a non-empty value of Case.

The most frequent other feature values with which NUM and Case co-occurred: NumForm=Word (140; 100%), NumType=Card (140; 100%), Number=Plur (82; 59%), Gender=EMPTY (78; 56%).

NUM tokens may have the following values of Case:

Acc (46; 33% of non-empty Case): dva, deset, dvě, čtyři, tři, jedno, jednu, šest, osm, jeden
Dat (3; 2% of non-empty Case): oběma, dvěma
Gen (24; 17% of non-empty Case): jedné, dvou, deseti, jednoho, tří, šesti, obou, osmdesáti, padesáti, sedmi
Ins (14; 10% of non-empty Case): dvěma, jedním, dvaceti, jednou, osmi, třemi
Loc (21; 15% of non-empty Case): dvou, jedné, obou, sedmi, šesti, dvaceti, jedenácti, jednom, pěti, sedmnácti
Nom (32; 23% of non-empty Case): jeden, jedna, čtyři, dva, dvě, oba, devět, jedno, pět, sedmnáct
EMPTY (319): 1, 3, 20, 2014, 2015, 5, I, 10, 100, 1492

Paradigm dva	`Nom`	`Acc`	`Dat`	`Gen`	`Loc`	`Ins`
`Gender=Masc`	dva	dva
`Gender=Fem,Neut`	dvě	dvě
			dvěma	dvou	dvou	dvěma

Relations with Agreement in `Case`

The 10 most frequent relations where parent and child node agree in Case: NOUN –[amod]–> ADJ (1698; 99%), NOUN –[case]–> ADP (1351; 95%), NOUN –[det]–> DET (315; 77%), NOUN –[conj]–> NOUN (247; 97%), PROPN –[case]–> ADP (180; 83%), PROPN –[flat]–> PROPN (106; 80%), PROPN –[amod]–> ADJ (84; 95%), PRON –[case]–> ADP (75; 100%), DET –[case]–> ADP (55; 95%), PROPN –[nmod]–> NOUN (51; 74%).

Treebank Statistics: UD_Czech-PUD: Features: Case

NOUN

ADJ

ADP

PROPN

DET

PRON

NUM

Relations with Agreement in Case