Treebank Statistics: UD_Czech-PUD: Features: Case
This feature is universal.
It occurs with 7 different values: Acc, Dat, Gen, Ins, Loc, Nom, Voc.
10485 tokens (56%) have a non-empty value of Case.
5469 types (72%) occur at least once with a non-empty value of Case.
3574 lemmas (67%) occur at least once with a non-empty value of Case.
The feature is used with 7 part-of-speech tags: NOUN (4315; 23% instances), ADJ (2010; 11% instances), ADP (1833; 10% instances), PROPN (878; 5% instances), DET (735; 4% instances), PRON (574; 3% instances), NUM (140; 1% instances).
NOUN
4315 NOUN tokens (96% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (3082; 71%), Animacy=EMPTY (2409; 56%).
NOUN tokens may have the following values of Case:
Acc(907; 21% of non-emptyCase): místo, den, rok, část, roky, většinu, dluhopisy, lidi, možnost, měsícDat(161; 4% of non-emptyCase): dispozici, podnebí, říši, dívkám, konci, obchodu, obsahu, radě, státům, většiněGen(1247; 29% of non-emptyCase): roku, let, století, války, lidí, dolarů, společnosti, doby, eur, liberIns(366; 8% of non-emptyCase): l, lety, rokem, autorem, cílem, nedostatkem, nemovitostmi, prezidentem, soudem, vedenímLoc(623; 14% of non-emptyCase): roce, letech, době, případě, důsledku, oblasti, světě, městě, období, poloviněNom(1010; 23% of non-emptyCase): film, lidé, společnost, vláda, moře, policie, prezident, stát, systém, člověkVoc(1; 0% of non-emptyCase): přáteléEMPTY(167): Curie, DNA, GCA, MPS, Pebe, Really, m, my, t, A
| Paradigm stát | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Number=Sing | stát | stát | státu | státem | ||
| Number=Plur | státy | státům | států | státech |
ADJ
2010 ADJ tokens (89% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Polarity=Pos (1841; 92%), VerbForm=EMPTY (1799; 90%), Voice=EMPTY (1799; 90%), Degree=Pos (1750; 87%), Number=Sing (1347; 67%), Animacy=EMPTY (1198; 60%).
ADJ tokens may have the following values of Case:
Acc(395; 20% of non-emptyCase): další, první, vlastní, jiné, novou, nové, hlavní, dlouhé, druhou, novýDat(87; 4% of non-emptyCase): Osmanské, Spojeným, nížinné, obecné, větší, Alexandrově, Druhé, Mrtvým, Parmské, StaršíGen(518; 26% of non-emptyCase): jiných, nových, prvního, Spojených, amerického, dalších, druhé, nové, první, různýchIns(167; 8% of non-emptyCase): americkou, dalším, velkou, dalšími, hlavním, hongkongským, nejvyšším, největším, politickou, prvníLoc(226; 11% of non-emptyCase): druhé, posledních, Velké, jižní, první, Nové, Severní, Spojených, bronzové, celémNom(617; 31% of non-emptyCase): další, první, velká, severní, poslední, jasné, jižní, možné, nové, PrůmyslováEMPTY(259): The, schopen, řečeno, National, propuštěn, rád, El, New, Saint, San
| Paradigm velký | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur | velcí | |||||
| Animacy=Anim|Degree=Sup|Gender=Masc|Number=Plur | největšími | |||||
| Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing | velký | velký | velkému | velkého | ||
| Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur | velké | velkých | ||||
| Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Sing | větší | větším | ||||
| Animacy=Inan|Degree=Sup|Gender=Masc|Number=Sing | největší | největším | ||||
| Degree=Pos|Gender=Fem|Number=Sing | velká | velkou | velké | Velké | velkou | |
| Degree=Pos|Gender=Fem|Number=Plur | velké | |||||
| Degree=Pos|Gender=Neut|Number=Sing | velké | velkém | velkým | |||
| Degree=Pos|Gender=Neut|Number=Plur | velká | |||||
| Degree=Cmp|Gender=Fem|Number=Sing | Větší | větší | větší | větší | ||
| Degree=Cmp|Gender=Fem|Number=Plur | větších | |||||
| Degree=Sup|Gender=Fem|Number=Sing | největší | největší | největší | |||
| Degree=Sup|Gender=Neut|Number=Sing | největším |
ADP
1833 ADP tokens (100% of all ADP tokens) have a non-empty value of Case.
The most frequent other feature values with which ADP and Case co-occurred: AdpType=Prep (1682; 92%).
ADP tokens may have the following values of Case:
Acc(323; 18% of non-emptyCase): na, pro, za, o, v, po, mimo, přes, ve, meziDat(115; 6% of non-emptyCase): k, proti, ke, kvůli, díky, vůči, navzdory, oprotiGen(411; 22% of non-emptyCase): z, do, od, ze, během, podle, u, kolem, bez, kroměIns(215; 12% of non-emptyCase): s, mezi, před, se, pod, př, nad, zaLoc(763; 42% of non-emptyCase): v, na, ve, po, o, při, aNom(6; 0% of non-emptyCase): deEMPTY(9): vzhledem, Von, of, Di, On
| Paradigm za | Acc | Gen | Ins |
|---|---|---|---|
| AdpType=Prep | za | za | za |
| AdpType=Voc | za |
PROPN
878 PROPN tokens (80% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Foreign=EMPTY (842; 96%), Number=Sing (818; 93%), Gender=Masc (591; 67%), Animacy=Anim (447; 51%).
PROPN tokens may have the following values of Case:
Acc(69; 8% of non-emptyCase): Německo, Richarda, Trumpa, Abakumova, Aljašku, Alvareze, Andre, Anglii, Annu, AntarktiduDat(31; 4% of non-emptyCase): Evropě, Itálii, Mundu, Roně, Rusku, Andymu, Benoîtovi, Britům, Churchillovi, DisneyoviGen(177; 20% of non-emptyCase): Clintonové, Albánie, Ameriky, Afriky, Burgoyna, Disneyho, Donalda, Duffyho, Egypta, FrancieIns(70; 8% of non-emptyCase): Albánií, Bogdgegénem, Kristem, Markem, Alvarezem, Anglií, Asií, Averym, Benátkami, BrantemLoc(93; 11% of non-emptyCase): Británii, Asii, Africe, Americe, Evropě, Facebooku, Glasgow, Itálii, Norsku, PapuiNom(438; 50% of non-emptyCase): Čína, Trump, Bluntová, Británie, Donald, Francie, Mišima, Seagal, Winstone, WrightEMPTY(214): USA, Čching, BBC, Danevirke, CNN, EU, Aviva, Bank, Brisbane, Company
| Paradigm Trump | Nom | Acc | Gen | Ins |
|---|---|---|---|---|
| Trump | Trumpa | Trumpa | Trumpem |
DET
735 DET tokens (87% of all DET tokens) have a non-empty value of Case.
The most frequent other feature values with which DET and Case co-occurred: Number[psor]=EMPTY (688; 94%), Person=EMPTY (688; 94%), Reflex=EMPTY (648; 88%), Animacy=EMPTY (640; 87%), Poss=EMPTY (601; 82%), Number=Sing (509; 69%).
DET tokens may have the following values of Case:
Acc(146; 20% of non-emptyCase): své, to, svůj, svou, které, několik, který, kterou, mnoho, totoDat(27; 4% of non-emptyCase): tomu, svým, kterému, své, těm, těmto, jakékoliv, jejím, kterým, svémuGen(103; 14% of non-emptyCase): toho, tohoto, svého, svých, těchto, své, mnoha, té, všech, jejíchIns(56; 8% of non-emptyCase): tím, n, svým, jakým, jejím, mnoha, svou, tou, tímto, těmiLoc(56; 8% of non-emptyCase): této, tom, svém, té, kterém, tomto, kterých, některých, své, svýchNom(347; 47% of non-emptyCase): to, který, která, které, kteří, mnoho, tento, její, každý, totoEMPTY(106): jeho, jejich, více, její, jejichž, víc, jehož, jejíž, méně
| Paradigm který | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Sing | kterého | |||||
| Animacy=Anim|Gender=Masc|Number=Plur | kteří | |||||
| Animacy=Inan|Gender=Masc|Number=Sing | který | |||||
| Animacy=Inan|Gender=Masc|Number=Plur | které | které | ||||
| Gender=Masc,Neut|Number=Sing | kterému | kterého | kterém | |||
| Gender=Masc|Number=Sing | který | |||||
| Gender=Masc|Number=Plur | které | které | ||||
| Gender=Fem|Number=Sing | která | kterou | které | které | ||
| Gender=Fem|Number=Plur | které, která | které | ||||
| Gender=Neut|Number=Sing | které | které | ||||
| Gender=Neut|Number=Plur | která | která | ||||
| Number=Plur | kterým | kterých | kterých | kterými |
PRON
574 PRON tokens (100% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: PrepCase=EMPTY (510; 89%), PronType=Prs (480; 84%), Gender=EMPTY (471; 82%), Person=EMPTY (448; 78%), Number=EMPTY (426; 74%), Variant=Short (379; 66%), Reflex=Yes (354; 62%).
PRON tokens may have the following values of Case:
Acc(370; 64% of non-emptyCase): se, ho, co, ji, mě, je, nás, něco, nic, něDat(79; 14% of non-emptyCase): si, mu, jí, jim, nám, mi, čemuž, nimž, němu, něčemuGen(32; 6% of non-emptyCase): nich, ní, něj, jich, nichž, mě, něhož, sebe, jehož, jíIns(21; 4% of non-emptyCase): ním, nimi, jím, čímž, nikým, ničím, ní, něčím, sebou, čímLoc(16; 3% of non-emptyCase): níž, ní, něm, nich, nichž, něčem, sobě, veškeréNom(56; 10% of non-emptyCase): což, co, kdo, jenž, někdo, já, nic, on, jež, kdokoliEMPTY(2): You, me
| Paradigm on | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Plur | oni | |||||
| Gender=Masc,Neut|Number=Sing | něj, ho | němu | něj | něm | ním, jím | |
| Gender=Masc,Neut|Number=Sing|Variant=Short | ho | mu | ||||
| Gender=Masc|Number=Sing | on | |||||
| Gender=Fem|Number=Sing | ona | ji | jí | ní, jí | ní | ní |
| Gender=Neut|Number=Sing | je | |||||
| Number=Plur | je, ně | jim | nich, jich | nich | nimi |
NUM
140 NUM tokens (31% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: NumForm=Word (140; 100%), NumType=Card (140; 100%), Number=Plur (82; 59%), Gender=EMPTY (78; 56%).
NUM tokens may have the following values of Case:
Acc(46; 33% of non-emptyCase): dva, deset, dvě, čtyři, tři, jedno, jednu, šest, osm, jedenDat(3; 2% of non-emptyCase): oběma, dvěmaGen(24; 17% of non-emptyCase): jedné, dvou, deseti, jednoho, tří, šesti, obou, osmdesáti, padesáti, sedmiIns(14; 10% of non-emptyCase): dvěma, jedním, dvaceti, jednou, osmi, třemiLoc(21; 15% of non-emptyCase): dvou, jedné, obou, sedmi, šesti, dvaceti, jedenácti, jednom, pěti, sedmnáctiNom(32; 23% of non-emptyCase): jeden, jedna, čtyři, dva, dvě, oba, devět, jedno, pět, sedmnáctEMPTY(319): 1, 3, 20, 2014, 2015, 5, I, 10, 100, 1492
| Paradigm dva | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Gender=Masc | dva | dva | ||||
| Gender=Fem,Neut | dvě | dvě | ||||
| dvěma | dvou | dvou | dvěma |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[amod]–> ADJ (1698; 99%),
NOUN –[case]–> ADP (1351; 95%),
NOUN –[det]–> DET (315; 77%),
NOUN –[conj]–> NOUN (247; 97%),
PROPN –[case]–> ADP (180; 83%),
PROPN –[flat]–> PROPN (106; 80%),
PROPN –[amod]–> ADJ (84; 95%),
PRON –[case]–> ADP (75; 100%),
DET –[case]–> ADP (55; 95%),
PROPN –[nmod]–> NOUN (51; 74%).