Treebank Statistics: UD_Czech-CAC: Features: Case
This feature is universal.
It occurs with 7 different values: Acc, Dat, Gen, Ins, Loc, Nom, Voc.
295925 tokens (60%) have a non-empty value of Case.
51531 types (83%) occur at least once with a non-empty value of Case.
22184 lemmas (78%) occur at least once with a non-empty value of Case.
The feature is used with 7 part-of-speech tags: NOUN (135027; 27% instances), ADJ (68870; 14% instances), ADP (48324; 10% instances), DET (17555; 4% instances), PRON (15863; 3% instances), PROPN (7815; 2% instances), NUM (2471; 0% instances).
NOUN
135027 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (95304; 71%), Animacy=EMPTY (79149; 59%).
NOUN tokens may have the following values of Case:
Acc(23982; 18% of non-emptyCase): práci, dobu, rok, význam, podmínky, úkoly, činnost, pozornost, rozvoj, řaduDat(5182; 4% of non-emptyCase): pracovníkům, práci, dispozici, výročí, lidem, řešení, dětem, rozvoji, zlepšení, skutečnostiGen(47798; 35% of non-emptyCase): práce, let, roku, hlediska, společnosti, výroby, pracovníků, úkolů, jazyka, lidíIns(12225; 9% of non-emptyCase): způsobem, součástí, vodou, cílem, lety, lidmi, prostřednictvím, formou, prací, výsledkemLoc(17455; 13% of non-emptyCase): roce, době, oblasti, základě, případě, straně, letech, rámci, práci, smysluNom(28315; 21% of non-emptyCase): práce, člověk, lidé, doba, výsledky, pracovník, počet, teorie, organizace, částVoc(70; 0% of non-emptyCase): soudruhu, soudruzi, řediteli, náměstku, soudružko, soudružky, doktore, kamaráde, mámo, paneEMPTY(1155): ÚV, ZV, ZO, JZD, Kčs, ONV, ÚR, MěstNV, BSP, BP
| Paradigm člověk | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
|---|---|---|---|---|---|---|---|
| Number=Sing | člověk | člověka | člověku | člověka | člověku | člověkem | |
| Number=Plur | lidé, lidi | lidi | lidem | lidí | Lidi | lidech | lidmi |
ADJ
68870 ADJ tokens (93% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Polarity=Pos (66035; 96%), Degree=Pos (62554; 91%), VerbForm=EMPTY (60899; 88%), Voice=EMPTY (60899; 88%), Number=Sing (44617; 65%), Animacy=EMPTY (41317; 60%).
ADJ tokens may have the following values of Case:
Acc(12223; 18% of non-emptyCase): další, základní, první, pracovní, nové, jiné, různé, vlastní, celou, většíDat(2191; 3% of non-emptyCase): dalšímu, jiným, ostatním, národnímu, jednotlivým, různým, socialistickému, Slovenskému, plánovaným, určitémuGen(23302; 34% of non-emptyCase): jednotlivých, národního, socialistické, výrobních, dalších, různých, jiných, nových, základních, pracovníIns(6436; 9% of non-emptyCase): jinými, hlavním, ostatními, základním, různými, velkým, elektrickým, dalším, určitým, novýmLoc(7448; 11% of non-emptyCase): současné, druhé, různých, jednotlivých, dalších, jiných, celé, pracovní, celém, posledníchNom(17247; 25% of non-emptyCase): další, první, možné, nutné, nové, základní, pracovní, větší, různé, ostatníVoc(23; 0% of non-emptyCase): vážený, vážení, vážená, vážené, dolarovej, drahej, mladí, podnikovýEMPTY(5350): možno, nutno, povinen, řečeno, Králové, dosaženo, známo, rád, rádi, věnována
| Paradigm mladý | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
|---|---|---|---|---|---|---|---|
| Animacy=Anim|Degree=Pos|Gender=Masc|Number=Sing | mladý | mladého | mladému | mladého | |||
| Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur | mladí | mladé | mladým | mladých | mladí | mladými | |
| Animacy=Anim|Degree=Cmp|Gender=Masc|Number=Sing | mladší | mladšího | |||||
| Animacy=Anim|Degree=Cmp|Gender=Masc|Number=Plur | mladší | mladší | mladším | ||||
| Animacy=Anim|Degree=Sup|Gender=Masc|Number=Sing | nejmladšímu | ||||||
| Animacy=Anim|Degree=Sup|Gender=Masc|Number=Plur | nejmladší | ||||||
| Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing | mladý | Mladý | mladého | mladém | |||
| Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur | mladé | mladých | mladými | ||||
| Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Sing | mladší | ||||||
| Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Plur | mladší | mladší | mladších | ||||
| Animacy=Inan|Degree=Sup|Gender=Masc|Number=Plur | nejmladší | nejmladší | |||||
| Degree=Pos|Gender=Fem|Number=Sing | mladá | mladou | mladé | Mladé | mladou | ||
| Degree=Pos|Gender=Fem|Number=Plur | mladé | mladé | mladých | ||||
| Degree=Pos|Gender=Neut|Number=Sing | mladé | mladé | |||||
| Degree=Pos|Gender=Neut|Number=Plur | mladá | mladých | |||||
| Degree=Cmp|Gender=Fem|Number=Sing | mladší | Mladší | mladší | mladší | mladší | ||
| Degree=Cmp|Gender=Fem|Number=Plur | mladším | mladších | mladšími | ||||
| Degree=Cmp|Gender=Neut|Number=Sing | mladšího | ||||||
| Degree=Sup|Gender=Fem|Number=Sing | nejmladší | Nejmladší | nejmladší | ||||
| Degree=Sup|Gender=Neut|Number=Sing | nejmladšího |
ADP
48324 ADP tokens (100% of all ADP tokens) have a non-empty value of Case.
The most frequent other feature values with which ADP and Case co-occurred: AdpType=Prep (44492; 92%).
ADP tokens may have the following values of Case:
Acc(9636; 20% of non-emptyCase): na, pro, o, za, v, přes, po, mimo, mezi, veDat(3483; 7% of non-emptyCase): k, ke, proti, vůči, naproti, díky, oproti, kvůli, dík, vstřícGen(10095; 21% of non-emptyCase): z, do, u, od, podle, ze, bez, za, kolem, kroměIns(5374; 11% of non-emptyCase): s, se, mezi, před, pod, nad, za, přede, nadeLoc(19718; 41% of non-emptyCase): v, na, ve, o, při, po, in, Pro, ex, sineNom(18; 0% of non-emptyCase): de, kontraEMPTY(142): vzhledem, de, nehledě, *, cross, of, par, a, aus, del
| Paradigm o | Acc | Gen | Loc |
|---|---|---|---|
| o | o | o |
DET
17555 DET tokens (89% of all DET tokens) have a non-empty value of Case.
The most frequent other feature values with which DET and Case co-occurred: Number[psor]=EMPTY (15878; 90%), Person=EMPTY (15878; 90%), Animacy=EMPTY (15128; 86%), Poss=EMPTY (14438; 82%), Number=Sing (12039; 69%).
DET tokens may have the following values of Case:
Acc(3632; 21% of non-emptyCase): to, které, své, tuto, kterou, tyto, svou, který, tento, několikDat(814; 5% of non-emptyCase): tomu, tomuto, této, kterým, těmto, svému, těm, každému, některým, jejímuGen(2999; 17% of non-emptyCase): toho, tohoto, těchto, této, našeho, naší, některých, svého, našich, svéIns(1356; 8% of non-emptyCase): tím, svým, svou, tímto, svými, touto, těmito, jakým, kterým, kterýmiLoc(1933; 11% of non-emptyCase): tom, tomto, této, našem, své, těchto, svém, některých, svých, našíNom(6821; 39% of non-emptyCase): to, které, která, který, kteří, tato, tyto, tento, každý, našeEMPTY(2255): jejich, jeho, její, jehož, jejichž, jejíž, quem
| Paradigm ten | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Sing | toho | |||||
| Animacy=Anim|Gender=Masc|Number=Plur | ti | ty | ||||
| Animacy=Inan|ExtPos=ADJ|Gender=Masc|Number=Plur | Ty | |||||
| Animacy=Inan|Gender=Masc|Number=Sing | ten | |||||
| Animacy=Inan|Gender=Masc|Number=Plur | ty | ty | ||||
| ExtPos=CCONJ|Gender=Neut|Number=Sing | to | |||||
| Gender=Masc,Neut|Number=Sing | tomu | toho | tom | tím | ||
| Gender=Masc|Number=Sing | ten | |||||
| Gender=Fem|Number=Sing | ta | tu | té | té | té | tou |
| Gender=Fem|Number=Sing|Style=Coll | tý | |||||
| Gender=Fem|Number=Dual | těma | |||||
| Gender=Fem|Number=Plur | ty | ty | ||||
| Gender=Neut|Number=Sing | to | to | tím | |||
| Gender=Neut|Number=Plur | ta | Ta | ||||
| Number=Plur | těm | těch | těch | těmi |
PRON
15863 PRON tokens (99% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Gender=EMPTY (13052; 82%), PrepCase=EMPTY (13006; 82%), PronType=Prs (12495; 79%), Person=EMPTY (12410; 78%), Number=EMPTY (10158; 64%), Variant=Short (9196; 58%), Reflex=Yes (9042; 57%).
PRON tokens may have the following values of Case:
Acc(9779; 62% of non-emptyCase): se, je, ji, co, ho, všechny, nás, jej, sebe, něDat(2186; 14% of non-emptyCase): si, nám, jim, mu, mi, vám, všem, nim, jí, soběGen(1173; 7% of non-emptyCase): všech, nás, nich, nichž, sebe, jich, něho, níž, ní, něhožIns(572; 4% of non-emptyCase): nimi, sebou, ním, čím, jimiž, jimi, všemi, čímž, nimiž, jímLoc(723; 5% of non-emptyCase): němž, všech, nichž, něm, níž, nich, sobě, ní, čem, všemNom(1429; 9% of non-emptyCase): jež, všechny, což, co, všichni, kdo, já, my, všechno, nicVoc(1; 0% of non-emptyCase): tyEMPTY(123): co, they
| Paradigm ty | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
|---|---|---|---|---|---|---|---|
| Number=Sing | ty | tebe | tebe | ty | tebou | ||
| Number=Sing|Variant=Short | tě | ti | |||||
| Number=Plur | vy | vás | vám | vás | Vás | vámi |
PROPN
7815 PROPN tokens (80% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Abbr=EMPTY (7810; 100%), Number=Sing (7154; 92%), Gender=Masc (4783; 61%).
PROPN tokens may have the following values of Case:
Acc(402; 5% of non-emptyCase): Slovensko, Fučíka, Prahu, Karpaty, Josefa, Lužnici, Miroslava, Pepíčka, Jeana, MarxeDat(174; 2% of non-emptyCase): Erbenovi, Karlu, Pasákovi, Vietnamu, Zemi, Františku, Fučíkovi, Ivo, Janu, KřikavovéGen(1670; 21% of non-emptyCase): Prahy, Československa, Země, Evropy, Karla, Gottwalda, Jana, Vltavy, Fermiho, KlementaIns(360; 5% of non-emptyCase): Labem, Bečvou, Václavem, Karlem, Prahou, Sázavou, Alpami, Karpatami, Cidlinou, HonzouLoc(1259; 16% of non-emptyCase): Praze, Čechách, Brně, Slovensku, Československu, Evropě, Paříži, Hradci, Moskvě, KlatovechNom(3937; 50% of non-emptyCase): Praha, Škoda, Fučík, Erben, Karel, Horálek, Knappová, Němec, Těšitelová, BrnoVoc(13; 0% of non-emptyCase): Mirku, Dosoudile, Falto, Franto, Hrabale, Jiří, Jiříku, Ladislave, Lubo, LubošiEMPTY(2004): KSČ, ROH, SSSR, ÚJČ, SSM, ČSAV, ČSSR, ČSR, TIBA, NDR
| Paradigm Praha | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Praha | Prahu | Praze | Prahy | Praze | Prahou |
NUM
2471 NUM tokens (34% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: NumForm=Word (2411; 98%), NumType=Card (2411; 98%), Number=Plur (1281; 52%), Gender=EMPTY (1272; 51%).
NUM tokens may have the following values of Case:
Acc(686; 28% of non-emptyCase): jeden, tři, dva, dvě, jednu, pět, čtyři, jedno, půl, desetDat(41; 2% of non-emptyCase): jednomu, oběma, jedné, dvěma, třetině, šestině, jedenácti, osmi, pár, pětiGen(566; 23% of non-emptyCase): dvou, jednoho, obou, tří, tisíc, jedné, čtyř, pěti, půl, šestiIns(281; 11% of non-emptyCase): jedním, dvěma, jednou, oběma, třemi, čtyřmi, pěti, dvaceti, sto, třicetiLoc(271; 11% of non-emptyCase): jedné, jednom, dvou, obou, třech, čtyřech, deseti, osmi, pěti, sedmiNom(626; 25% of non-emptyCase): jeden, dvě, dva, jedna, tři, oba, obě, čtyři, pět, jednoEMPTY(4836): #
| Paradigm jeden | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc | jednoho | |||||
| Animacy=Inan|Gender=Masc | jeden | |||||
| Gender=Masc,Neut | jednomu | jednoho | jednom | jedním | ||
| Gender=Masc | jeden | |||||
| Gender=Fem | jedna | jednu | jedné | jedné | jedné | jednou |
| Gender=Neut | jedno | jedno |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[amod]–> ADJ (59186; 99%),
NOUN –[case]–> ADP (38528; 96%),
NOUN –[conj]–> NOUN (13509; 95%),
NOUN –[det]–> DET (8649; 79%),
ADJ –[conj]–> ADJ (3469; 94%),
PRON –[case]–> ADP (2185; 99%),
PROPN –[case]–> ADP (1850; 83%),
ADJ –[nsubj]–> NOUN (1446; 58%),
DET –[case]–> ADP (1416; 97%),
ADP –[fixed]–> NOUN (1334; 100%).