Treebank Statistics: UD_Czech-PDT: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
187337 tokens (56%) have a non-empty value of Case
.
41609 types (78%) occur at least once with a non-empty value of Case
.
19041 lemmas (71%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (78979; 24% instances), ADJ (38032; 11% instances), ADP (31866; 10% instances), PROPN (13840; 4% instances), DET (12165; 4% instances), PRON (10087; 3% instances), NUM (2368; 1% instances).
NOUN
78979 NOUN tokens (95% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Polarity=Pos (78863; 100%), Number=Sing (56889; 72%), Animacy=EMPTY (44546; 56%).
NOUN
tokens may have the following values of Case
:
Acc
(15420; 20% of non-emptyCase
): rok, cenu, peníze, dobu, den, roky, otázku, zájem, možnost, právoDat
(3057; 4% of non-emptyCase
): dispozici, lidem, firmě, občanům, společnosti, bodu, vládě, změnám, veřejnosti, změněGen
(24717; 31% of non-emptyCase
): let, korun, roku, lidí, zákona, procent, světa, strany, práce, vládyIns
(6682; 8% of non-emptyCase
): způsobem, přímkou, lety, koncem, cílem, bodem, rokem, součástí, prostřednictvím, většinouLoc
(9873; 13% of non-emptyCase
): roce, případě, době, letech, straně, světě, trhu, oblasti, základě, rámciNom
(19192; 24% of non-emptyCase
): vláda, předseda, ministr, prezident, firma, lidé, ředitel, společnost, cena, stranaVoc
(38; 0% of non-emptyCase
): pane, čtenáři, doktore, krávo, Soudruhu, paní, starosto, MAJORE, Občane, dětiEMPTY
(4194): p, Kč, r, m, q, s, a, j, b, HZDS
Paradigm vláda | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Number=Sing | vláda | vládu | vládě | vlády | vládo | vládě | vládou |
Number=Plur | vlády | vlády | vládám | vlád | vládami |
ADJ
38032 ADJ tokens (93% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Polarity=Pos (35352; 93%), VerbForm=EMPTY (34210; 90%), Voice=EMPTY (34210; 90%), Degree=Pos (33749; 89%), Number=Sing (26440; 70%), Animacy=EMPTY (22254; 59%).
ADJ
tokens may have the following values of Case
:
Acc
(7259; 19% of non-emptyCase
): další, první, jiné, nové, vlastní, větší, poslední, příští, největší, celouDat
(1404; 4% of non-emptyCase
): dalšímu, zahraničním, české, dalším, jiným, ostatním, vlastní, jinému, pravým, českýmGen
(11094; 29% of non-emptyCase
): české, českého, dalších, nového, českých, první, zahraničních, evropské, národního, druhéIns
(3141; 8% of non-emptyCase
): hlavním, dalším, českou, jinými, největším, dalšími, velkou, jediným, druhou, prvníLoc
(4249; 11% of non-emptyCase
): druhé, prvním, první, současné, české, posledních, poslední, druhém, dalším, českémNom
(10874; 29% of non-emptyCase
): další, první, možné, česká, státní, nový, český, nová, nové, národníVoc
(11; 0% of non-emptyCase
): Vážení, rudá, Laskavý, Vážená, drahá, mikrovlnný, neznámá, vzdálenáEMPTY
(2742): tzv, a, řečeno, rád, možno, čs, česko, schopen, známo, připravena
Paradigm známý | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Neg | neznámý | neznámého | |||||
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos | známý | známého | známým | ||||
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Neg | neznámí | neznámé | |||||
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos | známí | známým | |||||
Animacy=Anim|Degree=Sup|Gender=Masc|Number=Sing|Polarity=Pos | nejznámější | nejznámějším | |||||
Animacy=Anim|Degree=Sup|Gender=Masc|Number=Plur|Polarity=Pos | nejznámější | nejznámějších | |||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Neg | neznámý | neznámého | |||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos | známý | známý | známého | známým | |||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Neg | neznámých | neznámými | |||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos | známé | známé | známým | známých | |||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Sing|Polarity=Pos | Nejznámějším | ||||||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Plur|Polarity=Pos | nejznámější | ||||||
Degree=Pos|Gender=Fem|Number=Sing|Polarity=Neg | neznámá | neznámá | |||||
Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos | známá | známou | známé | známé | známou | ||
Degree=Pos|Gender=Fem|Number=Plur|Polarity=Neg | neznámých | ||||||
Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos | známé | známých | |||||
Degree=Pos|Gender=Neut|Number=Sing|Polarity=Neg | neznámé | neznámým | |||||
Degree=Pos|Gender=Neut|Number=Sing|Polarity=Pos | známé | známé | známého | známým | |||
Degree=Pos|Gender=Neut|Number=Plur|Polarity=Neg | neznámá | ||||||
Degree=Pos|Gender=Neut|Number=Plur|Polarity=Pos | známých |
ADP
31866 ADP tokens (100% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (29399; 92%).
ADP
tokens may have the following values of Case
:
Acc
(6763; 21% of non-emptyCase
): na, pro, za, o, v, přes, ve, po, mezi, mimoDat
(2019; 6% of non-emptyCase
): k, proti, ke, díky, vůči, kvůli, oproti, naproti, ku, navzdoryGen
(7004; 22% of non-emptyCase
): z, do, od, podle, u, ze, bez, během, za, kolemIns
(3655; 11% of non-emptyCase
): s, se, před, mezi, nad, pod, za, n, přede, přLoc
(12413; 39% of non-emptyCase
): v, na, o, ve, po, přiNom
(12; 0% of non-emptyCase
): kontra, versus, v, adEMPTY
(77): vzhledem, nehledě, narozdíl
Paradigm za | Acc | Gen | Ins |
---|---|---|---|
za | za | za |
PROPN
13840 PROPN tokens (88% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Polarity=Pos (13840; 100%), Number=Sing (13115; 95%), Gender=Masc (8990; 65%), NameType=Giv (7541; 54%), Animacy=Anim (7232; 52%).
PROPN
tokens may have the following values of Case
:
Acc
(646; 5% of non-emptyCase
): Slovensko, Německo, Evropu, Prahu, Jiřího, Rusko, Albrightovou, Letnou, Moravu, IrskoDat
(311; 2% of non-emptyCase
): Německu, Polsku, Slovensku, Brnu, Evropě, Pavlu, Glassmannovi, Hitlerovi, Jelcinovi, PetruGen
(2830; 20% of non-emptyCase
): Evropy, Prahy, Jana, Německa, Slovenska, Ruska, Sparty, Československa, Václava, ČechIns
(708; 5% of non-emptyCase
): Labem, Německem, Slovenskem, Polskem, Ruskem, Izraelem, Rakouskem, Klausem, Němci, SrbyLoc
(1636; 12% of non-emptyCase
): Praze, Německu, Evropě, Brně, Slovensku, Francii, Ostravě, Bratislavě, Čechách, AmericeNom
(7700; 56% of non-emptyCase
): Praha, Jiří, Jan, Václav, Vladimír, Klaus, Petr, Pavel, Josef, OstravaVoc
(9; 0% of non-emptyCase
): Baryku, Johne, Kriste, Nitsche, Pavle, Reichu, Steve, Werichu, ČaskoEMPTY
(1901): ČR, ODS, LN, USA, OSN, ČSFR, NATO, SR, ČSSD, EU
Paradigm Praha | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Praha, PRAHA | Prahu | Praze | Prahy | Praze | Prahou |
DET
12165 DET tokens (90% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number[psor]=EMPTY (11193; 92%), Person=EMPTY (11193; 92%), Animacy=EMPTY (10239; 84%), Poss=EMPTY (10077; 83%), Number=Sing (8393; 69%).
DET
tokens may have the following values of Case
:
Acc
(2874; 24% of non-emptyCase
): to, které, své, svou, kterou, svůj, který, tuto, všechny, několikDat
(526; 4% of non-emptyCase
): tomu, tomuto, všem, svým, své, svému, této, těm, kterým, jejímuGen
(2034; 17% of non-emptyCase
): toho, tohoto, všech, těchto, svého, této, miliónů, milionů, svých, svéIns
(858; 7% of non-emptyCase
): tím, svým, svou, tímto, svými, jakým, těmito, kterým, několika, toutoLoc
(1197; 10% of non-emptyCase
): tom, tomto, této, svém, své, kterém, těchto, všech, svých, kteréNom
(4673; 38% of non-emptyCase
): to, který, které, která, kteří, tato, tento, ten, sám, jejíVoc
(3; 0% of non-emptyCase
): Má, milióny, můjEMPTY
(1353): jeho, jejich, tisíc, její, jejichž, jehož, mil, mld, jejíž, tis
Paradigm milión | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Number=Sing | milión | milión | miliónu | miliónu | |||
Number=Plur | milióny | milióny | miliónů | milióny | miliónech | milióny |
PRON
10087 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Gender=EMPTY (8690; 86%), PrepCase=EMPTY (8389; 83%), PronType=Prs (8362; 83%), Person=EMPTY (7472; 74%), Number=EMPTY (6958; 69%), Variant=Short (6105; 61%), Reflex=Yes (5747; 57%).
PRON
tokens may have the following values of Case
:
Acc
(6151; 61% of non-emptyCase
): se, je, co, ji, ho, nás, nic, jej, něco, měDat
(1710; 17% of non-emptyCase
): si, nám, mu, mi, jim, jí, vám, jimž, sobě, jemužGen
(636; 6% of non-emptyCase
): nás, nich, jich, nichž, něj, jehož, ní, něho, níž, něhožIns
(300; 3% of non-emptyCase
): nimi, ním, sebou, čím, jím, námi, ní, jimiž, níž, mnouLoc
(352; 3% of non-emptyCase
): něm, němž, níž, nichž, ní, nich, sobě, čem, mně, násNom
(934; 9% of non-emptyCase
): co, kdo, což, já, my, nikdo, někdo, on, jež, nicVoc
(4; 0% of non-emptyCase
): tyEMPTY
(9): co
Paradigm on | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Plur | oni | |||||
Gender=Masc,Neut|Number=Sing | jej, něj, něho | němu, jemu | něj, něho, jej | něm | ním, jím | |
Gender=Masc,Neut|Number=Sing|Variant=Short | ho | mu | ho | |||
Gender=Masc|Number=Sing | on | jeho | ||||
Gender=Fem|Number=Sing | ona | ji, ni | jí, ní | ní, jí | ní | ní, jí |
Gender=Fem|Number=Plur | ony | |||||
Gender=Neut|Number=Sing | ono | je, ně | ||||
Number=Plur | je, ně | jim, nim | nich, jich | nich | nimi, jimi |
NUM
2368 NUM tokens (28% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=Word (2367; 100%), NumType=Card (2367; 100%), Gender=EMPTY (1402; 59%), Number=Plur (1327; 56%).
NUM
tokens may have the following values of Case
:
Acc
(794; 34% of non-emptyCase
): tři, dva, dvě, čtyři, pět, jednu, šest, jeden, deset, dvacetDat
(33; 1% of non-emptyCase
): dvěma, oběma, jedné, třem, čtyřem, deseti, jednomu, nejednomu, pětiGen
(416; 18% of non-emptyCase
): dvou, jednoho, tří, obou, jedné, šesti, čtyř, pěti, osmi, desetiIns
(228; 10% of non-emptyCase
): jedním, dvěma, jednou, třemi, pěti, čtyřmi, oběma, deseti, šesti, patnáctiLoc
(241; 10% of non-emptyCase
): dvou, jedné, jednom, obou, třech, čtyřech, pěti, šesti, dvaceti, osmiNom
(656; 28% of non-emptyCase
): jeden, dva, oba, jedna, dvě, tři, pět, čtyři, jedno, oběEMPTY
(6163): 1, 2, 3, 4, 10, 5, 1992, 6, 1993, 15
Paradigm jeden | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc | jednoho | |||||
Animacy=Inan|Gender=Masc | jeden | |||||
Gender=Masc,Neut | jednomu | jednoho | jednom | jedním | ||
Gender=Masc | jeden | |||||
Gender=Fem | jedna | jednu | jedné | jedné | jedné | jednou |
Gender=Neut | jedno | jedno |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (32367; 98%),
NOUN –[case]–> ADP (23540; 95%),
NOUN –[det]–> DET (5335; 81%),
NOUN –[conj]–> NOUN (4393; 93%),
PROPN –[case]–> ADP (2787; 87%),
NOUN –[flat]–> PROPN (2227; 99%),
PROPN –[flat]–> PROPN (1598; 93%),
PRON –[case]–> ADP (1339; 99%),
ADJ –[conj]–> ADJ (1206; 90%),
DET –[case]–> ADP (1109; 95%).