Treebank Statistics: UD_Slovak-SNK: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
52849 tokens (50%) have a non-empty value of Case
.
19427 types (75%) occur at least once with a non-empty value of Case
.
9938 lemmas (70%) occur at least once with a non-empty value of Case
.
The feature is used with 8 part-of-speech tags: NOUN (21661; 20% instances), ADJ (9474; 9% instances), ADP (8612; 8% instances), PROPN (4569; 4% instances), DET (4401; 4% instances), PRON (3477; 3% instances), NUM (621; 1% instances), ADV (34; 0% instances).
NOUN
21661 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (16426; 76%), Animacy=EMPTY (12499; 58%).
NOUN
tokens may have the following values of Case
:
Acc
(5342; 25% of non-emptyCase
): chvíľu, deň, oči, ruku, hlavu, tvár, život, pohľad, zem, časDat
(639; 3% of non-emptyCase
): mame, dverám, oknu, otcovi, koncu, stolu, kráľovi, moci, vojne, ľuďomGen
(5480; 25% of non-emptyCase
): roku, rokov, života, storočia, vlády, izby, sveta, dňa, mesta, politikyIns
(1826; 8% of non-emptyCase
): hlavou, cieľom, očami, plecami, súčasťou, úsmevom, chrbtom, rokmi, tvárou, vlasmiLoc
(2620; 12% of non-emptyCase
): roku, rokoch, chvíli, čase, oblasti, noci, prípade, ceste, škole, izbeNom
(5736; 26% of non-emptyCase
): vláda, mama, človek, otec, ľudia, muž, tvár, kráľ, sultán, detiVoc
(18; 0% of non-emptyCase
): mami, slečna, chlapče, ocko, Soľ, drahý, džin, pane, priatelia, priateľko
Paradigm vláda | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Number=Sing | vláda | vládu | vláde | vlády | vláde | vládou |
Number=Plur | vlády |
ADJ
9474 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Degree=Pos (8744; 92%), Polarity=EMPTY (8278; 87%), VerbForm=EMPTY (8278; 87%), Voice=EMPTY (8278; 87%), Number=Sing (6932; 73%), Animacy=EMPTY (5508; 58%).
ADJ
tokens may have the following values of Case
:
Acc
(2153; 23% of non-emptyCase
): druhý, celý, ďalšie, prvý, celé, nové, veľkú, veľké, veľký, novúDat
(215; 2% of non-emptyCase
): vlastným, mladým, Doležalovej, Hádovej, Zlej, cirkevnej, ostatným, starej, sultánovej, ďalšímGen
(2107; 22% of non-emptyCase
): verejných, veľkého, slovenskej, nového, cirkevného, európskej, veľkej, zahraničnej, celého, slovenskéhoIns
(829; 9% of non-emptyCase
): prvým, ďalším, veľkým, jediným, veľkými, ďalšou, hlavnou, najväčším, druhým, dôležitouLoc
(772; 8% of non-emptyCase
): druhej, prvom, poslednom, druhom, poslednej, celom, nasledujúcich, sledovaných, starej, veľkejNom
(3398; 36% of non-emptyCase
): prvý, veľký, prvá, ďalšie, možné, veľká, známe, ďalší, celý, jediný
Paradigm veľký | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Sing | veľký | veľkého | Veľkého | veľkým | ||
Animacy=Anim|Degree=Pos|Gender=Masc|Number=Plur | veľkými | |||||
Animacy=Anim|Degree=Cmp|Gender=Masc|Number=Sing | väčší | |||||
Animacy=Anim|Degree=Sup|Gender=Masc|Number=Sing | najväčšieho | najväčším | ||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing | veľký | veľký | veľkého | veľkom | veľkým | |
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur | veľké | veľkým | veľkých | veľkými | ||
Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Sing | väčší | väčší | väčšieho | väčším | ||
Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Plur | väčšie | väčších | ||||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Sing | najväčší | najväčším | ||||
Degree=Pos|Gender=Fem|Number=Sing | veľká | veľkú | veľkej | veľkej | veľkej | veľkou |
Degree=Pos|Gender=Fem|Number=Plur | veľké | veľké | veľkých | veľkými | ||
Degree=Pos|Gender=Neut|Number=Sing | veľké | veľké | veľkého | veľkom | veľkým | |
Degree=Pos|Gender=Neut|Number=Plur | veľké | veľkými | ||||
Degree=Cmp|Gender=Fem|Number=Sing | väčšia | väčšiu | ||||
Degree=Cmp|Gender=Neut|Number=Sing | väčšom | |||||
Degree=Cmp|Gender=Neut|Number=Plur | Väčšie | |||||
Degree=Cmp|Number=Plur | väčšími | |||||
Degree=Sup|Gender=Fem|Number=Sing | najväčšia | najväčšiu | najväčšou | |||
Degree=Sup|Gender=Fem|Number=Plur | najväčších | Najväčšími | ||||
Degree=Sup|Gender=Neut|Number=Sing | Najväčšie | najväčšie | najväčším |
ADP
8612 ADP tokens (100% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (8156; 95%).
ADP
tokens may have the following values of Case
:
Acc
(1835; 21% of non-emptyCase
): na, o, za, pre, v, cez, medzi, po, pod, nadDat
(467; 5% of non-emptyCase
): k, ku, proti, napriek, kvôli, vďaka, voči, oproti, naproti, ústretiGen
(2000; 23% of non-emptyCase
): do, z, od, zo, podľa, okolo, bez, počas, u, okremIns
(1177; 14% of non-emptyCase
): s, pred, so, za, medzi, pod, nad, spolu, nado, predoLoc
(3133; 36% of non-emptyCase
): v, na, po, o, pri, vo, popri, AN
Paradigm za | Acc | Gen | Ins |
---|---|---|---|
za | za | za |
PROPN
4569 PROPN tokens (95% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (4406; 96%), Gender=Masc (2995; 66%), Animacy=Anim (2570; 56%).
PROPN
tokens may have the following values of Case
:
Acc
(428; 9% of non-emptyCase
): Chrisa, Maju, Winstona, Aladina, Mauglího, Vilka, Briena, Lori, Margu, JazmínuDat
(199; 4% of non-emptyCase
): Maji, Winstonovi, Chrisovi, Júlii, Bohu, Irme, Lori, Vilkovi, Balúovi, FerdoviGen
(639; 14% of non-emptyCase
): Uhorska, Ríma, Jána, Pavla, Zeme, Nemecka, Mesiaca, Paríža, Slovenska, BushaIns
(204; 4% of non-emptyCase
): Chrisom, Vilkom, Allenom, Euroáziou, Európou, Ginsbergom, Mesiacom, Rickom, Rudkom, AladinomLoc
(292; 6% of non-emptyCase
): Iraku, Novgorode, Slovensku, Európe, Mesiaci, Nemecku, Zemi, Jene, Prahe, RusiNom
(2783; 61% of non-emptyCase
): Maja, Chris, Winston, Aladin, Mauglí, Jazmína, Vilko, Herkules, Abu, BushVoc
(24; 1% of non-emptyCase
): Winston, Baghíra, Džafar, Pane, Abubu, Ali, Bože, Jago, Ježiši, KerchakEMPTY
(261): J, SR, USA, EÚ, P, A, N, V, B, C
Paradigm winston | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Winston | Winstona | Winstonovi | Winstona | Winston | Winstonovi | Winstonom | |
Typo=Yes | Winton |
DET
4401 DET tokens (100% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Gender[psor]=EMPTY (3921; 89%), Number[psor]=EMPTY (3470; 79%), Person=EMPTY (3470; 79%), Number=Sing (3449; 78%), Poss=EMPTY (3144; 71%), Animacy=EMPTY (2880; 65%).
DET
tokens may have the following values of Case
:
Acc
(1152; 26% of non-emptyCase
): to, svoje, jeho, ten, jej, ktoré, ktorú, svoju, tú, všetkyDat
(163; 4% of non-emptyCase
): tomu, jeho, ktorému, svojmu, svojej, svojim, ich, tomuto, týmto, všetkýmGen
(588; 13% of non-emptyCase
): jeho, toho, tohto, ich, svojho, jej, ktorého, svojej, svojich, všetkýchIns
(234; 5% of non-emptyCase
): jeho, tým, svojím, jej, svojou, ktorými, ktorou, ktorým, mojím, akousiLoc
(420; 10% of non-emptyCase
): tom, jeho, tejto, tomto, svojom, tej, jej, ktorom, svojej, ktorýchNom
(1844; 42% of non-emptyCase
): to, jeho, ktoré, ktorý, ktorá, jej, ten, všetci, tá, tátoEMPTY
(3): ta, toľko
Paradigm to | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Number=Sing | to | to | tomu | toho | tom | tým |
Number=Sing|Typo=Yes | do | |||||
Number=Plur | tie | tie | Tým | tých | tých | tými |
PRON
3477 PRON tokens (54% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Reflex=EMPTY (3369; 97%), Number=Sing (2984; 86%), PronType=Prs (2862; 82%), Animacy=EMPTY (2452; 71%).
PRON
tokens may have the following values of Case
:
Acc
(1384; 40% of non-emptyCase
): ho, ma, ju, ich, čo, niečo, nič, mňa, ťa, nehoDat
(936; 27% of non-emptyCase
): mi, mu, jej, im, ti, mne, nám, vám, nemu, sebeGen
(197; 6% of non-emptyCase
): nich, neho, seba, nej, mňa, nás, ma, jej, ich, tebaIns
(184; 5% of non-emptyCase
): ním, mnou, ňou, nimi, sebou, tebou, nami, čím, niečím, vamiLoc
(132; 4% of non-emptyCase
): nej, ňom, sebe, mne, nich, čom, tebe, vás, kom, ničomNom
(644; 19% of non-emptyCase
): ja, čo, ty, kto, ona, nikto, on, niečo, nič, myEMPTY
(2958): sa, si, a, se, za
Paradigm ja | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Gender=Neut|Number=Sing | ono | |||||
Number=Sing | ja | ma, mňa | mi, mne | mňa, ma | mne | mnou |
Number=Plur | my | nás | nás |
NUM
621 NUM tokens (39% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=EMPTY (621; 100%), Animacy=EMPTY (363; 58%), Number=Sing (323; 52%).
NUM
tokens may have the following values of Case
:
Acc
(233; 38% of non-emptyCase
): dva, tri, dve, jeden, jednu, veľa, jedno, štyri, mnoho, zopárDat
(11; 2% of non-emptyCase
): trom, jednému, obom, mnohým, obidvom, piatim, siedmimGen
(89; 14% of non-emptyCase
): jedného, dvoch, jednej, miliónov, troch, obidvoch, oboch, viacerých, štyroch, desaťIns
(51; 8% of non-emptyCase
): jednou, jedným, štyrmi, dvoma, mnohými, troma, oboma, desiatimi, deviatimi, dvomiLoc
(47; 8% of non-emptyCase
): jednej, jednom, dvoch, oboch, mnohých, obidvoch, pol, troch, štyroch, desiatichNom
(190; 31% of non-emptyCase
): jeden, jedna, obaja, tri, veľa, dvaja, dve, štyri, dva, jednoEMPTY
(952): II, 1, 11, 2, I, 2004, 4, 20, 10, III
Paradigm jeden | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | jeden | jedného | jednému | jednom | jedným | |
Animacy=Inan|Gender=Masc|Number=Sing | jeden | jeden | jedného | jednom | jedným | |
Animacy=Inan|Gender=Masc|Number=Plur | jedny | |||||
Gender=Fem|Number=Sing | jedna | jednu | jednej | jednej | jednou | |
Gender=Neut|Number=Sing | jedno, jeden | jedno | jedného | jednom | jedným |
ADV
34 ADV tokens (1% of all ADV
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADV
and Case
co-occurred: Degree=EMPTY (34; 100%), PronType=EMPTY (34; 100%).
ADV
tokens may have the following values of Case
:
Acc
(27; 79% of non-emptyCase
): raz, razyGen
(2; 6% of non-emptyCase
): rázNom
(5; 15% of non-emptyCase
): razEMPTY
(4411): veľmi, potom, tu, tam, kde, tak, opäť, vtedy, ako, nikdy
Paradigm raz | Nom | Acc | Gen |
---|---|---|---|
Number=Sing | raz | raz | |
Number=Plur | razy | ráz |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (7695; 100%),
NOUN –[case]–> ADP (6607; 99%),
NOUN –[det]–> DET (2468; 100%),
NOUN –[conj]–> NOUN (1061; 98%),
PRON –[case]–> ADP (707; 100%),
PROPN –[case]–> ADP (705; 95%),
PROPN –[nmod]–> PROPN (432; 74%),
PROPN –[nmod]–> NOUN (324; 76%),
ADJ –[conj]–> ADJ (317; 100%),
ADJ –[nsubj]–> NOUN (288; 98%).