Treebank Statistics: UD_Polish-PDB: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
157134 tokens (45%) have a non-empty value of Case
.
49747 types (82%) occur at least once with a non-empty value of Case
.
23630 lemmas (85%) occur at least once with a non-empty value of Case
.
The feature is used with 7 part-of-speech tags: NOUN (87150; 25% instances), ADJ (35595; 10% instances), PROPN (11729; 3% instances), PRON (10610; 3% instances), DET (9348; 3% instances), NUM (2633; 1% instances), ADP (69; 0% instances).
NOUN
87150 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (63031; 72%), Animacy=EMPTY (48329; 55%).
NOUN
tokens may have the following values of Case
:
Acc
(16774; 19% of non-emptyCase
): sposób, raz, temat, czas, życie, pieniądze, uwagę, dzień, stronę, ręceDat
(1214; 1% of non-emptyCase
): panu, ludziom, komisji, dzieciom, osobom, pani, państwu, życiu, mężczyźnie, dziennikarzomGen
(29803; 34% of non-emptyCase
): lat, osób, roku, pracy, ludzi, dnia, dzieci, czasu, wody, życiaIns
(7353; 8% of non-emptyCase
): wodą, głową, razem, zdaniem, czasem, ręką, pomocą, względem, rękami, celemLoc
(12914; 15% of non-emptyCase
): roku, sprawie, wodzie, stroju, czasie, trawie, pobliżu, przypadku, kasku, celuNom
(18881; 22% of non-emptyCase
): mężczyzna, pan, kobieta, człowiek, chłopiec, dziewczynka, pani, ludzie, pies, osobyVoc
(211; 0% of non-emptyCase
): panie, pośle, marszałku, pani, kochanie, tato, mamo, ministrze, panowie, profesorzeEMPTY
(1484): r, zł, art, tys, proc, ust, %, ul, godz, mln
Paradigm człowiek | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Number=Sing | człowiek, cztowiek | człowieka | człowiekowi | człowieka | człowieku | człowieku | człowiekiem |
Number=Plur | ludzie | ludzi | ludziom | ludzi | ludzie | ludziach | ludźmi |
Number=Ptan | ludzi |
ADJ
35595 ADJ tokens (99% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Aspect=EMPTY (28831; 81%), Polarity=EMPTY (28831; 81%), VerbForm=EMPTY (28831; 81%), Voice=EMPTY (28831; 81%), Degree=Pos (27510; 77%), Number=Sing (24045; 68%), Animacy=EMPTY (19389; 54%).
ADJ
tokens may have the following values of Case
:
Acc
(6081; 17% of non-emptyCase
): cały, pierwszy, inne, dotyczące, pierwsze, całą, drugą, nowe, jedną, drugieDat
(512; 1% of non-emptyCase
): prostu, innym, angielsku, drugiemu, pijanemu, własnym, młodemu, młodym, całej, cichuGen
(10580; 30% of non-emptyCase
): innych, europejskiej, nowych, różnych, nowego, drugiej, jednego, polskiej, polskiego, dotyczącychIns
(2856; 8% of non-emptyCase
): jednym, innymi, samym, jedną, wielkim, dużym, drugim, długimi, Europejską, dużąLoc
(4487; 13% of non-emptyCase
): czerwonej, jednym, sportowym, jednej, samym, czarnym, całym, innych, czerwonym, białejNom
(11059; 31% of non-emptyCase
): jeden, sam, jedna, inne, mały, drugi, pierwszy, sama, europejska, członkowskieVoc
(20; 0% of non-emptyCase
): droga, szanowny, głupi, młody, Drodzy, Nowy, Wspaniaty, Wysoki, dobrzy, dużyEMPTY
(333): czarno, św, biało, polsko, czerwono, południowo, żółto, brązowo, gotów, budowlano
Paradigm duży | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Hum|Degree=Pos|Gender=Masc|Number=Sing | duży | dużego | dużego | duży | |||
Animacy=Hum|Degree=Sup|Gender=Masc|Number=Sing | Największy | największego | |||||
Animacy=Hum|Degree=Sup|Gender=Masc|Number=Plur | najwięksi | ||||||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Sing | duży | duży | dużego | dużym | dużym | ||
Animacy=Inan|Degree=Pos|Gender=Masc|Number=Plur | duże | duże, większe | dużych | dużych | |||
Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Sing | większy | większy | większemu | większego | większym | większym | |
Animacy=Inan|Degree=Cmp|Gender=Masc|Number=Plur | większe | większe | większych | ||||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Sing | największy | największego | największym | największym | |||
Animacy=Inan|Degree=Sup|Gender=Masc|Number=Plur | największe | ||||||
Animacy=Nhum|Degree=Pos|Gender=Masc|Number=Sing | duży | dużego | dużym | ||||
Animacy=Nhum|Degree=Pos|Gender=Masc|Number=Plur | duże | dużych | |||||
Animacy=Nhum|Degree=Cmp|Gender=Masc|Number=Plur | większe | ||||||
Animacy=Nhum|Degree=Sup|Gender=Masc|Number=Sing | największego | ||||||
Animacy=Nhum|Degree=Sup|Gender=Masc|Number=Plur | największe | ||||||
Degree=Pos|Gender=Fem|Number=Sing | duża | dużą | dużej | dużej | dużej | dużą | |
Degree=Pos|Gender=Fem|Number=Plur | duże | duże | dużych | dużych | |||
Degree=Pos|Gender=Neut|Number=Sing | duże | duże | dużego | dużym | Dużym | ||
Degree=Pos|Gender=Neut|Number=Plur | duże | dużych | dużych | dużymi | |||
Degree=Cmp|Gender=Fem|Number=Sing | większa | większą | większej | większej | większej | większą | |
Degree=Cmp|Gender=Fem|Number=Plur | większe | większe | większych | większych | |||
Degree=Cmp|Gender=Neut|Number=Sing | większe | większe | większego | większym | większym | ||
Degree=Cmp|Gender=Neut|Number=Plur | większych | ||||||
Degree=Sup|Gender=Fem|Number=Sing | największa | największą | największej | największej | największą | ||
Degree=Sup|Gender=Fem|Number=Plur | największe | największe | największych | ||||
Degree=Sup|Gender=Neut|Number=Sing | największe | największym | największym | ||||
Degree=Sup|Gender=Neut|Number=Plur | największe | Największe | największych |
PROPN
11729 PROPN tokens (98% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (11002; 94%), Gender=Masc (7283; 62%).
PROPN
tokens may have the following values of Case
:
Acc
(754; 6% of non-emptyCase
): Europę, Polskę, Polaków, Rosję, Adama, Amerykę, Boga, Jana, Piotra, WarszawęDat
(234; 2% of non-emptyCase
): Bogu, Jerzemu, Marcie, Andrzejowi, Europie, Niemcom, Łukaszence, Anglikom, Buzkowi, DżabieGen
(3469; 30% of non-emptyCase
): Polski, Europy, UE, Warszawy, SLD, AWS, Polaków, Rosji, Stanów, USAIns
(402; 3% of non-emptyCase
): Andrzejem, Niemcami, Polską, Republiką, Rosją, Stanami, Ukrainą, Wisłą, Aleksandrem, BogiemLoc
(1266; 11% of non-emptyCase
): Polsce, Europie, Warszawie, Poznaniu, Krakowie, Niemczech, Wrocławiu, Włoszech, Ameryce, ŁodziNom
(5540; 47% of non-emptyCase
): Andrzej, Polska, Jerzy, Marek, Piotr, Jan, Polacy, Krzysztof, Jacek, JanuszVoc
(64; 1% of non-emptyCase
): Boże, Panie, Jacku, Piotrze, Alicjo, Arturze, Basiu, Bello, Benedykcie, CzarnyEMPTY
(271): K, S, A, M, J, b, c, H, G, P
Paradigm Polska | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Polska | Polskę | Polsce | Polski | Polsko | Polsce | Polską |
PRON
10610 PRON tokens (64% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Reflex=EMPTY (9871; 93%), Number=Sing (7943; 75%), PronType=Prs (6781; 64%), PrepCase=EMPTY (6478; 61%), Animacy=EMPTY (5770; 54%), Variant=EMPTY (5479; 52%).
PRON
tokens may have the following values of Case
:
Acc
(2679; 25% of non-emptyCase
): to, go, co, mnie, ją, je, coś, nas, siebie, cięDat
(1628; 15% of non-emptyCase
): mi, sobie, mu, nam, im, ci, jej, temu, wam, komuGen
(2622; 25% of non-emptyCase
): jego, ich, jej, tego, siebie, nich, mnie, niego, nas, nicIns
(721; 7% of non-emptyCase
): tym, sobą, nim, nimi, wszystkim, nią, czym, kim, mną, namiLoc
(594; 6% of non-emptyCase
): tym, nim, czym, nich, niej, sobie, mnie, wszystkim, czymś, niczymNom
(2364; 22% of non-emptyCase
): to, co, ja, on, kto, ona, ktoś, wszystko, nikt, oneVoc
(2; 0% of non-emptyCase
): tyEMPTY
(5876): się, sie, sia
Paradigm ty | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Hum|Gender=Masc | ty | ty | tobie | tobą | |||
Animacy=Hum|Gender=Masc|Variant=Long | ciebie | tobie | ciebie | ||||
Animacy=Hum|Gender=Masc|Variant=Short | cię | ci | cię | ||||
Animacy=Nhum|Gender=Masc | ty | ty | |||||
Gender=Fem | ty | tobie | tobą | ||||
Gender=Fem|Variant=Long | ciebie | ciebie | |||||
Gender=Fem|Variant=Short | cię | ci | cię |
DET
9348 DET tokens (100% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number[psor]=EMPTY (8406; 90%), Person=EMPTY (8406; 90%), Poss=EMPTY (7636; 82%), Number=Sing (5489; 59%), Animacy=EMPTY (4680; 50%).
DET
tokens may have the following values of Case
:
Acc
(2304; 25% of non-emptyCase
): ten, te, swoje, które, kilka, tę, swoją, wiele, swój, toDat
(178; 2% of non-emptyCase
): którym, któremu, swoim, tym, temu, tej, naszym, swojemu, wszystkim, każdemuGen
(2070; 22% of non-emptyCase
): tego, tych, tej, których, którego, takich, wszystkich, swoich, takiego, naszychIns
(506; 5% of non-emptyCase
): tym, moim, swoim, tą, którym, każdym, którą, którymi, naszym, jakimLoc
(1227; 13% of non-emptyCase
): tym, tej, którym, których, której, tych, swoim, każdym, naszym, takichNom
(3055; 33% of non-emptyCase
): który, które, która, którzy, ten, ta, te, to, takie, każdyVoc
(8; 0% of non-emptyCase
): moja, mój, moje, nasz
Paradigm nasz | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Animacy=Hum|Gender=Masc|Number=Sing | nasz | Naszego | naszego | nasz | naszym | ||
Animacy=Hum|Gender=Masc|Number=Plur | nasi | naszych | naszym | naszych | naszymi | ||
Animacy=Inan|Gender=Masc|Number=Sing | nasz | nasz | naszemu | naszego | naszym | naszym | |
Animacy=Inan|Gender=Masc|Number=Plur | nasze | nasze | naszym | naszych | naszych | naszymi | |
Animacy=Nhum|Gender=Masc|Number=Sing | nasz | ||||||
Animacy=Nhum|Gender=Masc|Number=Plur | nasze | naszych | |||||
Gender=Fem|Number=Sing | nasza | naszą | naszej | naszej | naszej | naszą | |
Gender=Fem|Number=Plur | nasze | nasze | naszym | naszych | naszych | naszymi | |
Gender=Neut|Number=Sing | nasze | nasze | naszemu | naszego | naszym | naszym | |
Gender=Neut|Number=Plur | nasze | nasze | naszym | naszych | naszych |
NUM
2633 NUM tokens (100% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: Number=Plur (2575; 98%), Gender=Masc (1853; 70%), NumForm=Word (1355; 51%), Animacy=Inan (1332; 51%).
NUM
tokens may have the following values of Case
:
Acc
(993; 38% of non-emptyCase
): dwa, trzy, 10, dwie, 2, 3, pół, pięć, cztery, 5Dat
(16; 1% of non-emptyCase
): dwóm, czterem, 2,3, 20, 260, 400, 43, 60, 80, 90Gen
(500; 19% of non-emptyCase
): dwóch, trzech, pięciu, 10, czterech, 2, 3, dziesięciu, 5, 12Ins
(63; 2% of non-emptyCase
): dwoma, trzema, dwiema, 3, 4, dwudziestu, pięcioma, 10, 1080, 128Loc
(119; 5% of non-emptyCase
): dwóch, trzech, czterech, 10, 20, dziesięciu, 50, dwudziestu, pięciu, 15Nom
(942; 36% of non-emptyCase
): dwie, dwa, dwóch, trzy, cztery, dwaj, dwoje, pięć, trzech, czterech
Paradigm dwa | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Hum|Gender=Masc | dwóch, dwaj | dwóch, dwu | dwóm | dwóch | dwoma | |
Animacy=Hum|Gender=Masc|NumType=Sets | dwoje | |||||
Animacy=Inan|Gender=Masc | dwa | dwa | dwóch, dwu | dwóch, dwu | dwoma | |
Animacy=Nhum|Gender=Masc | dwa | dwa | dwóch | dwoma | ||
Gender=Fem | dwie | dwie | dwóm | dwóch | dwóch, dwu | dwiema, dwoma |
Gender=Neut | dwa | dwa | dwóch, dwu | |||
Gender=Neut|NumType=Sets | dwoje | dwoje | dwojgiem |
ADP
69 ADP tokens (0% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Post (69; 100%), Variant=EMPTY (69; 100%).
ADP
tokens may have the following values of Case
:
Acc
(69; 100% of non-emptyCase
): temuEMPTY
(37092): w, na, z, do, o, po, za, od, przez, dla
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (21660; 98%),
NOUN –[conj]–> NOUN (5359; 96%),
NOUN –[acl]–> ADJ (4544; 99%),
NOUN –[det]–> DET (3917; 98%),
PROPN –[flat]–> PROPN (1748; 90%),
NOUN –[det:poss]–> DET (1659; 99%),
ADJ –[conj]–> ADJ (1456; 84%),
NOUN –[amod:flat]–> ADJ (1139; 79%),
NOUN –[nummod]–> NUM (1122; 86%),
NOUN –[appos]–> PROPN (946; 78%).