Treebank Statistics: UD_German-GSD: Features: Case
This feature is universal.
It occurs with 4 different values: Acc
, Dat
, Gen
, Nom
.
145039 tokens (50%) have a non-empty value of Case
.
41612 types (82%) occur at least once with a non-empty value of Case
.
35721 lemmas (85%) occur at least once with a non-empty value of Case
.
The feature is used with 10 part-of-speech tags: NOUN (51402; 18% instances), DET (40925; 14% instances), PROPN (27265; 9% instances), ADJ (14532; 5% instances), PRON (10633; 4% instances), NUM (112; 0% instances), X (94; 0% instances), ADV (61; 0% instances), SYM (10; 0% instances), ADP (5; 0% instances).
NOUN
51402 NOUN tokens (98% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (36888; 72%).
NOUN
tokens may have the following values of Case
:
Acc
(12933; 25% of non-emptyCase
): Jahre, Zeit, Ende, jahr, Platz, Anfang, %, Meter, tage, RolleDat
(16975; 33% of non-emptyCase
): Jahr, Jahren, Zeit, Jahre, Saison, Ende, Stadt, Familie, Teil, OrtGen
(5781; 11% of non-emptyCase
): Stadt, Jahre, Jahres, Zeit, Landes, Gemeinde, Familie, Bevölkerung, Vaters, SaisonNom
(15713; 31% of non-emptyCase
): Teil, Sohn, Mitglied, Stadt, Menschen, Ort, Gemeinde, Frau, Unternehmen, PräsidentEMPTY
(895): Prozent, Jahrhundert, mm, Mark, °, m, mal, ², ‘, Wohn
Paradigm Jahr | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Gender=Masc|Number=Sing | Jahrs | |||
Gender=Neut|Number=Sing | Jahr | jahr, Jahre | Jahr, Jahre | Jahres |
Gender=Neut|Number=Plur | Jahre | Jahre, Jahren | Jahren | Jahre, Jahren |
DET
40925 DET tokens (99% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: NumType=EMPTY (35280; 86%), PronType=Art (34777; 85%), Number=Sing (34009; 83%), Definite=Def (29311; 72%).
DET
tokens may have the following values of Case
:
Acc
(8795; 21% of non-emptyCase
): die, den, eine, das, einen, ein, seine, ihre, diese, keineDat
(14142; 35% of non-emptyCase
): dem, der, den, einem, einer, diesem, seiner, seinem, dieser, anderenGen
(6381; 16% of non-emptyCase
): der, des, eines, einer, seiner, dieser, seines, ihrer, aller, diesesNom
(11607; 28% of non-emptyCase
): die, der, das, ein, eine, diese, sein, seine, dies, dieserEMPTY
(281): the, mehr, viel, wenig, weniger, selber, all, keinerlei, ein, einig
Paradigm der | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Gender=Masc|Number=Sing | der | den | dem, der, des | des |
Gender=Fem|Number=Sing | die | die | der, die | der |
Gender=Neut|Number=Sing | das | das, 's | dem, das, des | des, der |
Number=Sing | dem | der | ||
Number=Plur | die, Des | die, den | den, der, die | der |
PROPN
27265 PROPN tokens (90% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (25793; 95%).
PROPN
tokens may have the following values of Case
:
Acc
(2850; 10% of non-emptyCase
): US, USA, Euro, Deutschland, Mai, Oktober, Award, März, Cup, DeutscheDat
(10849; 40% of non-emptyCase
): Deutschland, Berlin, Frankreich, Oktober, Weltkrieg, München, New, Paris, Mai, NovemberGen
(3712; 14% of non-emptyCase
): Deutschen, US, Deutschlands, Europäischen, Weltkrieges, St., Weltkriegs, Frankreichs, Union, GesellschaftNom
(9854; 36% of non-emptyCase
): SPD, US, Hans, Peter, Paul, Deutschland, Johann, Juli, Wilhelm, KarlEMPTY
(3154): of, de, a, la, University, II, 1, Mark, B, Berliner
Paradigm Deutschland | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Gender=Masc | Deutschland | |||
Gender=Fem | Deutschland | |||
Gender=Neut | Deutschland | Deutschland | Deutschland | Deutschlands, Deutschland |
ADJ
14532 ADJ tokens (67% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Degree=Pos (13422; 92%), Number=Sing (9930; 68%).
ADJ
tokens may have the following values of Case
:
Acc
(3802; 26% of non-emptyCase
): neue, große, weitere, erste, gute, verschiedene, eigene, ersten, zahlreiche, neuenDat
(4631; 32% of non-emptyCase
): ersten, zweiten, weiteren, großen, neuen, verschiedenen, letzten, deutschen, gleichen, heutigenGen
(1791; 12% of non-emptyCase
): ersten, deutschen, zweiten, ehemaligen, neuen, großen, französischen, heutigen, amerikanischen, bestenNom
(4308; 30% of non-emptyCase
): erste, weitere, neue, deutsche, große, kleine, gute, letzte, zahlreiche, zweiteEMPTY
(7207): später, gut, bekannt, freundlich, schnell, kurz, lang, neu, möglich, super
Paradigm erst | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Degree=Pos|Gender=Masc|Number=Sing | erste, erster | ersten | ersten | ersten |
Degree=Pos|Gender=Masc|Number=Plur | ersten, erste | ersten, erste | ersten | ersten |
Degree=Pos|Gender=Fem|Number=Sing | erste | erste | ersten, erster | ersten |
Degree=Pos|Gender=Fem|Number=Plur | ersten, erste | erste, ersten | ersten | ersten |
Degree=Pos|Gender=Neut|Number=Sing | erste, erstes | erste, erstes | ersten | ersten |
Degree=Pos|Gender=Neut|Number=Plur | ersten, Erste | erste, ersten | ersten | ersten |
Degree=Pos|Number=Plur | ersten | |||
Degree=Cmp|Number=Plur | erstere |
PRON
10633 PRON tokens (98% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Reflex=EMPTY (8937; 84%), PronType=Prs (7594; 71%), Number=Sing (7329; 69%), Person=3 (6256; 59%).
PRON
tokens may have the following values of Case
:
Acc
(2232; 21% of non-emptyCase
): sich, ihn, die, es, mich, sie, das, was, uns, denDat
(1027; 10% of non-emptyCase
): ihm, sich, dem, mir, der, denen, ihnen, uns, ihr, denGen
(204; 2% of non-emptyCase
): deren, dessen, der, derer, my, IchNom
(7170; 67% of non-emptyCase
): er, sie, es, die, ich, man, der, wir, das, wasEMPTY
(212): es, nichts, etwas, was, it, You, nix, All, She, We
Paradigm der | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Gender=Masc|Number=Sing | der, die | den, der | dem, der | dessen |
Gender=Fem|Number=Sing | die | die | der | deren, der, derer |
Gender=Neut|Number=Sing | das, die | das | dem, Das | dessen |
Number=Sing | dem | dessen | ||
Number=Plur | die | die | denen, den, dem, die | deren, derer |
NUM
112 NUM tokens (2% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (112; 100%).
NUM
tokens may have the following values of Case
:
Acc
(25; 22% of non-emptyCase
): 15, 3, Millionen, ², 0:2, 10, 100, 1834-1911, 1:30200000, 2Dat
(42; 38% of non-emptyCase
): 1:1, 8, Millionen, ², +7,6, -10, -2288,9, -60, 0:3, 1Gen
(11; 10% of non-emptyCase
): zweier, 7, 1846-1925, 35, 50, Mio, dreierNom
(34; 30% of non-emptyCase
): 10, Millionen, 20, 28, 35, 6, -9, 1, 1.681.469, 1000EMPTY
(7225): zwei, drei, vier, 2007, 2006, fünf, 2009, 2010, sechs, 2008
Paradigm 2 | Nom | Acc | Dat |
---|---|---|---|
Gender=Masc | 2 | ||
Gender=Fem | 2 | ||
Gender=Neut | 2 |
X
94 X tokens (30% of all X
tokens) have a non-empty value of Case
.
The most frequent other feature values with which X
and Case
co-occurred: Foreign=EMPTY (94; 100%), Number=Sing (75; 80%).
X
tokens may have the following values of Case
:
Acc
(12; 13% of non-emptyCase
): %, €, E, S, inkl, postDat
(33; 35% of non-emptyCase
): B., %, Chr, Abs, #, 4Jahren, A, B, E, FeGen
(5; 5% of non-emptyCase
): C, Hl, La, Mio, stNom
(44; 47% of non-emptyCase
): B., :-), S., tunga, u, usw, %, :), ???????, ???a?EMPTY
(219): ’s, u.a., etc., z.B., z., a, †, z, *, u
Paradigm % | Nom | Acc | Dat |
---|---|---|---|
% | % | % |
Case
seems to be lexical feature of X
. 90% lemmas (55) occur only with one value of Case
.
ADV
61 ADV tokens (0% of all ADV
tokens) have a non-empty value of Case
.
ADV
tokens may have the following values of Case
:
Acc
(27; 44% of non-emptyCase
): was, ca, EINFACH, How, Katzelmacher, Kehrt, Mal, NIEMALS, NOCH, RevueDat
(11; 18% of non-emptyCase
): anderem, ca, Anfangs, Dort, Ex, Křižanov, PMMA, meisten, vorallemGen
(4; 7% of non-emptyCase
): Abends, NIE, Zügig, längererNom
(19; 31% of non-emptyCase
): SEHR, super, Allzeit, ECHT, Gottlob, Nahe, Rääts, Vorallem, aka, bissschenEMPTY
(13823): auch, nur, noch, sehr, so, dort, wieder, hier, mehr, heute
Paradigm ca | Acc | Dat |
---|---|---|
Gender=Fem | ca | |
Gender=Neut | ca | ca |
Case
seems to be lexical feature of ADV
. 94% lemmas (47) occur only with one value of Case
.
SYM
10 SYM tokens (10% of all SYM
tokens) have a non-empty value of Case
.
SYM
tokens may have the following values of Case
:
Acc
(2; 20% of non-emptyCase
): %Dat
(3; 30% of non-emptyCase
): °, ·Nom
(5; 50% of non-emptyCase
): %, :-), o, ×EMPTY
(90): &, =, /, +, ×, *, €, “, -, :-)
Paradigm % | Nom | Acc |
---|---|---|
% | % |
ADP
5 ADP tokens (0% of all ADP
tokens) have a non-empty value of Case
.
ADP
tokens may have the following values of Case
:
Dat
(5; 100% of non-emptyCase
): zufolge, nachEMPTY
(32100): in, von, mit, zu, an, auf, für, als, nach, bei
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[det]–> DET (30269; 97%),
NOUN –[amod]–> ADJ (12335; 93%),
PROPN –[det]–> DET (5215; 92%),
PROPN –[flat]–> PROPN (5127; 87%),
NOUN –[conj]–> NOUN (3055; 74%),
NOUN –[appos]–> PROPN (2470; 77%),
NOUN –[det:poss]–> DET (2217; 96%),
PROPN –[conj]–> PROPN (1562; 74%),
PROPN –[amod]–> PROPN (1222; 85%),
PROPN –[appos]–> PROPN (1125; 66%).