Treebank Statistics: UD_German-HDT: Features: Case
This feature is universal.
It occurs with 4 different values: Acc
, Dat
, Gen
, Nom
.
1120237 tokens (32%) have a non-empty value of Case
.
35564 types (19%) occur at least once with a non-empty value of Case
.
13775 lemmas (20%) occur at least once with a non-empty value of Case
.
The feature is used with 9 part-of-speech tags: DET (489411; 14% instances), ADP (345545; 10% instances), PRON (93577; 3% instances), NOUN (78735; 2% instances), PROPN (61547; 2% instances), ADJ (50239; 1% instances), ADV (1074; 0% instances), X (61; 0% instances), NUM (48; 0% instances).
DET
489411 DET tokens (99% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: PronType=Art (428867; 88%), NumType=EMPTY (419510; 86%), Number=Sing (393605; 80%), Definite=Def (359940; 74%).
DET
tokens may have the following values of Case
:
Acc
(129758; 27% of non-emptyCase
): die, den, das, eine, einen, ein, ihre, seine, keine, dieseDat
(152320; 31% of non-emptyCase
): dem, der, den, einem, einer, diesem, allem, anderem, seiner, anderenGen
(71957; 15% of non-emptyCase
): der, des, eines, einer, dieser, seiner, dieses, aller, ihrer, seinesNom
(135376; 28% of non-emptyCase
): die, der, das, ein, eine, diese, dies, alle, viele, keineEMPTY
(4956): andere, mehr, anderen, viel, all, keinerlei, einig, wenig, meisten, anderes
Paradigm der | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Gender=Masc,Neut|Number=Sing | dem | |||
Gender=Masc|Number=Sing | der | den, der | dem, des | des, der |
Gender=Fem|Number=Sing | die, der | die | der, die | der |
Gender=Neut|Number=Sing | das | das, 's | dem, das, des | des |
Number=Sing | die, der | die, den | der | |
Number=Plur | die, der | die, den | den, der, die | der |
ADP
345545 ADP tokens (90% of all ADP
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADP
and Case
co-occurred: AdpType=Prep (344347; 100%).
ADP
tokens may have the following values of Case
:
Acc
(85305; 25% of non-emptyCase
): für, auf, in, über, um, durch, an, gegen, ohne, unterDat
(257485; 75% of non-emptyCase
): in, von, mit, zu, bei, an, nach, auf, aus, vorGen
(2424; 1% of non-emptyCase
): angesichts, aufgrund, wegen, außerhalb, anhand, innerhalb, trotz, hinsichtlich, während, zugunstenNom
(331; 0% of non-emptyCase
): namens, vollerEMPTY
(40179): für, bis, an, aus, vor, per, ab, ein, auf, wegen
Paradigm in | Acc | Dat | Gen |
---|---|---|---|
_ | in | ||
AdpType=Prep | in | in | in |
PRON
93577 PRON tokens (99% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Reflex=EMPTY (72457; 77%), PronType=Prs (54176; 58%), Number=Sing (53222; 57%), Gender=EMPTY (50701; 54%), Person=3 (48743; 52%).
PRON
tokens may have the following values of Case
:
Acc
(25216; 27% of non-emptyCase
): sich, die, das, sie, es, den, was, ihn, uns, michDat
(8854; 9% of non-emptyCase
): sich, dem, denen, der, ihm, ihnen, uns, mir, ihr, wemGen
(1624; 2% of non-emptyCase
): deren, dessen, derer, der, jedermannsNom
(57883; 62% of non-emptyCase
): es, die, man, sie, er, das, der, wir, was, werEMPTY
(1270): nichts, etwas, sich, nix, irgendetwas, irgendjemand, was, irgendwas, E-irgendwas, einander
Paradigm der | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Abbr=Yes|Gender=Neut|Number=Sing | d. | |||
Gender=Masc|Number=Sing | der | den | dem | dessen |
Gender=Fem|Number=Sing | die | die | der | derer, Deren |
Gender=Neut|Number=Sing | das | das | dem | dessen |
Gender=Neut|Number=Sing|Typo=Yes | da | |||
Number=Sing | das | dessen | ||
Number=Plur | die | die | denen | derer, der |
deren |
NOUN
78735 NOUN tokens (11% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (43268; 55%).
NOUN
tokens may have the following values of Case
:
Acc
(7013; 9% of non-emptyCase
): Internet, Mark, Server, Ende, US-Dollar, Markt, Kunden, Version, Zugang, AnfangDat
(38585; 49% of non-emptyCase
): Jahren, Monaten, Tagen, Ländern, Mitarbeitern, Kunden, Geräten, Computern, Bereichen, InternetGen
(24378; 31% of non-emptyCase
): Jahres, Unternehmens, Konzerns, Geschäftsjahres, Systems, Herstellers, Vorjahres, Marktes, Netzes, QuartalsNom
(8759; 11% of non-emptyCase
): Internet, Name, Vorsitzende, Vorsitzender, Riese, Vorstandsvorsitzender, Unternehmen, Vorstandsvorsitzende, Server, E-MailEMPTY
(650366): Prozent, Millionen, Internet, Unternehmen, Mark, US-Dollar, Milliarden, Jahr, Firma, Euro
Paradigm Jahr | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Number=Sing | Boomjahr | Jahr | Jahre, Jahr, Finanzjahr | Jahres, Jahrs, Finanzjahres, Startup-Jahres, Verkaufsjahres |
Number=Plur | Jahre | Jahre | Jahren, 70er-Jahren, 50-er-Jahren, 50er-Jahren, 80er-Jahren, 90er-Jahren, Achtzigerjahren, Anfangsjahren, Boom-Jahren, Folgejahren, Internet-Jahren, Neunzigerjahren, Startjahren, Wachstumsjahren | Jahre, 80er-Jahre |
PROPN
61547 PROPN tokens (32% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Gender=EMPTY (58875; 96%), Number=Sing (58722; 95%).
PROPN
tokens may have the following values of Case
:
Acc
(5246; 9% of non-emptyCase
): Microsoft, AOL, Intel, Napster, Java, Palm, IBM, Apple, OS/2, MacDat
(15114; 25% of non-emptyCase
): Microsoft, heise, AOL, Intel, IBM, Napster, Apple, Frankreich, Telepolis, NetscapeGen
(6888; 11% of non-emptyCase
): Microsofts, Intels, Apples, AMDs, Deutschlands, Europas, ICANNs, Suns, IBMs, SonysNom
(34299; 56% of non-emptyCase
): Microsoft, Intel, AOL, IBM, Apple, Napster, Compaq, Siemens, Sony, GatesEMPTY
(132392): Telekom, Deutschland, USA, c’t, Europa, Linux, Windows, telepolis, online, Sun
Paradigm Telekom | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Telekom | Telekom | Telekom | Telekom |
ADJ
50239 ADJ tokens (19% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Variant=EMPTY (50235; 100%), Degree=Pos (42444; 84%), Number=Sing (27575; 55%).
ADJ
tokens may have the following values of Case
:
Acc
(11273; 22% of non-emptyCase
): neuen, ersten, großen, eigenen, weiteren, deutschen, wenige, beiden, größten, solcheDat
(20108; 40% of non-emptyCase
): eigenen, neuen, ersten, nächsten, letzten, wenigen, deutschen, verschiedenen, vergangenen, weiterenGen
(6079; 12% of non-emptyCase
): neuer, beiden, letzten, nächsten, vergangenen, deutscher, weiterer, verschiedener, großer, solchenNom
(12779; 25% of non-emptyCase
): beiden, neue, neuer, deutsche, größte, erste, erster, amerikanische, japanische, weitererEMPTY
(212372): neue, neuen, deutschen, ersten, deutsche, weitere, erste, möglich, gut, ganz
Paradigm neu | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Degree=Pos|Gender=Masc|Number=Sing | neue, neuer | neuen | neuen | |
Degree=Pos|Gender=Masc|Number=Plur | neuen | neuen | neuen | neuen, neuer |
Degree=Pos|Gender=Fem|Number=Sing | neuen, neuer | |||
Degree=Pos|Gender=Fem|Number=Plur | neuen | neuen | neuen | neuer, neuen |
Degree=Pos|Gender=Neut|Number=Sing | neues | neuen | ||
Degree=Pos|Gender=Neut|Number=Plur | neuen | neuen | neuen | neuer, neuen |
Degree=Pos|Number=Sing | neuem, neuen | neuen | ||
Degree=Pos|Number=Plur | neuen, neue | neuen | neuen | neuer, neuen |
Degree=Cmp|Gender=Masc|Number=Sing | neuere, neuerer | neueren | ||
Degree=Cmp|Gender=Masc|Number=Plur | neueren | neueren | ||
Degree=Cmp|Gender=Fem|Number=Plur | neueren | |||
Degree=Cmp|Number=Sing | neueren | |||
Degree=Cmp|Number=Plur | neueren | |||
Degree=Sup|Gender=Masc|Number=Sing | neueste, neuester, neuste | neuesten | ||
Degree=Sup|Gender=Masc|Number=Plur | neuesten | |||
Degree=Sup|Gender=Fem|Number=Sing | neuesten | |||
Degree=Sup|Gender=Fem|Number=Plur | neuesten, neusten | neuesten | ||
Degree=Sup|Gender=Neut|Number=Plur | neuesten | neuesten, neusten | ||
Degree=Sup|Number=Sing | neuestem, neuesten | |||
Degree=Sup|Number=Plur | neuesten | neuester |
ADV
1074 ADV tokens (1% of all ADV
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADV
and Case
co-occurred: PronType=Ind (1074; 100%).
ADV
tokens may have the following values of Case
:
Acc
(376; 35% of non-emptyCase
): mehrere, meistenDat
(356; 33% of non-emptyCase
): mehreren, meisten, mehr, wenigerGen
(69; 6% of non-emptyCase
): mehrerer, wenigerNom
(273; 25% of non-emptyCase
): mehrere, meistenEMPTY
(195520): auch, noch, nur, so, aber, mehr, bereits, allerdings, damit, schon
Paradigm mehr | Nom | Acc | Dat | Gen |
---|---|---|---|---|
Number=Plur | mehrere | mehrere | mehreren | mehrerer |
mehr |
X
61 X tokens (0% of all X
tokens) have a non-empty value of Case
.
The most frequent other feature values with which X
and Case
co-occurred: Foreign=Yes (61; 100%).
X
tokens may have the following values of Case
:
Acc
(1; 2% of non-emptyCase
): InternetbankingDat
(54; 89% of non-emptyCase
): Internet, World, Baby, France, Instant, Open, Vice, endlich, .web-Domain, AbstractNom
(6; 10% of non-emptyCase
): AID, Anti-Spam-Petition, Digital, Push, Telekom-Mitarbeiter, dmmvEMPTY
(53630): of, internet, the, and, digital, mobile, media, for, OS, network
Paradigm Digital | Nom | Dat |
---|---|---|
Digital | Digital |
Case
seems to be lexical feature of X
. 98% lemmas (49) occur only with one value of Case
.
NUM
48 NUM tokens (0% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (48; 100%), Number=Sing (26; 54%).
NUM
tokens may have the following values of Case
:
Acc
(11; 23% of non-emptyCase
): eine, ein, einenDat
(25; 52% of non-emptyCase
): einer, einem, drei, dreien, 1394, 15.000, 300, 4, 86a, AchtGen
(8; 17% of non-emptyCase
): zweier, TausenderNom
(4; 8% of non-emptyCase
): eine, ein, einsEMPTY
(71260): zwei, 2000, drei, 2001, 1999, vier, fünf, 20, 100, 30
Paradigm ein | Nom | Acc | Dat |
---|---|---|---|
Gender=Masc | einen | einem | |
Gender=Fem | eine | eine | einer |
Gender=Neut | ein | ein | einem |
Case
seems to be lexical feature of NUM
. 93% lemmas (14) occur only with one value of Case
.
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
PRON –[case]–> ADP (5703; 96%),
DET –[case]–> ADP (4574; 97%),
ADJ –[conj]–> ADJ (450; 75%),
DET –[det]–> DET (357; 58%),
DET –[conj]–> DET (47; 55%),
PRON –[appos]–> DET (45; 92%),
PRON –[conj]–> PRON (43; 93%),
ADP –[fixed]–> DET (37; 97%),
PRON –[nsubj]–> PRON (31; 79%),
NOUN –[amod]–> NOUN (22; 65%).