Treebank Statistics: UD_German: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
Some words have combined values of the feature; 1 combinations have been observed: Masc|Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
65616 tokens (22%) have a non-empty value of Gender
.
16530 types (33%) occur at least once with a non-empty value of Gender
.
14421 lemmas (34%) occur at least once with a non-empty value of Gender
.
The feature is used with 11 part-of-speech tags: DET (24385; 8% instances), NOUN (24295; 8% instances), ADJ (6577; 2% instances), PRON (5571; 2% instances), PROPN (4750; 2% instances), NUM (29; 0% instances), VERB (4; 0% instances), ADP (2; 0% instances), ADV (1; 0% instances), SCONJ (1; 0% instances), X (1; 0% instances).
DET
24385 DET tokens (67% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: PronType=Art (24238; 99%), Number=Sing (23888; 98%), Definite=Def (20522; 84%).
DET
tokens may have the following values of Gender
:
Fem
(10173; 42% of non-emptyGender
): die, der, eine, einer, den, dessen, diese, jener, dem, alleMasc
(3472; 14% of non-emptyGender
): der, den, einen, dessen, die, Das, deinen, dieser, jenerMasc,Neut
(8712; 36% of non-emptyGender
): dem, des, ein, einem, eines, diesem, einsNeut
(2028; 8% of non-emptyGender
): das, die, den, der, dem, dessen, Dieses, einigeEMPTY
(11848): der, die, den, ein, dem, eine, seine, das, seiner, sein
Paradigm der | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Case=Acc|Definite=Def|Number=Sing|PronType=Art | den | dem | die, der | das, dem |
Case=Acc|Definite=Def|Number=Plur|PronType=Art | die, den | die, den | die, den | |
Case=Acc|Number=Sing|PronType=Dem | dessen, den | die | das | |
Case=Acc|Number=Sing|PronType=Rel | dessen, den | die | das | |
Case=Acc|Number=Plur|PronType=Dem | das | |||
Case=Dat|Definite=Def|Number=Sing|PronType=Art | dem | der, dem, den, die | ||
Case=Dat|Definite=Def|Number=Plur|PronType=Art | den | den | den | |
Case=Dat|Number=Sing|PronType=Dem | dem | derer | ||
Case=Dat|Number=Sing|PronType=Rel | dem | der | ||
Case=Dat|Number=Plur|PronType=Dem | dessen | dessen | ||
Case=Dat|Number=Plur|PronType=Rel | dessen | |||
Case=Gen|Definite=Def|Number=Sing|PronType=Art | des | der | ||
Case=Gen|Definite=Def|Number=Plur|PronType=Art | der | der | ||
Case=Nom|Definite=Def|Number=Sing|PronType=Art | der, den | des, dem | die | das |
Case=Nom|Definite=Def|Number=Plur|PronType=Art | die, der, Das | die, den | die, das | |
Case=Nom|Number=Sing|PronType=Dem | dessen, der | die | das | |
Case=Nom|Number=Sing|PronType=Rel | dessen, der | die | das | |
Case=Nom|Number=Plur|PronType=Dem | die | |||
Case=Nom|Number=Plur|PronType=Rel | dessen | Die |
NOUN
24295 NOUN tokens (47% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (22704; 93%).
NOUN
tokens may have the following values of Gender
:
Fem
(11100; 46% of non-emptyGender
): Zeit, Stadt, Familie, Saison, Rolle, Regierung, Praxis, Firma, Gemeinde, SeiteMasc
(3437; 14% of non-emptyGender
): Ort, Name, Platz, Film, Teil, Begriff, Preis, Hause, Titel, BahnhofMasc,Neut
(7471; 31% of non-emptyGender
): Jahr, Jahre, Teil, Ende, Beispiel, Bereich, Rahmen, Gebiet, Sommer, GegensatzNeut
(2287; 9% of non-emptyGender
): Zeit, Unternehmen, Album, Team, Leben, essen, Personal, Teile, Gebiet, GebäudeEMPTY
(27938): Jahren, Jahre, Prozent, Stadt, Menschen, %, km, m, Ende, Sohn
Paradigm Wappen | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Case=Acc | Wappen | Wappen | ||
Case=Dat | Wappen | Wappen | ||
Case=Gen | Wappens | |||
Case=Nom | Wappen | Wappen |
ADJ
6577 ADJ tokens (31% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (5954; 91%), Degree=Pos (5811; 88%).
ADJ
tokens may have the following values of Gender
:
Fem
(3212; 49% of non-emptyGender
): erste, neue, große, ersten, weitere, deutschen, kleine, andere, deutsche, eigeneMasc
(903; 14% of non-emptyGender
): erste, ersten, neuen, größten, neue, weiteren, alte, dritten, großen, deutscheMasc,Neut
(1914; 29% of non-emptyGender
): ersten, gleichen, selben, neuen, heutigen, großen, amerikanischen, französischen, nächsten, weiterenNeut
(548; 8% of non-emptyGender
): erste, gesamte, neue, heutige, alte, ganze, große, dritte, ehemalige, kurzerEMPTY
(14310): später, bekannt, ersten, anderen, weitere, gut, erste, viele, kurz, vielen
Paradigm erst | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Case=Acc|Degree=Pos|Number=Sing | ersten, erstes | erste, ersten | erste, erstes | |
Case=Acc|Degree=Pos|Number=Plur | erste | |||
Case=Dat|Degree=Pos|Number=Sing | ersten | ersten | ||
Case=Dat|Degree=Pos|Number=Plur | ersten | |||
Case=Gen|Degree=Pos|Number=Sing | ersten | |||
Case=Nom|Degree=Pos|Number=Sing | erste | erstes | erste, ersten | erste, erstes |
Case=Nom|Degree=Pos|Number=Plur | ersten, erste | ersten | ||
Case=Nom|Degree=Cmp,Pos|Number=Sing | erster |
PRON
5571 PRON tokens (38% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (5571; 100%), Number=Sing (5391; 97%), PronType=Prs (4464; 80%), Person=3 (4234; 76%), Case=Nom (3631; 65%).
PRON
tokens may have the following values of Gender
:
Fem
(1318; 24% of non-emptyGender
): sie, diese, dieser, alle, meine, unsere, ihre, seine, seiner, jedeMasc
(2616; 47% of non-emptyGender
): er, ihm, ihn, dieser, diesen, ihren, jeden, meinen, deren, jederMasc,Neut
(442; 8% of non-emptyGender
): diesem, dieses, mein, meinem, ihrem, sein, seinem, jedem, jedes, ihrNeut
(1195; 21% of non-emptyGender
): es, dieses, aller, das, diesen, ‘s, ihre, viel, andere, einigeEMPTY
(9122): sich, die, ich, sie, der, man, das, wir, was, diese
Paradigm der | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Case=Acc|Number=Sing|PronType=Dem | deren, dessen | die | das | |
Case=Acc|Number=Plur|PronType=Dem | die | |||
Case=Dat|Number=Sing|PronType=Dem | dem | der | ||
Case=Dat|Number=Plur|PronType=Rel | deren | |||
Case=Nom|Number=Sing|PronType=Dem | deren, der | die | das | |
Case=Nom|Number=Sing|PronType=Rel | dessen, deren | |||
Case=Nom|Number=Plur|PronType=Rel | deren |
PROPN
4750 PROPN tokens (15% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (4717; 99%).
PROPN
tokens may have the following values of Gender
:
Fem
(1613; 34% of non-emptyGender
): University, Universität, SPD, Schweiz, Bundesrepublik, USA, Deutsche, AG, DDR, HochschuleMasc
(712; 15% of non-emptyGender
): USA, Frankreich, FC, Heinrich, River, Österreich, Award, Cup, Ehrlich, FriedrichMasc,Neut
(2046; 43% of non-emptyGender
): Zweiten, Weltkrieg, Oktober, Mai, September, November, Ersten, März, Februar, DezemberNeut
(379; 8% of non-emptyGender
): Kreuz, München, Institut, Museum, Eiserne, Team, College, Gymnasium, Haus, KleinEMPTY
(26717): von, Deutschland, de, of, der, Berlin, the, US, St., für
Paradigm deutsch | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Case=Acc | Deutsche | |||
Case=Dat | Deutsch | Deutschen | Deutschen | |
Case=Gen | Deutschen | |||
Case=Nom | Deutsche | Deutsche | Deutsche |
Gender
seems to be lexical feature of PROPN
. 92% lemmas (2614) occur only with one value of Gender
.
NUM
29 NUM tokens (0% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (29; 100%).
NUM
tokens may have the following values of Gender
:
Fem
(3; 10% of non-emptyGender
): 2, 35, fünfteMasc
(1; 3% of non-emptyGender
): 18.Masc,Neut
(25; 86% of non-emptyGender
): 1, 24., 31, 6, 1., 13, 16, 17, 18, 1:1EMPTY
(7432): zwei, drei, vier, 2007, 2006, fünf, 2009, 2010, sechs, 1
Paradigm 2 | Masc,Neut | Fem |
---|---|---|
Case=Dat | 2 | |
Case=Nom | 2 |
Gender
seems to be lexical feature of NUM
. 95% lemmas (21) occur only with one value of Gender
.
VERB
4 VERB tokens (0% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (4; 100%), Person=EMPTY (4; 100%), VerbForm=EMPTY (3; 75%).
VERB
tokens may have the following values of Gender
:
Masc
(2; 50% of non-emptyGender
): meinen, umgebendenMasc,Neut
(2; 50% of non-emptyGender
): erweiterten, großenEMPTY
(19917): gibt, hat, kam, liegt, hatte, gab, war, erhielt, befindet, ist
ADP
2 ADP tokens (0% of all ADP
tokens) have a non-empty value of Gender
.
ADP
tokens may have the following values of Gender
:
Fem
(1; 50% of non-emptyGender
): alsMasc,Neut
(1; 50% of non-emptyGender
): alsEMPTY
(31656): in, von, mit, zu, an, auf, für, als, nach, bei
Paradigm als | Masc,Neut | Fem |
---|---|---|
als | als |
ADV
1 ADV tokens (0% of all ADV
tokens) have a non-empty value of Gender
.
ADV
tokens may have the following values of Gender
:
Neut
(1; 100% of non-emptyGender
): mehrEMPTY
(14717): auch, nur, noch, sehr, so, dort, wieder, hier, mehr, heute
SCONJ
1 SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Gender
.
SCONJ
tokens may have the following values of Gender
:
Masc,Neut
(1; 100% of non-emptyGender
): dassEMPTY
(1800): dass, da, wenn, als, daß, nachdem, weil, wie, während, ob
X
1 X tokens (0% of all X
tokens) have a non-empty value of Gender
.
X
tokens may have the following values of Gender
:
Fem
(1; 100% of non-emptyGender
): theEMPTY
(368): z.B., u.a., =, %, B., etc., †, &, *, a
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[det]–> DET (20406; 100%),
NOUN –[amod]–> ADJ (6138; 100%),
PROPN –[det]–> DET (2777; 70%),
NOUN –[det]–> PRON (1065; 99%),
PROPN –[amod]–> PROPN (668; 91%),
NOUN –[det:poss]–> PRON (412; 100%),
PROPN –[amod]–> ADJ (248; 62%),
NOUN –[amod]–> PROPN (119; 88%),
NOUN –[amod]–> PRON (25; 100%),
NOUN –[det]–> ADJ (17; 100%).