Treebank Statistics: UD_Czech-PDT: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc
, Fem|Neut
, Masc|Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
160378 tokens (48%) have a non-empty value of Gender
.
47347 types (89%) occur at least once with a non-empty value of Gender
.
21607 lemmas (80%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (79711; 24% instances), ADJ (40442; 12% instances), PROPN (14282; 4% instances), VERB (10879; 3% instances), DET (10231; 3% instances), AUX (1745; 1% instances), NUM (1691; 1% instances), PRON (1397; 0% instances).
NOUN
79711 NOUN tokens (96% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (56889; 71%), Animacy=EMPTY (44880; 56%).
NOUN
tokens may have the following values of Gender
:
Fem
(31569; 40% of non-emptyGender
): korun, strany, firmy, práce, společnosti, době, ceny, vláda, přímky, vládyMasc
(34831; 44% of non-emptyGender
): roku, roce, případě, rok, lidí, zákona, světa, trhu, předseda, zájemNeut
(13311; 17% of non-emptyGender
): let, jednání, procent, letech, zahraničí, září, řešení, ministerstva, vedení, tvrzeníEMPTY
(3462): p, Kč, q, a, j, b, r, m, s, HZDS
Paradigm image | Masc | Fem | Neut |
---|---|---|---|
_ | image | ||
Animacy=Inan | image | ||
Animacy=Inan|Case=Acc|Number=Sing | image | ||
Animacy=Inan|Case=Gen|Number=Sing | image | ||
Animacy=Inan|Case=Nom|Number=Sing | image | ||
Animacy=Inan|Case=Nom|Number=Plur | image | ||
Case=Gen|Number=Sing | image |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (8542) occur only with one value of Gender
.
ADJ
40442 ADJ tokens (99% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Polarity=Pos (37751; 93%), Degree=Pos (36176; 89%), VerbForm=EMPTY (34523; 85%), Voice=EMPTY (34523; 85%), Number=Sing (27654; 68%), Animacy=EMPTY (24045; 59%).
ADJ
tokens may have the following values of Gender
:
Fem
(16030; 40% of non-emptyGender
): české, první, další, druhé, nové, česká, národní, poslední, vlastní, státníFem,Masc
(416; 1% of non-emptyGender
): nalezeny, považovány, uvedeny, poskytovány, rozloženy, určeny, zajištěny, zastoupeny, definovány, nabízenyFem,Neut
(584; 1% of non-emptyGender
): připravena, uzavřena, schopna, zahájena, podepsána, určena, dána, založena, ochotna, ohroženaMasc
(16712; 41% of non-emptyGender
): další, první, nový, českého, český, dalších, velký, celý, druhý, novéhoNeut
(6700; 17% of non-emptyGender
): možné, prvním, jiné, posledních, nutné, českého, řečeno, možno, první, národníhoEMPTY
(325): tzv, a, čs, česko, sv, izraelsko, matematicko, know, nar, německo
Paradigm známý | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Case=Acc|Degree=Pos|Number=Plur|Polarity=Neg | neznámé | ||||
Animacy=Anim|Case=Acc|Degree=Sup|Number=Plur|Polarity=Pos | nejznámější | ||||
Animacy=Anim|Case=Dat|Degree=Pos|Number=Plur|Polarity=Pos | známým | ||||
Animacy=Anim|Case=Gen|Degree=Pos|Number=Sing|Polarity=Neg | neznámého | ||||
Animacy=Anim|Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | známého | ||||
Animacy=Anim|Case=Gen|Degree=Sup|Number=Plur|Polarity=Pos | nejznámějších | ||||
Animacy=Anim|Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | známým | ||||
Animacy=Anim|Case=Ins|Degree=Sup|Number=Sing|Polarity=Pos | nejznámějším | ||||
Animacy=Anim|Case=Nom|Degree=Pos|Number=Sing|Polarity=Neg | neznámý | ||||
Animacy=Anim|Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | známý | ||||
Animacy=Anim|Case=Nom|Degree=Pos|Number=Plur|Polarity=Neg | neznámí | ||||
Animacy=Anim|Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | známí | ||||
Animacy=Anim|Case=Nom|Degree=Sup|Number=Sing|Polarity=Pos | nejznámější | ||||
Animacy=Inan|Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | známý | ||||
Animacy=Inan|Case=Acc|Degree=Pos|Number=Plur|Polarity=Pos | známé | ||||
Animacy=Inan|Case=Acc|Degree=Sup|Number=Plur|Polarity=Pos | nejznámější | ||||
Animacy=Inan|Case=Dat|Degree=Pos|Number=Plur|Polarity=Pos | známým | ||||
Animacy=Inan|Case=Gen|Degree=Pos|Number=Sing|Polarity=Neg | neznámého | ||||
Animacy=Inan|Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | známého | ||||
Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur|Polarity=Neg | neznámých | ||||
Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | známých | ||||
Animacy=Inan|Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | známým | ||||
Animacy=Inan|Case=Ins|Degree=Pos|Number=Plur|Polarity=Neg | neznámými | ||||
Animacy=Inan|Case=Ins|Degree=Sup|Number=Sing|Polarity=Pos | Nejznámějším | ||||
Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing|Polarity=Neg | neznámý | ||||
Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | známý | ||||
Animacy=Inan|Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | známé | ||||
Animacy=Inan|Degree=Pos|Number=Plur|Polarity=Pos|Variant=Short | známy | ||||
Case=Acc|Degree=Pos|Number=Sing|Polarity=Neg | neznámé | ||||
Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | známou | známé | |||
Case=Acc|Degree=Pos|Number=Plur|Polarity=Neg | neznámá | ||||
Case=Gen|Degree=Pos|Number=Sing|Polarity=Pos | známé | známého | |||
Case=Gen|Degree=Pos|Number=Plur|Polarity=Neg | neznámých | ||||
Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | známých | známých | |||
Case=Ins|Degree=Pos|Number=Sing|Polarity=Neg | neznámým | ||||
Case=Ins|Degree=Pos|Number=Sing|Polarity=Pos | známou | známým | |||
Case=Loc|Degree=Pos|Number=Sing|Polarity=Pos | známé | ||||
Case=Nom|Degree=Pos|Number=Sing|Polarity=Neg | neznámá | ||||
Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | známá | známé | |||
Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | známé | ||||
Case=Voc|Degree=Pos|Number=Sing|Polarity=Neg | neznámá | ||||
Degree=Pos|Number=Sing|Polarity=Neg|Variant=Short | neznámo | ||||
Degree=Pos|Number=Sing|Polarity=Pos|Variant=Short | znám | známo | |||
Degree=Pos|Number=Plur,Sing|Polarity=Pos|Variant=Short | známa |
PROPN
14282 PROPN tokens (91% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (13115; 92%), NameType=Giv (7723; 54%), Case=Nom (7700; 54%), Animacy=Anim (7316; 51%).
PROPN
tokens may have the following values of Gender
:
Fem
(3727; 26% of non-emptyGender
): Praha, Praze, Evropě, Evropy, Prahy, Ostrava, Francie, Olomouc, Jugoslávie, BritánieMasc
(9109; 64% of non-emptyGender
): Jiří, Jan, Václav, Vladimír, Klaus, Petr, Pavel, Josef, Jana, JohnNeut
(1446; 10% of non-emptyGender
): Německu, Německo, Brně, Rusko, Brno, Německa, Slovensku, Slovensko, Slovenska, RuskaEMPTY
(1459): ČR, ODS, LN, USA, OSN, ČSFR, NATO, SR, ČSSD, EU
Paradigm Rus | Masc | Fem |
---|---|---|
Animacy=Anim|Case=Acc|NameType=Nat|Number=Sing | Rusa | |
Animacy=Anim|Case=Gen|NameType=Nat|Number=Plur | Rusů | |
Animacy=Anim|Case=Ins|NameType=Nat|Number=Sing | Rusem | |
Animacy=Anim|Case=Loc|NameType=Nat|Number=Sing | Rusu | |
Animacy=Anim|Case=Nom|NameType=Nat|Number=Sing | Rus | |
Animacy=Anim|Case=Nom|NameType=Nat|Number=Plur | Rusové | |
Case=Gen|NameType=Geo|Number=Sing | Rusi |
Gender
seems to be lexical feature of PROPN
. 100% lemmas (4506) occur only with one value of Gender
.
VERB
10879 VERB tokens (37% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=EMPTY (10879; 100%), Person=EMPTY (10879; 100%), Voice=Act (10879; 100%), Tense=Past (10862; 100%), VerbForm=Part (10862; 100%), Polarity=Pos (9997; 92%), Aspect=Perf (6766; 62%), Number=Sing (5916; 54%).
VERB
tokens may have the following values of Gender
:
Fem,Masc
(1031; 9% of non-emptyGender
): měly, mohly, začaly, objevily, neměly, vedly, získaly, musely, potvrdily, přišlyFem,Neut
(2110; 19% of non-emptyGender
): měla, mohla, začala, skončila, stala, řekla, získala, dosáhla, stála, uvedlaMasc
(6320; 58% of non-emptyGender
): řekl, měl, uvedl, měli, mohl, prohlásil, mohli, stal, začal, dodalNeut
(1418; 13% of non-emptyGender
): mělo, došlo, mohlo, podařilo, šlo, stalo, nepodařilo, začalo, přišlo, daloEMPTY
(18340): má, může, mají, jde, musí, lze, mít, mohou, chce, říká
Paradigm mít | Fem,Masc | Fem,Neut | Masc | Neut |
---|---|---|---|---|
Animacy=Anim|Number=Plur|Polarity=Neg | neměli | |||
Animacy=Anim|Number=Plur|Polarity=Pos | měli | |||
Animacy=Inan|Number=Plur|Polarity=Neg | neměly | |||
Animacy=Inan|Number=Plur|Polarity=Pos | měly | |||
Number=Sing|Polarity=Neg | neměl | nemělo | ||
Number=Sing|Polarity=Pos | měl | mělo | ||
Number=Plur,Sing|Polarity=Neg | neměla | |||
Number=Plur,Sing|Polarity=Pos | měla |
DET
10231 DET tokens (80% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number[psor]=EMPTY (9390; 92%), Person=EMPTY (9390; 92%), Animacy=EMPTY (8662; 85%), Poss=EMPTY (8453; 83%), Number=Sing (8213; 80%).
DET
tokens may have the following values of Gender
:
Fem
(2825; 28% of non-emptyGender
): která, které, této, své, svou, kterou, tato, tuto, její, našíFem,Neut
(87; 1% of non-emptyGender
): naše, moje, vašeMasc
(2816; 28% of non-emptyGender
): který, kteří, které, tento, ten, svůj, každý, sám, náš, svéMasc,Neut
(2261; 22% of non-emptyGender
): tím, tom, tomu, toho, tohoto, tomto, svého, svém, našeho, svýmNeut
(2242; 22% of non-emptyGender
): to, které, toto, vše, své, všechno, která, tato, takové, jejíEMPTY
(2567): jeho, jejich, všech, těchto, několik, svých, některých, našich, několika, jejichž
Paradigm náš | Fem,Neut | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|---|
Abbr=Yes|Case=Ins|Number=Sing | n | ||||
Animacy=Anim|Case=Acc|Number=Sing | našeho | ||||
Animacy=Anim|Case=Nom|Number=Plur | naši | ||||
Animacy=Inan|Case=Acc|Number=Sing | náš | ||||
Animacy=Inan|Case=Nom|Number=Plur | naše | ||||
Case=Acc|Number=Sing | naši | naše | |||
Case=Dat|Number=Sing | našemu | naší | |||
Case=Gen|Number=Sing | našeho | naší | |||
Case=Ins|Number=Sing | naším | naší | |||
Case=Ins|Number=Sing|Style=Coll | našim | ||||
Case=Loc|Number=Sing | našem | naší | |||
Case=Nom|Number=Sing | naše | náš | |||
Case=Nom|Number=Plur | naše |
AUX
1745 AUX tokens (16% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (1745; 100%), Mood=EMPTY (1745; 100%), Person=EMPTY (1745; 100%), Voice=Act (1745; 100%), Tense=Past (1744; 100%), VerbForm=Part (1744; 100%), Polarity=Pos (1555; 89%), Number=Sing (1007; 58%).
AUX
tokens may have the following values of Gender
:
Fem,Masc
(226; 13% of non-emptyGender
): byly, nebyly, bývaly, bývávalyFem,Neut
(404; 23% of non-emptyGender
): byla, nebyla, bývala, nebývalaMasc
(665; 38% of non-emptyGender
): byl, byli, nebyl, nebyli, býval, jsaNeut
(450; 26% of non-emptyGender
): bylo, nebylo, bývalo, bývávalo, nebývaloEMPTY
(9008): je, by, jsou, bude, být, jsem, není, jsme, budou, bychom
Paradigm být | Fem,Masc | Fem,Neut | Masc | Neut |
---|---|---|---|---|
Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | |||
Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | |||
Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | |||
Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | |||
Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | nebylo | ||
Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | bylo | ||
Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsa | |||
Number=Plur,Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | |||
Number=Plur,Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla |
NUM
1691 NUM tokens (18% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (1685; 100%), NumForm=Word (965; 57%).
NUM
tokens may have the following values of Gender
:
Fem
(383; 23% of non-emptyGender
): jedné, jedna, jednu, miliardy, miliard, jednou, mld, miliardu, nuly, čtvrtFem,Neut
(170; 10% of non-emptyGender
): dvě, oběMasc
(899; 53% of non-emptyGender
): tisíc, dva, jeden, miliónů, milionů, oba, tisíce, mil, miliónu, milionuMasc,Neut
(138; 8% of non-emptyGender
): jednoho, jedním, jednom, jednomu, nejednomuNeut
(101; 6% of non-emptyGender
): jedno, sto, set, sta, stě, stu, styEMPTY
(7567): 1, 2, 3, tři, 4, 10, 5, dvou, 1992, čtyři
Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Anim|Case=Acc | jednoho | |||
Animacy=Inan|Case=Acc | jeden | |||
Case=Acc | jednu | jedno | ||
Case=Dat | jednomu | jedné | ||
Case=Gen | jednoho | jedné | ||
Case=Ins | jedním | jednou | ||
Case=Loc | jednom | jedné | ||
Case=Nom | jeden | jedna | jedno |
PRON
1397 PRON tokens (14% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (1397; 100%), Number=Sing (1346; 96%), Variant=EMPTY (1125; 81%), Person=3 (1042; 75%), PronType=Prs (1042; 75%).
PRON
tokens may have the following values of Gender
:
Fem
(498; 36% of non-emptyGender
): ji, ní, níž, jí, ni, jež, ona, veškeré, niž, jížMasc
(107; 8% of non-emptyGender
): on, jenž, oni, veškeré, jež, jehož, veškerý, jehoMasc,Neut
(754; 54% of non-emptyGender
): mu, ho, něj, jej, něm, němž, jehož, ním, něho, něhožNeut
(38; 3% of non-emptyGender
): je, jež, veškerá, ono, něž, ně, všeckoEMPTY
(8699): se, si, co, nás, nám, je, což, kdo, nich, mi
Paradigm on | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Anim|Case=Nom|Number=Plur | oni | |||
Case=Acc|Number=Sing|PrepCase=Npr | jej | ji | je | |
Case=Acc|Number=Sing|PrepCase=Pre | něj, něho | ni | ně | |
Case=Acc|Number=Sing|Variant=Short | ho | |||
Case=Dat|Number=Sing|PrepCase=Npr | jemu | jí | ||
Case=Dat|Number=Sing|PrepCase=Pre | němu | ní | ||
Case=Dat|Number=Sing|Variant=Short | mu | |||
Case=Gen|Number=Sing|PrepCase=Npr | jeho | jej | jí | |
Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ní | ||
Case=Gen|Number=Sing|Variant=Short | ho | |||
Case=Ins|Number=Sing|PrepCase=Npr | jím | jí | ||
Case=Ins|Number=Sing|PrepCase=Pre | ním | ní | ||
Case=Loc|Number=Sing|PrepCase=Pre | něm | ní | ||
Case=Nom|Number=Sing | on | ona | ono | |
Case=Nom|Number=Plur | ony |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (32498; 98%),
NOUN –[flat]–> PROPN (2253; 100%),
PROPN –[flat]–> PROPN (1724; 99%),
ADJ –[conj]–> ADJ (1265; 88%),
ADJ –[nsubj]–> NOUN (1150; 84%),
VERB –[nsubj]–> PROPN (944; 52%),
VERB –[conj]–> VERB (878; 55%),
PROPN –[conj]–> PROPN (738; 64%),
PROPN –[amod]–> ADJ (734; 92%),
ADJ –[aux:pass]–> AUX (712; 53%).