Treebank Statistics: UD_Czech-PDTC: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc, Fem|Neut, Masc|Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
1583528 tokens (46%) have a non-empty value of Gender.
170910 types (92%) occur at least once with a non-empty value of Gender.
65307 lemmas (78%) occur at least once with a non-empty value of Gender.
The feature is used with 9 part-of-speech tags: NOUN (760311; 22% instances), ADJ (358829; 10% instances), VERB (144213; 4% instances), DET (129582; 4% instances), PROPN (121319; 4% instances), AUX (33583; 1% instances), NUM (21697; 1% instances), PRON (13980; 0% instances), SYM (14; 0% instances).
NOUN
760311 NOUN tokens (97% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (529889; 70%), Animacy=EMPTY (422453; 56%).
NOUN tokens may have the following values of Gender:
Fem(305875; 40% of non-emptyGender): společnosti, společnost, akcií, firmy, společností, době, akcie, akcii, ceny, fotceMasc(337858; 44% of non-emptyGender): dolarů, roce, roku, trhu, rok, dolaru, lidí, den, trh, zákonaNeut(116578; 15% of non-emptyGender): let, letech, čtvrtletí, obchodování, září, období, jednání, procent, zvýšení, vedeníEMPTY(22392): a, p, j, Kč, s, b, m, d, c, UAL
| Paradigm image | Masc | Fem | Neut |
|---|---|---|---|
| _ | image | image | |
| Animacy=Inan | image | ||
| Animacy=Inan|Case=Acc|Number=Sing | image | ||
| Animacy=Inan|Case=Gen|Number=Sing | image | ||
| Animacy=Inan|Case=Nom|Number=Sing | image | ||
| Animacy=Inan|Case=Nom|Number=Plur | image | ||
| Case=Gen|Number=Sing | image | ||
| Case=Loc|Number=Sing | imagi | ||
| Case=Nom|Number=Sing | image | ||
| Case=Nom|Number=Plur | Image |
Gender seems to be lexical feature of NOUN. 100% lemmas (21527) occur only with one value of Gender.
ADJ
358829 ADJ tokens (99% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Polarity=Pos (335939; 94%), Degree=Pos (319362; 89%), VerbForm=EMPTY (303217; 85%), Voice=EMPTY (303217; 85%), Number=Sing (235891; 66%), Animacy=EMPTY (207172; 58%).
ADJ tokens may have the following values of Gender:
Fem(137095; 38% of non-emptyGender): další, první, české, nové, druhé, poslední, velké, obchodní, státní, newyorskéFem,Masc(3744; 1% of non-emptyGender): zveřejněny, rády, oceněny, uvedeny, prodány, připraveny, považovány, schopny, určeny, stanovenyFem,Neut(5615; 2% of non-emptyGender): ráda, schopna, připravena, uzavřena, stanovena, založena, otevřena, považována, dokončena, prodánaMasc(154296; 43% of non-emptyGender): další, cenných, první, minulý, nový, celý, velký, rád, dobrý, čistýNeut(58079; 16% of non-emptyGender): možné, třetí, zajímavé, pěkné, další, posledních, jiné, první, dobré, hezkéEMPTY(2208): tzv, a, čs, česko, sv, fajn, ml, coca, tchaj, aj
| Paradigm spojený | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Aspect=Perf|Number=Plur|Variant=Short | spojeni | ||||
| Animacy=Anim|Case=Acc|Number=Plur | spojené | ||||
| Animacy=Anim|Case=Dat|Number=Plur | spojeným | ||||
| Animacy=Anim|Case=Gen|Number=Plur | spojených | ||||
| Animacy=Anim|Case=Ins|Number=Sing | spojeným | ||||
| Animacy=Anim|Case=Nom|Number=Sing | spojený | ||||
| Animacy=Anim|Case=Nom|Number=Plur | spojení | ||||
| Animacy=Inan|Aspect=Perf|Number=Plur|Variant=Short | spojeny | ||||
| Animacy=Inan|Case=Acc|Number=Sing | spojený | ||||
| Animacy=Inan|Case=Acc|Number=Plur | spojené | ||||
| Animacy=Inan|Case=Dat|Number=Sing | spojenému | ||||
| Animacy=Inan|Case=Dat|Number=Plur | spojeným | ||||
| Animacy=Inan|Case=Gen|Number=Sing | spojeného | ||||
| Animacy=Inan|Case=Gen|Number=Plur | spojených | ||||
| Animacy=Inan|Case=Ins|Number=Plur | spojenými | ||||
| Animacy=Inan|Case=Loc|Number=Sing | Spojeném | ||||
| Animacy=Inan|Case=Loc|Number=Plur | spojených | ||||
| Animacy=Inan|Case=Nom|Number=Sing | spojený | ||||
| Animacy=Inan|Case=Nom|Number=Plur | spojené | ||||
| Aspect=Perf|Number=Sing|Variant=Short | spojen | spojeno | |||
| Aspect=Perf|Number=Plur,Sing|Variant=Short | spojena | ||||
| Case=Acc|Number=Sing | spojenou | spojené | |||
| Case=Acc|Number=Plur | spojené | ||||
| Case=Dat|Number=Sing | spojené | spojenému | |||
| Case=Dat|Number=Plur | spojeným | spojeným | |||
| Case=Gen|Number=Sing | spojené | spojeného | |||
| Case=Gen|Number=Plur | spojených | spojených | |||
| Case=Ins|Number=Sing | spojenou | spojeným | |||
| Case=Ins|Number=Plur | spojenými | ||||
| Case=Loc|Number=Sing | spojeném | ||||
| Case=Loc|Number=Plur | spojených | spojených | |||
| Case=Nom|Number=Sing | spojená | spojené | |||
| Case=Nom|Number=Plur|Style=Coll | spojené | ||||
| Case=Nom|Number=Plur | spojené | spojená |
VERB
144213 VERB tokens (45% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (144213; 100%), Voice=Act (144213; 100%), Person=EMPTY (144212; 100%), Tense=Past (144052; 100%), VerbForm=Part (144050; 100%), Polarity=Pos (133565; 93%), Animacy=EMPTY (102241; 71%), Aspect=Perf (82832; 57%).
VERB tokens may have the following values of Gender:
Fem(14; 0% of non-emptyGender): Narážejíc, Prolamujíc, Snažíc, Tvrdíc, chtíc, citujíc, domnívajíc, držíc, hynouc, nebrajícFem,Masc(13070; 9% of non-emptyGender): měly, mohly, vzrostly, klesly, stouply, začaly, uzavřely, zvýšily, dosáhly, uvedlyFem,Neut(35236; 24% of non-emptyGender): měla, uvedla, mohla, oznámila, řekla, musela, začala, získala, dostala, chtělaMasc(80852; 56% of non-emptyGender): řekl, měl, měli, uvedl, mohl, mohli, dostal, dělal, přišel, prohlásilNeut(15041; 10% of non-emptyGender): mělo, mohlo, došlo, stalo, šlo, podařilo, líbilo, muselo, dalo, začaloEMPTY(175729): má, říká, může, mají, musí, mám, mít, nevím, mohou, myslím
| Paradigm chtít | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nechtěli | ||||
| Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | chtěli | ||||
| Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nechtěly | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | chtěly | ||||
| ExtPos=ADV|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | chtě | chtíc | |||
| Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nechtěl | nechtělo | |||
| Number=Sing|Polarity=Neg|Tense=Pres|VerbForm=Conv | nechtě | nechtíc | |||
| Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | chtěl | chtělo | |||
| Number=Plur,Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nechtěla | ||||
| Number=Plur,Sing|Polarity=Pos|Tense=Past|VerbForm=Part | chtěla |
DET
129582 DET tokens (84% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number[psor]=EMPTY (119330; 92%), Person=EMPTY (119330; 92%), Animacy=EMPTY (111516; 86%), Poss=EMPTY (110856; 86%), Number=Sing (105808; 82%), PronType=Dem (67649; 52%), Case=Nom (65716; 51%).
DET tokens may have the following values of Gender:
Fem(33980; 26% of non-emptyGender): která, které, této, té, své, tato, kterou, ta, svou, jejíFem,Neut(2045; 2% of non-emptyGender): moje, naše, vaše, tvojeMasc(33356; 26% of non-emptyGender): který, kteří, tento, které, ten, každý, svůj, můj, všichni, někteříMasc,Neut(21621; 17% of non-emptyGender): tím, toho, tom, tomu, tohoto, tomto, svého, její, svém, svýmNeut(38580; 30% of non-emptyGender): to, všechno, které, toto, tohle, své, vše, která, takové, tatoEMPTY(25024): jeho, jejich, svých, těchto, to, několik, všech, mnoho, několika, kolik
| Paradigm můj | Fem,Neut | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | mého | ||||
| Animacy=Anim|Case=Nom|Number=Plur | moji, mí | ||||
| Animacy=Anim|Case=Voc|Number=Plur | mí | ||||
| Animacy=Inan|Case=Acc|Number=Sing | můj | ||||
| Animacy=Inan|Case=Nom|Number=Plur | moje, mé | ||||
| Case=Acc|Number=Sing | moji, mou | moje, mé | |||
| Case=Acc|Number=Sing|Style=Coll | mojí | ||||
| Case=Acc|Number=Plur | mé | mé | má | ||
| Case=Dat|Number=Sing | mému | mojí, mé | |||
| Case=Gen|Number=Sing | mého | mé, mojí | |||
| Case=Gen|Number=Sing|Style=Coll | mýho | ||||
| Case=Ins|Number=Sing | mým | mojí, mou | |||
| Case=Ins|Number=Dual | mýma | ||||
| Case=Loc|Number=Sing | mém | mé, mojí | |||
| Case=Loc|Number=Sing|Style=Coll | mým | ||||
| Case=Nom|Number=Sing | moje | můj | má | mé | |
| Case=Nom|Number=Sing|Style=Coll | muj | ||||
| Case=Nom|Number=Plur | moje | mé | má | ||
| Case=Nom|Number=Plur|Style=Coll | mé | ||||
| Case=Voc|Number=Sing | moje | můj | má |
PROPN
121319 PROPN tokens (93% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (109966; 91%), Case=Nom (65848; 54%), NameType=Giv (62169; 51%).
PROPN tokens may have the following values of Gender:
Fem(30777; 25% of non-emptyGender): Praha, Praze, Prahy, Evropě, Plzni, Evropy, Kalifornii, Francie, Plzně, FranciiMasc(79906; 66% of non-emptyGender): Yorku, Jiří, Jan, John, Václav, Petr, Josef, Robert, Pavel, KarelNeut(10636; 9% of non-emptyGender): Německu, Německa, Brno, Brně, Německo, Slovensku, Japonsko, Slovensko, Rusko, JaponskuEMPTY(9327): ČR, USA, LN, ODS, OSN, ČSFR, SR, NATO, ČSSD, Sony
| Paradigm Antonio | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Gen|NameType=Giv|Number=Sing | Antonia | ||
| Animacy=Anim|Case=Ins|NameType=Giv|Number=Sing | Antoniem | ||
| Animacy=Anim|Case=Nom|NameType=Giv|Number=Sing | Antonio | ||
| Case=Acc|NameType=Geo|Number=Sing | Antonio | ||
| Case=Gen|NameType=Geo|Number=Sing | Antonia | ||
| Case=Loc|NameType=Geo|Number=Sing | Antoniu | ||
| NameType=Giv | Antonio |
Gender seems to be lexical feature of PROPN. 99% lemmas (20426) occur only with one value of Gender.
AUX
33583 AUX tokens (23% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Aspect=Imp (33583; 100%), Mood=EMPTY (33583; 100%), Person=EMPTY (33583; 100%), Voice=Act (33583; 100%), Tense=Past (33577; 100%), VerbForm=Part (33577; 100%), Polarity=Pos (30603; 91%), Number=Sing (18156; 54%).
AUX tokens may have the following values of Gender:
Fem(3; 0% of non-emptyGender): jsoucFem,Masc(4145; 12% of non-emptyGender): byly, nebyly, bývaly, bývávaly, nebývalyFem,Neut(7872; 23% of non-emptyGender): byla, nebyla, bývala, bývávala, nebývalaMasc(12789; 38% of non-emptyGender): byl, byli, nebyl, nebyli, býval, bývali, jsa, nebývalNeut(8774; 26% of non-emptyGender): bylo, nebylo, bývalo, nebývalo, bývávalo, bylyEMPTY(111403): je, by, jsem, jsme, jsou, bude, být, není, jste, budou
| Paradigm být | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | ||||
| Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | ||||
| Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | ||||
| Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | nebylo | |||
| Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | bylo | |||
| Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsa | jsouc | |||
| Number=Plur,Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | ||||
| Number=Plur,Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla | ||||
| Number=Plur|Polarity=Pos|Style=Coll|Tense=Past|VerbForm=Part | byly |
NUM
21697 NUM tokens (21% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (21620; 100%), NumForm=EMPTY (11252; 52%).
NUM tokens may have the following values of Gender:
Fem(5226; 24% of non-emptyGender): miliardy, jedna, miliard, jedné, jednu, jednou, mld, miliardu, čtvrt, miliardamiFem,Neut(1822; 8% of non-emptyGender): dvě, oběMasc(12578; 58% of non-emptyGender): milionů, milionu, dva, jeden, tisíc, miliónů, oba, miliony, miliónu, tisíceMasc,Neut(1300; 6% of non-emptyGender): jednoho, jedním, jednom, jednomu, nejednomu, nejednohoNeut(771; 4% of non-emptyGender): jedno, sto, set, sta, stě, stech, sty, desatera, desatero, stůmEMPTY(82759): 1, tři, 2, 3, 4, 8, 10, 30, 5, dvou
| Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Acc | jednoho | |||
| Animacy=Inan|Case=Acc | jeden | |||
| Case=Acc | jednu, jedna | jedno | ||
| Case=Dat | jednomu | jedné | ||
| Case=Gen | jednoho | jedné | ||
| Case=Ins | jedním | jednou | ||
| Case=Loc | jednom | jedné | ||
| Case=Nom | jeden | jedna | jedno |
PRON
13980 PRON tokens (12% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (13980; 100%), Animacy=EMPTY (13454; 96%), Number=Sing (13236; 95%), Person=3 (11338; 81%), PronType=Prs (11338; 81%), Variant=EMPTY (10559; 76%).
PRON tokens may have the following values of Gender:
Fem(5102; 36% of non-emptyGender): ji, ní, jí, níž, ona, ni, jež, veškeré, jíž, veškerouMasc(1404; 10% of non-emptyGender): on, oni, jenž, veškeré, jež, veškerý, jehož, jeho, již, onyMasc,Neut(7057; 50% of non-emptyGender): ho, mu, něj, jej, ním, něm, němž, jehož, něho, něhožNeut(417; 3% of non-emptyGender): všecko, je, jež, ono, veškeré, veškerá, ně, něž, všecka, jenžEMPTY(104674): se, si, co, nás, mi, což, mě, já, je, něco
| Paradigm on | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Nom|Number=Plur | oni | |||
| Animacy=Inan|Case=Nom|Number=Plur | ony | |||
| Case=Acc|Number=Sing|PrepCase=Npr | jeho | jej | ji | je |
| Case=Acc|Number=Sing|PrepCase=Npr|Style=Coll | jí | |||
| Case=Acc|Number=Sing|PrepCase=Pre | něj, něho | ni | ně | |
| Case=Acc|Number=Sing|PrepCase=Pre|Style=Coll | ní | |||
| Case=Acc|Number=Sing|Variant=Short | ho | |||
| Case=Dat|Number=Sing|PrepCase=Npr | jemu | jí | ||
| Case=Dat|Number=Sing|PrepCase=Pre | němu | ní | ||
| Case=Dat|Number=Sing|Variant=Short | mu | |||
| Case=Gen|Number=Sing|PrepCase=Npr | jeho | jej | jí | |
| Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ní | ||
| Case=Gen|Number=Sing|Variant=Short | ho | |||
| Case=Ins|Number=Sing|PrepCase=Npr | jím | jí | ||
| Case=Ins|Number=Sing|PrepCase=Pre | ním, nim | ní | ||
| Case=Loc|Number=Sing|PrepCase=Pre | něm | ní | ||
| Case=Nom|Number=Sing | on | ona | ono | |
| Case=Nom|Number=Sing|Style=Coll | von | vona | ||
| Case=Nom|Number=Plur | ony |
SYM
14 SYM tokens (0% of all SYM tokens) have a non-empty value of Gender.
SYM tokens may have the following values of Gender:
Masc(14; 100% of non-emptyGender): °EMPTY(7559): %, $, +, x, =, §, >, <, *, §§
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (285828; 99%),
NOUN –[det]–> DET (41255; 58%),
NOUN –[flat]–> PROPN (17268; 100%),
PROPN –[flat]–> PROPN (13388; 99%),
VERB –[conj]–> VERB (12658; 61%),
ADJ –[conj]–> ADJ (9590; 94%),
ADJ –[nsubj]–> NOUN (8771; 93%),
PROPN –[amod]–> ADJ (5692; 92%),
PROPN –[conj]–> PROPN (5000; 64%),
ADJ –[nsubj]–> DET (4203; 96%).