Treebank Statistics: UD_Czech-FicTree: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
68808 tokens (41%) have a non-empty value of Gender.
23538 types (87%) occur at least once with a non-empty value of Gender.
11576 lemmas (84%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (27596; 17% instances), VERB (14103; 8% instances), ADJ (10889; 7% instances), DET (8112; 5% instances), PRON (3591; 2% instances), PROPN (2255; 1% instances), AUX (1423; 1% instances), NUM (839; 1% instances).
NOUN
27596 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (21353; 77%), Animacy=EMPTY (15698; 57%).
NOUN tokens may have the following values of Gender:
Fem(11622; 42% of non-emptyGender): chvíli, oči, dívka, ruce, dveře, paní, děti, Kůra, práce, ženaMasc(11898; 43% of non-emptyGender): život, den, člověk, plod, profesor, mistr, čas, muž, lidé, mladíkNeut(4076; 15% of non-emptyGender): dítě, let, slova, září, místo, tělo, srdce, okna, štěstí, léta
| Paradigm dítě | Fem | Neut |
|---|---|---|
| Case=Acc|Number=Sing | dítě | |
| Case=Acc|Number=Plur | děti | |
| Case=Dat|Number=Sing | dítěti | |
| Case=Dat|Number=Plur | dětem | |
| Case=Gen|Number=Sing | dítěte | |
| Case=Gen|Number=Plur | dětí | |
| Case=Ins|Number=Sing | dítětem | |
| Case=Ins|Number=Plur | dětmi | |
| Case=Loc|Number=Plur | dětech | |
| Case=Nom|Number=Sing | dítě | |
| Case=Nom|Number=Plur | děti | |
| Case=Voc|Number=Plur | děti |
Gender seems to be lexical feature of NOUN. 100% lemmas (5263) occur only with one value of Gender.
VERB
14103 VERB tokens (59% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (14103; 100%), Person=EMPTY (14103; 100%), Voice=Act (14103; 100%), Tense=Past (14054; 100%), VerbForm=Part (14051; 100%), Polarity=Pos (12672; 90%), Number=Sing (12157; 86%), Animacy=Anim (7651; 54%).
VERB tokens may have the following values of Gender:
Fem(4453; 32% of non-emptyGender): měla, řekla, chtěla, mohla, vzala, přišla, začala, dala, neměla, stálaMasc(8437; 60% of non-emptyGender): řekl, měl, mohl, chtěl, viděl, začal, přišel, vzal, zeptal, měliNeut(1213; 9% of non-emptyGender): stalo, zdálo, napadlo, mělo, začalo, šlo, mohlo, podařilo, nenapadlo, nešloEMPTY(9877): má, mám, může, nevím, dělat, musí, mají, mít, musím, říct
| Paradigm mít | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Number=Sing|Polarity=Neg | neměl | ||
| Animacy=Anim|Number=Sing|Polarity=Pos | měl | ||
| Animacy=Anim|Number=Plur|Polarity=Neg | neměli | ||
| Animacy=Anim|Number=Plur|Polarity=Pos | měli | ||
| Animacy=Inan|Number=Sing|Polarity=Pos | měl | ||
| Animacy=Inan|Number=Plur|Polarity=Pos | měly | ||
| Number=Sing|Polarity=Neg | neměla | nemělo | |
| Number=Sing|Polarity=Pos | měla | mělo | |
| Number=Plur|Polarity=Neg | neměly | ||
| Number=Plur|Polarity=Pos | měly | měla |
ADJ
10889 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Polarity=Pos (9991; 92%), Degree=Pos (9598; 88%), Number=Sing (8342; 77%), Animacy=EMPTY (6273; 58%).
ADJ tokens may have the following values of Gender:
Fem(4428; 41% of non-emptyGender): celou, poslední, první, ráda, celá, další, malá, hlavní, velké, malouMasc(4616; 42% of non-emptyGender): celý, rád, další, první, malý, druhý, starý, jediný, ostatní, mladýNeut(1845; 17% of non-emptyGender): jiného, jasné, možné, jiná, malé, celé, první, druhé, lepší, těžkéEMPTY(10): marx, Saint, dvou, make, ping, show, troj, tří, československo
| Paradigm celý | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing|Polarity=Pos | celého | ||
| Animacy=Anim|Case=Gen|Number=Sing|Polarity=Pos | celého | ||
| Animacy=Anim|Case=Nom|Number=Sing|Polarity=Pos | celý | ||
| Animacy=Anim|Case=Nom|Number=Plur|Polarity=Pos | celí | ||
| Animacy=Inan|Case=Acc|Number=Sing|Polarity=Neg | Necelý | ||
| Animacy=Inan|Case=Acc|Number=Sing|Polarity=Pos | celý | ||
| Animacy=Inan|Case=Acc|Number=Plur|Polarity=Pos | celé | ||
| Animacy=Inan|Case=Dat|Number=Sing|Polarity=Pos | celému | ||
| Animacy=Inan|Case=Gen|Number=Sing|Polarity=Pos | celého | ||
| Animacy=Inan|Case=Ins|Number=Sing|Polarity=Pos | celým | ||
| Animacy=Inan|Case=Loc|Number=Sing|Polarity=Pos | celém | ||
| Animacy=Inan|Case=Nom|Number=Sing|Polarity=Pos | celý | ||
| Animacy=Inan|Case=Nom|Number=Plur|Polarity=Neg | necelé | ||
| Case=Acc|Number=Sing|Polarity=Pos | celou | celé | |
| Case=Acc|Number=Plur|Polarity=Pos | celé | celá | |
| Case=Dat|Number=Sing|Polarity=Pos | celé | celému | |
| Case=Gen|Number=Sing|Polarity=Pos | celé | celého | |
| Case=Gen|Number=Plur|Polarity=Pos | celých | ||
| Case=Ins|Number=Sing|Polarity=Pos | celou | celým | |
| Case=Loc|Number=Sing|Polarity=Pos | celé | celém | |
| Case=Nom|Number=Sing|Polarity=Pos | celá | celé | |
| Case=Nom|Number=Plur|Polarity=Pos | celé |
DET
8112 DET tokens (96% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number[psor]=EMPTY (6716; 83%), Person=EMPTY (6716; 83%), Number=Sing (6651; 82%), Poss=EMPTY (5968; 74%), Animacy=EMPTY (5419; 67%).
DET tokens may have the following values of Gender:
Fem(2346; 29% of non-emptyGender): která, jeho, té, které, tu, ta, své, svou, kterou, jejíMasc(2693; 33% of non-emptyGender): který, ten, jeho, sám, každý, můj, svého, všichni, kteří, svůjNeut(3073; 38% of non-emptyGender): to, všechno, tom, tím, toho, tomu, tohle, které, jeho, svéEMPTY(323): několik, tolik, kolik, několika, mnoho, hodně, moc, víc, málo, mnoha
| Paradigm ten | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | toho | ||
| Animacy=Anim|Case=Acc|Number=Plur | ty | ||
| Animacy=Anim|Case=Dat|Number=Sing | tomu | ||
| Animacy=Anim|Case=Dat|Number=Plur | těm | ||
| Animacy=Anim|Case=Gen|Number=Sing | toho | ||
| Animacy=Anim|Case=Gen|Number=Plur | těch | ||
| Animacy=Anim|Case=Ins|Number=Sing | tím | ||
| Animacy=Anim|Case=Ins|Number=Plur | těmi | ||
| Animacy=Anim|Case=Loc|Number=Sing | tom | ||
| Animacy=Anim|Case=Loc|Number=Plur | těch | ||
| Animacy=Anim|Case=Nom|Number=Sing | ten | ||
| Animacy=Anim|Case=Nom|Number=Plur | ti | ||
| Animacy=Inan|Case=Acc|Number=Sing | ten | ||
| Animacy=Inan|Case=Acc|Number=Plur | ty | ||
| Animacy=Inan|Case=Dat|Number=Sing | tomu | ||
| Animacy=Inan|Case=Dat|Number=Plur | těm | ||
| Animacy=Inan|Case=Gen|Number=Sing | toho | ||
| Animacy=Inan|Case=Gen|Number=Plur | těch | ||
| Animacy=Inan|Case=Ins|Number=Sing | tím | ||
| Animacy=Inan|Case=Ins|Number=Plur | těmi | ||
| Animacy=Inan|Case=Loc|Number=Sing | tom | ||
| Animacy=Inan|Case=Loc|Number=Plur | těch | ||
| Animacy=Inan|Case=Nom|Number=Sing | ten | ||
| Animacy=Inan|Case=Nom|Number=Plur | ty | ||
| Case=Acc|Number=Sing | tu | to | |
| Case=Acc|Number=Plur | ty | ta | |
| Case=Dat|Number=Sing | té | tomu | |
| Case=Dat|Number=Plur | těm | ||
| Case=Gen|Number=Sing | té | toho | |
| Case=Gen|Number=Sing|Style=Coll | tý | ||
| Case=Gen|Number=Plur | těch | těch | |
| Case=Ins|Number=Sing | tou | tím | |
| Case=Ins|Number=Plur | těmi | těmi | |
| Case=Loc|Number=Sing | té | tom | |
| Case=Loc|Number=Plur | těch | těch | |
| Case=Nom|Number=Sing | ta | to | |
| Case=Nom|Number=Plur | ty | ta |
PRON
3591 PRON tokens (25% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (3591; 100%), Person=3 (2937; 82%), PronType=Prs (2937; 82%), Variant=EMPTY (2601; 72%), Number=Sing (2512; 70%), Animacy=Anim (2028; 56%).
PRON tokens may have the following values of Gender:
Fem(1051; 29% of non-emptyGender): ji, jí, ní, ona, je, ni, nich, níž, ně, jichMasc(2374; 66% of non-emptyGender): ho, mu, kdo, je, on, nikdo, něj, někdo, ním, jimNeut(166; 5% of non-emptyGender): je, ho, všecko, ně, něj, něm, co, jež, mu, onoEMPTY(10496): se, si, mi, co, mě, já, nic, něco, nás, ti
| Paradigm on | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing|PrepCase=Npr | jej, jeho | ||
| Animacy=Anim|Case=Acc|Number=Sing|PrepCase=Pre | něho, něj | ||
| Animacy=Anim|Case=Acc|Number=Sing|Variant=Short | ho | ||
| Animacy=Anim|Case=Acc|Number=Plur|PrepCase=Npr | je | ||
| Animacy=Anim|Case=Acc|Number=Plur|PrepCase=Pre | ně | ||
| Animacy=Anim|Case=Dat|Number=Sing|PrepCase=Npr | jemu | ||
| Animacy=Anim|Case=Dat|Number=Sing|PrepCase=Pre | němu | ||
| Animacy=Anim|Case=Dat|Number=Sing|Variant=Short | mu | ||
| Animacy=Anim|Case=Dat|Number=Plur|PrepCase=Npr | jim | ||
| Animacy=Anim|Case=Dat|Number=Plur|PrepCase=Pre | nim | ||
| Animacy=Anim|Case=Gen|Number=Sing|PrepCase=Npr | jeho | ||
| Animacy=Anim|Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ||
| Animacy=Anim|Case=Gen|Number=Sing|Variant=Short | ho | ||
| Animacy=Anim|Case=Gen|Number=Plur|PrepCase=Npr | jich | ||
| Animacy=Anim|Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
| Animacy=Anim|Case=Ins|Number=Sing|PrepCase=Npr | jím | ||
| Animacy=Anim|Case=Ins|Number=Sing|PrepCase=Pre | ním | ||
| Animacy=Anim|Case=Ins|Number=Plur|PrepCase=Npr | jimi | ||
| Animacy=Anim|Case=Ins|Number=Plur|PrepCase=Pre | nimi | ||
| Animacy=Anim|Case=Loc|Number=Sing|PrepCase=Pre | něm | ||
| Animacy=Anim|Case=Loc|Number=Plur|PrepCase=Pre | nich | ||
| Animacy=Anim|Case=Nom|Number=Sing | on | ||
| Animacy=Anim|Case=Nom|Number=Plur | oni | ||
| Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Npr | jej | ||
| Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Pre | něj | ||
| Animacy=Inan|Case=Acc|Number=Sing|Variant=Short | ho | ||
| Animacy=Inan|Case=Acc|Number=Plur|PrepCase=Npr | je | ||
| Animacy=Inan|Case=Acc|Number=Plur|PrepCase=Pre | ně | ||
| Animacy=Inan|Case=Dat|Number=Sing|PrepCase=Pre | němu | ||
| Animacy=Inan|Case=Dat|Number=Sing|Variant=Short | mu | ||
| Animacy=Inan|Case=Dat|Number=Plur|PrepCase=Npr | jim | ||
| Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ||
| Animacy=Inan|Case=Gen|Number=Sing|Variant=Short | ho | ||
| Animacy=Inan|Case=Gen|Number=Plur|PrepCase=Npr | jich | ||
| Animacy=Inan|Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
| Animacy=Inan|Case=Ins|Number=Sing|PrepCase=Pre | ním | ||
| Animacy=Inan|Case=Ins|Number=Plur|PrepCase=Npr | jimi | ||
| Animacy=Inan|Case=Ins|Number=Plur|PrepCase=Pre | nimi | ||
| Animacy=Inan|Case=Loc|Number=Sing|PrepCase=Pre | něm | ||
| Animacy=Inan|Case=Loc|Number=Plur|PrepCase=Pre | nich | ||
| Animacy=Inan|Case=Nom|Number=Plur | ony | ||
| Case=Acc|Number=Sing|PrepCase=Npr | ji | je | |
| Case=Acc|Number=Sing|PrepCase=Npr|Style=Coll | jí | ||
| Case=Acc|Number=Sing|PrepCase=Pre | ni | ně, něj, něho | |
| Case=Acc|Number=Sing|Variant=Short | ho | ||
| Case=Acc|Number=Plur|PrepCase=Npr | je | je | |
| Case=Acc|Number=Plur|PrepCase=Pre | ně | ně | |
| Case=Dat|Number=Sing|PrepCase=Npr | jí | ||
| Case=Dat|Number=Sing|PrepCase=Pre | ní | ||
| Case=Dat|Number=Sing|Variant=Short | mu | ||
| Case=Dat|Number=Plur|PrepCase=Npr | jim | ||
| Case=Dat|Number=Plur|PrepCase=Pre | nim | nim | |
| Case=Gen|Number=Sing|PrepCase=Npr | jí | ||
| Case=Gen|Number=Sing|PrepCase=Pre | ní | něho, něj | |
| Case=Gen|Number=Sing|Variant=Short | ho | ||
| Case=Gen|Number=Plur|PrepCase=Npr | jich | jich | |
| Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
| Case=Ins|Number=Sing|PrepCase=Npr | jí | jím | |
| Case=Ins|Number=Sing|PrepCase=Pre | ní | ním | |
| Case=Ins|Number=Plur|PrepCase=Npr | jimi | ||
| Case=Ins|Number=Plur|PrepCase=Pre | nimi | nimi | |
| Case=Loc|Number=Sing|PrepCase=Pre | ní | něm | |
| Case=Loc|Number=Plur|PrepCase=Pre | nich | nich | |
| Case=Nom|Number=Sing | ona | ono | |
| Case=Nom|Number=Plur | ony | Ona |
PROPN
2255 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (2143; 95%), Animacy=Anim (1278; 57%), Case=Nom (1278; 57%), NameType=Giv (1248; 55%).
PROPN tokens may have the following values of Gender:
Fem(822; 36% of non-emptyGender): Valentýna, Alžběta, Veronika, Alice, Praze, Prahy, Čáslavi, Janičku, Magda, MášaMasc(1391; 62% of non-emptyGender): Láďa, Leoš, Eduard, Havel, Flajšman, Havlena, Filip, Honza, K, NěmciNeut(42; 2% of non-emptyGender): Československu, Německa, zoo, Československa, C, Japonska, Německu, Ruska, Angeles, Gobi
| Paradigm K | Masc | Fem |
|---|---|---|
| Animacy=Anim | K | |
| K |
Gender seems to be lexical feature of PROPN. 98% lemmas (413) occur only with one value of Gender.
AUX
1423 AUX tokens (19% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Aspect=Imp (1423; 100%), Mood=EMPTY (1423; 100%), Person=EMPTY (1423; 100%), Voice=Act (1423; 100%), Tense=Past (1422; 100%), VerbForm=Part (1422; 100%), Polarity=Pos (1266; 89%), Number=Sing (1229; 86%).
AUX tokens may have the following values of Gender:
Fem(420; 30% of non-emptyGender): byla, byly, nebyla, bývala, nebyly, jsouc, nebývalaMasc(624; 44% of non-emptyGender): byl, byli, nebyl, byly, býval, nebyli, nebyly, bývali, nebývalNeut(379; 27% of non-emptyGender): bylo, nebylo, byla, bývalo, nebývalo, nebylaEMPTY(6111): jsem, je, by, bych, jsme, bude, jsou, jsi, není, být
| Paradigm být | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | ||
| Animacy=Anim|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||
| Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | ||
| Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | ||
| Animacy=Inan|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | ||
| Animacy=Inan|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||
| Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | ||
| Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | ||
| Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | nebylo | |
| Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla | bylo | |
| Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsouc | ||
| Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | nebyla | |
| Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | byla |
NUM
839 NUM tokens (64% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (834; 99%), NumType=Card (834; 99%), Number=Plur (425; 51%).
NUM tokens may have the following values of Gender:
Fem(268; 32% of non-emptyGender): dvě, jedna, jednu, jedné, tři, obě, jednou, dvou, čtyři, obouMasc(467; 56% of non-emptyGender): jeden, dva, jednoho, oba, tři, čtyři, jedním, dvěma, tisíc, dvouNeut(104; 12% of non-emptyGender): jedno, dvě, jednom, tři, jednoho, obě, jedním, půl, čtyř, čtyřiEMPTY(474): pár, deset, dvacet, pět, třicet, šest, dvanáct, pěti, čtrnáct, devět
| Paradigm jeden | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Anim|Case=Acc | jednoho, jeden | ||
| Animacy=Anim|Case=Dat | jednomu | ||
| Animacy=Anim|Case=Gen | jednoho | ||
| Animacy=Anim|Case=Ins | jedním | ||
| Animacy=Anim|Case=Nom | jeden | ||
| Animacy=Anim|Case=Voc | jeden | ||
| Animacy=Inan|Case=Acc | jeden | ||
| Animacy=Inan|Case=Dat | jednomu | ||
| Animacy=Inan|Case=Gen | jednoho | ||
| Animacy=Inan|Case=Ins | jedním | ||
| Animacy=Inan|Case=Loc | jednom | ||
| Animacy=Inan|Case=Nom | jeden | ||
| Case=Acc | jednu | jedno | |
| Case=Dat | jedné | jednomu | |
| Case=Gen | jedné | jednoho | |
| Case=Ins | jednou | jedním | |
| Case=Loc | jedné | jednom | |
| Case=Nom | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (7636; 100%),
NOUN –[det]–> DET (4077; 100%),
VERB –[nsubj]–> NOUN (3064; 72%),
VERB –[conj]–> VERB (2806; 74%),
VERB –[nsubj]–> DET (646; 62%),
VERB –[nsubj]–> PROPN (602; 75%),
NOUN –[nummod]–> NUM (534; 85%),
ADJ –[conj]–> ADJ (527; 97%),
ADJ –[nsubj]–> NOUN (350; 98%),
NOUN –[flat]–> PROPN (201; 100%).