Treebank Statistics: UD_Czech-FicTree: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
68808 tokens (41%) have a non-empty value of Gender
.
23538 types (87%) occur at least once with a non-empty value of Gender
.
11573 lemmas (84%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (27596; 17% instances), VERB (14103; 8% instances), ADJ (10889; 7% instances), DET (8112; 5% instances), PRON (3591; 2% instances), PROPN (2255; 1% instances), AUX (1423; 1% instances), NUM (839; 1% instances).
NOUN
27596 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (21353; 77%), Animacy=EMPTY (15698; 57%).
NOUN
tokens may have the following values of Gender
:
Fem
(11622; 42% of non-emptyGender
): chvíli, oči, dívka, ruce, dveře, paní, děti, Kůra, práce, ženaMasc
(11898; 43% of non-emptyGender
): život, den, člověk, plod, profesor, mistr, čas, muž, lidé, mladíkNeut
(4076; 15% of non-emptyGender
): dítě, let, slova, září, místo, tělo, srdce, okna, štěstí, léta
Paradigm dítě | Fem | Neut |
---|---|---|
Case=Acc|Number=Sing | dítě | |
Case=Acc|Number=Plur | děti | |
Case=Dat|Number=Sing | dítěti | |
Case=Dat|Number=Plur | dětem | |
Case=Gen|Number=Sing | dítěte | |
Case=Gen|Number=Plur | dětí | |
Case=Ins|Number=Sing | dítětem | |
Case=Ins|Number=Plur | dětmi | |
Case=Loc|Number=Plur | dětech | |
Case=Nom|Number=Sing | dítě | |
Case=Nom|Number=Plur | děti | |
Case=Voc|Number=Plur | děti |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (5263) occur only with one value of Gender
.
VERB
14103 VERB tokens (59% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=EMPTY (14103; 100%), Person=EMPTY (14103; 100%), Voice=Act (14103; 100%), Tense=Past (14054; 100%), VerbForm=Part (14051; 100%), Polarity=Pos (12672; 90%), Number=Sing (12157; 86%), Animacy=Anim (7651; 54%).
VERB
tokens may have the following values of Gender
:
Fem
(4453; 32% of non-emptyGender
): měla, řekla, chtěla, mohla, vzala, přišla, začala, dala, neměla, stálaMasc
(8437; 60% of non-emptyGender
): řekl, měl, mohl, chtěl, viděl, začal, přišel, vzal, zeptal, měliNeut
(1213; 9% of non-emptyGender
): stalo, zdálo, napadlo, mělo, začalo, šlo, mohlo, podařilo, nenapadlo, nešloEMPTY
(9877): má, mám, může, nevím, dělat, musí, mají, mít, musím, říct
Paradigm mít | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Number=Sing|Polarity=Neg | neměl | ||
Animacy=Anim|Number=Sing|Polarity=Pos | měl | ||
Animacy=Anim|Number=Plur|Polarity=Neg | neměli | ||
Animacy=Anim|Number=Plur|Polarity=Pos | měli | ||
Animacy=Inan|Number=Sing|Polarity=Pos | měl | ||
Animacy=Inan|Number=Plur|Polarity=Pos | měly | ||
Number=Sing|Polarity=Neg | neměla | nemělo | |
Number=Sing|Polarity=Pos | měla | mělo | |
Number=Plur|Polarity=Neg | neměly | ||
Number=Plur|Polarity=Pos | měly | měla |
ADJ
10889 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Polarity=Pos (9991; 92%), Degree=Pos (9598; 88%), Number=Sing (8342; 77%), Animacy=EMPTY (6273; 58%).
ADJ
tokens may have the following values of Gender
:
Fem
(4428; 41% of non-emptyGender
): celou, poslední, první, ráda, celá, další, malá, hlavní, velké, malouMasc
(4616; 42% of non-emptyGender
): celý, rád, další, první, malý, druhý, starý, jediný, ostatní, mladýNeut
(1845; 17% of non-emptyGender
): jiného, jasné, možné, jiná, malé, celé, první, druhé, lepší, těžkéEMPTY
(10): marx, Saint, dvou, make, ping, show, troj, tří, československo
Paradigm celý | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing|Polarity=Pos | celého | ||
Animacy=Anim|Case=Gen|Number=Sing|Polarity=Pos | celého | ||
Animacy=Anim|Case=Nom|Number=Sing|Polarity=Pos | celý | ||
Animacy=Anim|Case=Nom|Number=Plur|Polarity=Pos | celí | ||
Animacy=Inan|Case=Acc|Number=Sing|Polarity=Neg | Necelý | ||
Animacy=Inan|Case=Acc|Number=Sing|Polarity=Pos | celý | ||
Animacy=Inan|Case=Acc|Number=Plur|Polarity=Pos | celé | ||
Animacy=Inan|Case=Dat|Number=Sing|Polarity=Pos | celému | ||
Animacy=Inan|Case=Gen|Number=Sing|Polarity=Pos | celého | ||
Animacy=Inan|Case=Ins|Number=Sing|Polarity=Pos | celým | ||
Animacy=Inan|Case=Loc|Number=Sing|Polarity=Pos | celém | ||
Animacy=Inan|Case=Nom|Number=Sing|Polarity=Pos | celý | ||
Animacy=Inan|Case=Nom|Number=Plur|Polarity=Neg | necelé | ||
Case=Acc|Number=Sing|Polarity=Pos | celou | celé | |
Case=Acc|Number=Plur|Polarity=Pos | celé | celá | |
Case=Dat|Number=Sing|Polarity=Pos | celé | celému | |
Case=Gen|Number=Sing|Polarity=Pos | celé | celého | |
Case=Gen|Number=Plur|Polarity=Pos | celých | ||
Case=Ins|Number=Sing|Polarity=Pos | celou | celým | |
Case=Loc|Number=Sing|Polarity=Pos | celé | celém | |
Case=Nom|Number=Sing|Polarity=Pos | celá | celé | |
Case=Nom|Number=Plur|Polarity=Pos | celé |
DET
8112 DET tokens (96% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number[psor]=EMPTY (6716; 83%), Person=EMPTY (6716; 83%), Number=Sing (6651; 82%), Poss=EMPTY (5968; 74%), Animacy=EMPTY (5419; 67%).
DET
tokens may have the following values of Gender
:
Fem
(2346; 29% of non-emptyGender
): která, jeho, té, které, tu, ta, své, svou, kterou, jejíMasc
(2693; 33% of non-emptyGender
): který, ten, jeho, sám, každý, můj, svého, všichni, kteří, svůjNeut
(3073; 38% of non-emptyGender
): to, všechno, tom, tím, toho, tomu, tohle, které, jeho, svéEMPTY
(323): několik, tolik, kolik, několika, mnoho, hodně, moc, víc, málo, mnoha
Paradigm ten | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing | toho | ||
Animacy=Anim|Case=Acc|Number=Plur | ty | ||
Animacy=Anim|Case=Dat|Number=Sing | tomu | ||
Animacy=Anim|Case=Dat|Number=Plur | těm | ||
Animacy=Anim|Case=Gen|Number=Sing | toho | ||
Animacy=Anim|Case=Gen|Number=Plur | těch | ||
Animacy=Anim|Case=Ins|Number=Sing | tím | ||
Animacy=Anim|Case=Ins|Number=Plur | těmi | ||
Animacy=Anim|Case=Loc|Number=Sing | tom | ||
Animacy=Anim|Case=Loc|Number=Plur | těch | ||
Animacy=Anim|Case=Nom|Number=Sing | ten | ||
Animacy=Anim|Case=Nom|Number=Plur | ti | ||
Animacy=Inan|Case=Acc|Number=Sing | ten | ||
Animacy=Inan|Case=Acc|Number=Plur | ty | ||
Animacy=Inan|Case=Dat|Number=Sing | tomu | ||
Animacy=Inan|Case=Dat|Number=Plur | těm | ||
Animacy=Inan|Case=Gen|Number=Sing | toho | ||
Animacy=Inan|Case=Gen|Number=Plur | těch | ||
Animacy=Inan|Case=Ins|Number=Sing | tím | ||
Animacy=Inan|Case=Ins|Number=Plur | těmi | ||
Animacy=Inan|Case=Loc|Number=Sing | tom | ||
Animacy=Inan|Case=Loc|Number=Plur | těch | ||
Animacy=Inan|Case=Nom|Number=Sing | ten | ||
Animacy=Inan|Case=Nom|Number=Plur | ty | ||
Case=Acc|Number=Sing | tu | to | |
Case=Acc|Number=Plur | ty | ta | |
Case=Dat|Number=Sing | té | tomu | |
Case=Dat|Number=Plur | těm | ||
Case=Gen|Number=Sing | té | toho | |
Case=Gen|Number=Sing|Style=Coll | tý | ||
Case=Gen|Number=Plur | těch | těch | |
Case=Ins|Number=Sing | tou | tím | |
Case=Ins|Number=Plur | těmi | těmi | |
Case=Loc|Number=Sing | té | tom | |
Case=Loc|Number=Plur | těch | těch | |
Case=Nom|Number=Sing | ta | to | |
Case=Nom|Number=Plur | ty | ta |
PRON
3591 PRON tokens (25% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (3591; 100%), Person=3 (2937; 82%), PronType=Prs (2937; 82%), Variant=EMPTY (2601; 72%), Number=Sing (2512; 70%), Animacy=Anim (2035; 57%).
PRON
tokens may have the following values of Gender
:
Fem
(1051; 29% of non-emptyGender
): ji, jí, ní, ona, je, ni, nich, níž, ně, jichMasc
(2374; 66% of non-emptyGender
): ho, mu, kdo, je, on, nikdo, něj, někdo, ním, jimNeut
(166; 5% of non-emptyGender
): je, ho, všecko, ně, něj, něm, co, jež, mu, onoEMPTY
(10496): se, si, mi, co, mě, já, nic, něco, nás, ti
Paradigm on | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing|PrepCase=Pre | něho, něj | ||
Animacy=Anim|Case=Acc|Number=Sing | jej, jeho | ||
Animacy=Anim|Case=Acc|Number=Sing|Variant=Short | ho | ||
Animacy=Anim|Case=Acc|Number=Plur|PrepCase=Pre | ně | ||
Animacy=Anim|Case=Acc|Number=Plur | je | ||
Animacy=Anim|Case=Dat|Number=Sing|PrepCase=Pre | němu | ||
Animacy=Anim|Case=Dat|Number=Sing | jemu | ||
Animacy=Anim|Case=Dat|Number=Sing|Variant=Short | mu | ||
Animacy=Anim|Case=Dat|Number=Plur|PrepCase=Pre | nim | ||
Animacy=Anim|Case=Dat|Number=Plur | jim | ||
Animacy=Anim|Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ||
Animacy=Anim|Case=Gen|Number=Sing | jeho | ||
Animacy=Anim|Case=Gen|Number=Sing|Variant=Short | ho | ||
Animacy=Anim|Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
Animacy=Anim|Case=Gen|Number=Plur | jich | ||
Animacy=Anim|Case=Ins|Number=Sing|PrepCase=Pre | ním | ||
Animacy=Anim|Case=Ins|Number=Sing | jím | ||
Animacy=Anim|Case=Ins|Number=Plur|PrepCase=Pre | nimi | ||
Animacy=Anim|Case=Ins|Number=Plur | jimi | ||
Animacy=Anim|Case=Loc|Number=Sing|PrepCase=Pre | něm | ||
Animacy=Anim|Case=Loc|Number=Plur|PrepCase=Pre | nich | ||
Animacy=Anim|Case=Nom|Number=Sing | on | ||
Animacy=Anim|Case=Nom|Number=Plur | oni | ||
Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Pre | něj | ||
Animacy=Inan|Case=Acc|Number=Sing | jej | ||
Animacy=Inan|Case=Acc|Number=Sing|Variant=Short | ho | ||
Animacy=Inan|Case=Acc|Number=Plur|PrepCase=Pre | ně | ||
Animacy=Inan|Case=Acc|Number=Plur | je | ||
Animacy=Inan|Case=Dat|Number=Sing|PrepCase=Pre | němu | ||
Animacy=Inan|Case=Dat|Number=Sing|Variant=Short | mu | ||
Animacy=Inan|Case=Dat|Number=Plur | jim | ||
Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Pre | něj, něho | ||
Animacy=Inan|Case=Gen|Number=Sing|Variant=Short | ho | ||
Animacy=Inan|Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
Animacy=Inan|Case=Gen|Number=Plur | jich | ||
Animacy=Inan|Case=Ins|Number=Sing|PrepCase=Pre | ním | ||
Animacy=Inan|Case=Ins|Number=Plur|PrepCase=Pre | nimi | ||
Animacy=Inan|Case=Ins|Number=Plur | jimi | ||
Animacy=Inan|Case=Loc|Number=Sing|PrepCase=Pre | něm | ||
Animacy=Inan|Case=Loc|Number=Plur|PrepCase=Pre | nich | ||
Animacy=Inan|Case=Nom|Number=Plur | ony | ||
Case=Acc|Number=Sing|PrepCase=Pre | ni | ně, něj, něho | |
Case=Acc|Number=Sing | ji | je | |
Case=Acc|Number=Sing|Style=Coll | jí | ||
Case=Acc|Number=Sing|Variant=Short | ho | ||
Case=Acc|Number=Plur|PrepCase=Pre | ně | ně | |
Case=Acc|Number=Plur | je | je | |
Case=Dat|Number=Sing|PrepCase=Pre | ní | ||
Case=Dat|Number=Sing | jí | ||
Case=Dat|Number=Sing|Variant=Short | mu | ||
Case=Dat|Number=Plur|PrepCase=Pre | nim | nim | |
Case=Dat|Number=Plur | jim | ||
Case=Gen|Number=Sing|PrepCase=Pre | ní | něho, něj | |
Case=Gen|Number=Sing | jí | ||
Case=Gen|Number=Sing|Variant=Short | ho | ||
Case=Gen|Number=Plur|PrepCase=Pre | nich | ||
Case=Gen|Number=Plur | jich | jich | |
Case=Ins|Number=Sing|PrepCase=Pre | ní | ním | |
Case=Ins|Number=Sing | jí | jím | |
Case=Ins|Number=Plur|PrepCase=Pre | nimi | nimi | |
Case=Ins|Number=Plur | jimi | ||
Case=Loc|Number=Sing|PrepCase=Pre | ní | něm | |
Case=Loc|Number=Plur|PrepCase=Pre | nich | nich | |
Case=Nom|Number=Sing | ona | ono | |
Case=Nom|Number=Plur | ony | Ona |
PROPN
2255 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (2143; 95%), Animacy=Anim (1278; 57%), Case=Nom (1278; 57%), NameType=Giv (1248; 55%).
PROPN
tokens may have the following values of Gender
:
Fem
(822; 36% of non-emptyGender
): Valentýna, Alžběta, Veronika, Alice, Praze, Prahy, Čáslavi, Janičku, Magda, MášaMasc
(1391; 62% of non-emptyGender
): Láďa, Leoš, Eduard, Havel, Flajšman, Havlena, Filip, Honza, K, NěmciNeut
(42; 2% of non-emptyGender
): Československu, Německa, zoo, Československa, C, Japonska, Německu, Ruska, Angeles, Gobi
Paradigm K | Masc | Fem |
---|---|---|
Animacy=Anim | K | |
K |
Gender
seems to be lexical feature of PROPN
. 98% lemmas (413) occur only with one value of Gender
.
AUX
1423 AUX tokens (19% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (1423; 100%), Mood=EMPTY (1423; 100%), Person=EMPTY (1423; 100%), Voice=Act (1423; 100%), Tense=Past (1422; 100%), VerbForm=Part (1422; 100%), Polarity=Pos (1266; 89%), Number=Sing (1229; 86%).
AUX
tokens may have the following values of Gender
:
Fem
(420; 30% of non-emptyGender
): byla, byly, nebyla, bývala, nebyly, jsouc, nebývalaMasc
(624; 44% of non-emptyGender
): byl, byli, nebyl, byly, býval, nebyli, nebyly, bývali, nebývalNeut
(379; 27% of non-emptyGender
): bylo, nebylo, byla, bývalo, nebývalo, nebylaEMPTY
(6111): jsem, je, by, bych, jsme, bude, jsou, jsi, není, být
Paradigm být | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | ||
Animacy=Anim|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||
Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | ||
Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | ||
Animacy=Inan|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | ||
Animacy=Inan|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||
Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | ||
Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | ||
Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | nebylo | |
Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla | bylo | |
Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsouc | ||
Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | nebyla | |
Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | byla |
NUM
839 NUM tokens (64% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (834; 99%), NumType=Card (834; 99%), Number=Plur (425; 51%).
NUM
tokens may have the following values of Gender
:
Fem
(268; 32% of non-emptyGender
): dvě, jedna, jednu, jedné, tři, obě, jednou, dvou, čtyři, obouMasc
(467; 56% of non-emptyGender
): jeden, dva, jednoho, oba, tři, čtyři, jedním, dvěma, tisíc, dvouNeut
(104; 12% of non-emptyGender
): jedno, dvě, jednom, tři, jednoho, obě, jedním, půl, čtyř, čtyřiEMPTY
(474): pár, deset, dvacet, pět, třicet, šest, dvanáct, pěti, čtrnáct, devět
Paradigm jeden | Masc | Fem | Neut |
---|---|---|---|
Animacy=Anim|Case=Acc | jednoho, jeden | ||
Animacy=Anim|Case=Dat | jednomu | ||
Animacy=Anim|Case=Gen | jednoho | ||
Animacy=Anim|Case=Ins | jedním | ||
Animacy=Anim|Case=Nom | jeden | ||
Animacy=Anim|Case=Voc | jeden | ||
Animacy=Inan|Case=Acc | jeden | ||
Animacy=Inan|Case=Dat | jednomu | ||
Animacy=Inan|Case=Gen | jednoho | ||
Animacy=Inan|Case=Ins | jedním | ||
Animacy=Inan|Case=Loc | jednom | ||
Animacy=Inan|Case=Nom | jeden | ||
Case=Acc | jednu | jedno | |
Case=Dat | jedné | jednomu | |
Case=Gen | jedné | jednoho | |
Case=Ins | jednou | jedním | |
Case=Loc | jedné | jednom | |
Case=Nom | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (7659; 100%),
NOUN –[det]–> DET (4083; 99%),
VERB –[nsubj]–> NOUN (3064; 72%),
VERB –[conj]–> VERB (2806; 74%),
VERB –[nsubj]–> DET (646; 62%),
VERB –[nsubj]–> PROPN (602; 75%),
NOUN –[nummod]–> NUM (534; 85%),
ADJ –[conj]–> ADJ (527; 97%),
ADJ –[nsubj]–> NOUN (350; 98%),
NOUN –[flat]–> PROPN (201; 100%).