Treebank Statistics: UD_Czech-CAC: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc
, Fem|Neut
, Masc|Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
252252 tokens (51%) have a non-empty value of Gender
.
58315 types (93%) occur at least once with a non-empty value of Gender
.
25196 lemmas (88%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (136144; 28% instances), ADJ (73917; 15% instances), DET (15353; 3% instances), VERB (10199; 2% instances), PROPN (9808; 2% instances), AUX (2821; 1% instances), PRON (2811; 1% instances), NUM (1199; 0% instances).
NOUN
136144 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (95309; 70%), Animacy=EMPTY (79760; 59%).
NOUN
tokens may have the following values of Gender
:
Fem
(55016; 40% of non-emptyGender
): práce, práci, oblasti, době, společnosti, činnosti, výroby, teorie, organizace, stranyMasc
(56384; 41% of non-emptyGender
): roce, roku, pracovníků, úkolů, výsledky, jazyka, procesu, lidí, člověka, úkolyNeut
(24744; 18% of non-emptyGender
): let, hlediska, období, prostředí, zařízení, řešení, plnění, množství, poznání, stoletíEMPTY
(39): luxe, nepusto, pusto, PN, r, I, Las, MDAS, UBV, causa
Paradigm rok | Masc | Neut |
---|---|---|
Animacy=Inan|Case=Acc|Number=Sing | rok | |
Animacy=Inan|Case=Acc|Number=Plur | roky | |
Animacy=Inan|Case=Dat|Number=Sing | roku | |
Animacy=Inan|Case=Gen|Number=Sing | roku, roka | |
Animacy=Inan|Case=Gen|Number=Plur | roků | |
Animacy=Inan|Case=Ins|Number=Sing | rokem | |
Animacy=Inan|Case=Ins|Number=Plur | roky | |
Animacy=Inan|Case=Loc|Number=Sing | roce | |
Animacy=Inan|Case=Nom|Number=Sing | rok | |
Animacy=Inan|Case=Nom|Number=Plur | roky | |
Case=Gen|Number=Plur | let | |
Case=Ins|Number=Plur | lety | |
Case=Loc|Number=Plur | letech |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (11129) occur only with one value of Gender
.
ADJ
73917 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Polarity=Pos (71070; 96%), Degree=Pos (67618; 91%), VerbForm=EMPTY (61724; 84%), Voice=EMPTY (61724; 84%), Number=Sing (47115; 64%), Animacy=EMPTY (44952; 61%).
ADJ
tokens may have the following values of Gender
:
Fem
(29468; 40% of non-emptyGender
): pracovní, socialistické, nové, další, první, základní, současné, druhé, společenské, celéFem,Masc
(1139; 2% of non-emptyGender
): uvedeny, určeny, splněny, provedeny, spojeny, stanoveny, připraveny, vytvořeny, umístěny, charakterizoványFem,Neut
(1143; 2% of non-emptyGender
): věnována, dána, provedena, určena, zahájena, povinna, založena, dokončena, stanovena, vybudovánaMasc
(29026; 39% of non-emptyGender
): další, jednotlivých, první, základní, pracovní, dalších, velký, celý, pracujících, novéNeut
(13141; 18% of non-emptyGender
): možno, možné, nutno, nutné, národního, další, posledních, jiné, řečeno, vědeckéhoEMPTY
(305): Králové, elektro, marxisticko, fit, Karpatsko, dvojí, jedněch, teoreticko, obojí, online
Paradigm uvedený | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Case=Gen|Number=Plur|Polarity=Pos | uvedených | ||||
Animacy=Anim|Case=Nom|Number=Sing|Polarity=Pos | uvedený | ||||
Animacy=Anim|Case=Nom|Number=Plur|Polarity=Pos | uvedení | ||||
Animacy=Anim|Number=Plur|Polarity=Pos|Variant=Short | uvedeni | ||||
Animacy=Inan|Case=Acc|Number=Sing|Polarity=Pos | uvedený | ||||
Animacy=Inan|Case=Acc|Number=Plur|Polarity=Neg | neuvedené | ||||
Animacy=Inan|Case=Acc|Number=Plur|Polarity=Pos | uvedené | ||||
Animacy=Inan|Case=Dat|Number=Plur|Polarity=Pos | uvedeným | ||||
Animacy=Inan|Case=Gen|Number=Sing|Polarity=Pos | uvedeného | ||||
Animacy=Inan|Case=Gen|Number=Plur|Polarity=Pos | uvedených | ||||
Animacy=Inan|Case=Ins|Number=Sing|Polarity=Pos | uvedeným | ||||
Animacy=Inan|Case=Ins|Number=Plur|Polarity=Pos | uvedenými | ||||
Animacy=Inan|Case=Loc|Number=Sing|Polarity=Pos | uvedeném | ||||
Animacy=Inan|Case=Loc|Number=Plur|Polarity=Pos | uvedených | ||||
Animacy=Inan|Case=Nom|Number=Sing|Polarity=Pos | uvedený | ||||
Animacy=Inan|Case=Nom|Number=Plur|Polarity=Pos | uvedené | ||||
Animacy=Inan|Number=Plur|Polarity=Pos|Variant=Short | uvedeny | ||||
Case=Acc|Number=Sing|Polarity=Pos | uvedenou | uvedené | |||
Case=Acc|Number=Plur|Polarity=Pos | uvedené | Uvedená | |||
Case=Dat|Number=Sing|Polarity=Pos | uvedené | uvedenému | |||
Case=Dat|Number=Plur|Polarity=Pos | uvedeným | ||||
Case=Gen|Number=Sing|Polarity=Pos | uvedené | uvedeného | |||
Case=Gen|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
Case=Ins|Number=Sing|Polarity=Pos | uvedenou | uvedeným | |||
Case=Ins|Number=Plur|Polarity=Pos | uvedenými | uvedenými | |||
Case=Loc|Number=Sing|Polarity=Pos | uvedené | uvedeném | |||
Case=Loc|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
Case=Nom|Number=Sing|Polarity=Pos | uvedená | uvedené | |||
Case=Nom|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
Number=Sing|Polarity=Pos|Variant=Short | uveden | uvedeno | |||
Number=Plur,Sing|Polarity=Pos|Variant=Short | uvedena |
DET
15353 DET tokens (77% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number[psor]=EMPTY (13829; 90%), Person=EMPTY (13829; 90%), Animacy=EMPTY (12927; 84%), Poss=EMPTY (12641; 82%), Number=Sing (12219; 80%).
DET
tokens may have the following values of Gender
:
Fem
(4765; 31% of non-emptyGender
): které, která, této, své, naší, tato, svou, tyto, kterou, tutoFem,Neut
(136; 1% of non-emptyGender
): naše, moje, vaše, tvojeMasc
(3930; 26% of non-emptyGender
): který, které, kteří, tento, každý, tyto, sám, některé, svůj, tenMasc,Neut
(3618; 24% of non-emptyGender
): tím, tom, toho, tomu, tohoto, tomto, našeho, svého, našem, svýmNeut
(2904; 19% of non-emptyGender
): to, které, toto, která, své, tato, každé, takové, některá, jejíEMPTY
(4458): jejich, jeho, těchto, některých, několik, svých, mnoho, našich, jehož, jejichž
Paradigm můj | Fem,Neut | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Case=Acc|Number=Sing|Number[psor]=Plur | našeho | ||||
Animacy=Anim|Case=Nom|Number=Plur|Number[psor]=Sing | moji | ||||
Animacy=Anim|Case=Nom|Number=Plur|Number[psor]=Plur | naši | ||||
Animacy=Inan|Case=Acc|Number=Sing|Number[psor]=Sing | můj | ||||
Animacy=Inan|Case=Acc|Number=Sing|Number[psor]=Plur | náš | ||||
Animacy=Inan|Case=Nom|Number=Plur|Number[psor]=Plur | naše | ||||
Case=Acc|Number=Sing|Number[psor]=Sing | mou | moje | |||
Case=Acc|Number=Sing|Number[psor]=Plur | naši | naše | |||
Case=Acc|Number=Plur|Number[psor]=Sing | mé | mé | |||
Case=Dat|Number=Sing|Number[psor]=Sing | mému | mé | |||
Case=Dat|Number=Sing|Number[psor]=Plur | našemu | naší | |||
Case=Gen|Number=Sing|Number[psor]=Sing | mého | mé, mojí | |||
Case=Gen|Number=Sing|Number[psor]=Plur | našeho | naší | |||
Case=Ins|Number=Sing|Number[psor]=Sing | mým | mojí, mou | |||
Case=Ins|Number=Sing|Number[psor]=Plur | naším | naší | |||
Case=Ins|Number=Dual|Number[psor]=Sing | mýma | ||||
Case=Ins|Number=Dual|Number[psor]=Plur | našima | ||||
Case=Loc|Number=Sing|Number[psor]=Sing | mém | mé | |||
Case=Loc|Number=Sing|Number[psor]=Plur | našem | naší | |||
Case=Nom|Number=Sing|Number[psor]=Sing | moje | můj | má | mé | |
Case=Nom|Number=Sing|Number[psor]=Plur | naše | náš | |||
Case=Nom|Number=Plur|Number[psor]=Sing | moje | Mé | |||
Case=Nom|Number=Plur|Number[psor]=Plur | naše |
VERB
10199 VERB tokens (26% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=EMPTY (10199; 100%), Person=EMPTY (10199; 100%), Voice=Act (10199; 100%), Tense=Past (10166; 100%), VerbForm=Part (10165; 100%), Polarity=Pos (9431; 92%).
VERB
tokens may have the following values of Gender
:
Fem
(5; 0% of non-emptyGender
): Počínajíc, chtíc, nechtíc, ponechávajíc, přejímajícFem,Masc
(1129; 11% of non-emptyGender
): měly, mohly, staly, vznikly, začaly, vytvořily, vedly, dosáhly, neměly, ukázalyFem,Neut
(2008; 20% of non-emptyGender
): měla, mohla, stala, začala, dosáhla, vznikla, dala, zůstala, objevila, přišlaMasc
(5586; 55% of non-emptyGender
): měl, mohli, mohl, měli, řekl, chtěl, stal, ukázal, dostal, dalNeut
(1471; 14% of non-emptyGender
): došlo, mělo, podařilo, mohlo, stalo, ukázalo, šlo, začalo, dosáhlo, projeviloEMPTY
(28549): má, mají, musí, může, jde, lze, mohou, můžeme, mít, patří
Paradigm chtít | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nechtěli | ||||
Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | chtěli | ||||
Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | Nechtěly | ||||
Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | chtěly | ||||
Aspect=Imp|Number=Sing|Polarity=Neg|Tense=Pres|VerbForm=Conv | nechtíc | ||||
Aspect=Imp|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | chtíc | ||||
Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nechtěl | nechtělo | |||
Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | chtěl | chtělo | |||
Number=Plur,Sing|Polarity=Pos|Tense=Past|VerbForm=Part | chtěla |
PROPN
9808 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Abbr=EMPTY (7936; 81%), Number=Sing (7192; 73%).
PROPN
tokens may have the following values of Gender
:
Fem
(3431; 35% of non-emptyGender
): KSČ, Praze, Praha, ČSAV, ČSSR, SSM, Škoda, Prahy, ČSR, NDRMasc
(5431; 55% of non-emptyGender
): SSSR, ÚJČ, Fučík, Erben, TIBA, Karel, Horálek, OV, USA, VÚMNeut
(946; 10% of non-emptyGender
): ROH, Československa, GŘ, Brně, Slovensku, Československu, MZVŽ, Brno, RVHP, ÚstíEMPTY
(11): KRB, Opeplatis, Ganges, Gaudeamus, TOK, igitur
Paradigm KSČ | Masc | Fem |
---|---|---|
Animacy=Inan | KSČ | |
KSČ |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (3427) occur only with one value of Gender
.
AUX
2821 AUX tokens (18% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (2821; 100%), Mood=EMPTY (2821; 100%), Person=EMPTY (2821; 100%), Voice=Act (2821; 100%), Tense=Past (2820; 100%), VerbForm=Part (2820; 100%), Polarity=Pos (2588; 92%), Number=Sing (1549; 55%).
AUX
tokens may have the following values of Gender
:
Fem
(3; 0% of non-emptyGender
): byla, byly, jsoucFem,Masc
(509; 18% of non-emptyGender
): byly, nebyly, bývalyFem,Neut
(633; 22% of non-emptyGender
): byla, nebyla, bývalaMasc
(869; 31% of non-emptyGender
): byl, byli, nebyl, nebyli, býval, BývaliNeut
(807; 29% of non-emptyGender
): bylo, nebylo, bývalo, bylaEMPTY
(13299): je, jsou, by, bude, být, není, jsme, jsem, budou, bychom
Paradigm být | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||||
Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | ||||
Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | ||||
Animacy=Inan|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||||
Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | ||||
Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | ||||
Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | nebylo | |||
Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | byla | bylo | ||
Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsouc | ||||
Number=Plur,Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | ||||
Number=Plur,Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla | ||||
Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | byla |
PRON
2811 PRON tokens (18% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (2811; 100%), Variant=EMPTY (2499; 89%), Number=Sing (2067; 74%), Person=EMPTY (1539; 55%), PrepCase=EMPTY (1418; 50%).
PRON
tokens may have the following values of Gender
:
Fem
(858; 31% of non-emptyGender
): ji, všechny, níž, ní, jí, jež, ni, veškeré, jíž, veškerouMasc
(620; 22% of non-emptyGender
): všechny, všichni, kdo, někdo, nikdo, jeho, jenž, on, oni, veškeréMasc,Neut
(996; 35% of non-emptyGender
): mu, ho, němž, jej, něm, něho, ním, něj, něhož, všehoNeut
(337; 12% of non-emptyGender
): všechno, vše, je, všechna, jež, ně, co, ono, veškeré, všeckoEMPTY
(13175): se, si, co, všech, nás, je, nám, nich, nichž, jim
Paradigm on | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Anim|Case=Nom|Number=Plur | oni | |||
Case=Acc|Number=Sing|PrepCase=Npr | jeho | jej | ji | je |
Case=Acc|Number=Sing|PrepCase=Pre | něj, něho | ni | ně | |
Case=Acc|Number=Sing|Variant=Short | ho | |||
Case=Dat|Number=Sing|PrepCase=Npr | jemu | jí | ||
Case=Dat|Number=Sing|PrepCase=Pre | němu | ní | ||
Case=Dat|Number=Sing|Variant=Short | mu | |||
Case=Gen|Number=Sing|PrepCase=Npr | jeho | jej | jí | |
Case=Gen|Number=Sing|PrepCase=Pre | něho, něj | ní | ||
Case=Ins|Number=Sing|PrepCase=Npr | jím | jí | ||
Case=Ins|Number=Sing|PrepCase=Pre | ním | ní | ||
Case=Loc|Number=Sing|PrepCase=Pre | něm | ní | ||
Case=Nom|Number=Sing | on | ona | ono | |
Case=Nom|Number=Plur | ony |
NUM
1199 NUM tokens (16% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (1139; 95%), NumType=Card (1139; 95%), Number=Sing (798; 67%).
NUM
tokens may have the following values of Gender
:
Fem
(331; 28% of non-emptyGender
): jedné, jednu, jedna, jednou, třetinu, třetina, třetiny, čtvrtiny, dvanáctinu, třetinouFem,Neut
(191; 16% of non-emptyGender
): dvě, oběMasc
(387; 32% of non-emptyGender
): jeden, dva, oba, jednohoMasc,Neut
(241; 20% of non-emptyGender
): jednoho, jedním, jednom, jednomuNeut
(49; 4% of non-emptyGender
): jednoEMPTY
(6108): #, dvou, tři, obou, dvěma, tří, pět, čtyři, tisíc, půl
Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Anim|Case=Acc | jednoho | |||
Animacy=Inan|Case=Acc | jeden | |||
Case=Acc | jednu | jedno | ||
Case=Dat | jednomu | jedné | ||
Case=Gen | jednoho | jedné | ||
Case=Ins | jedním | jednou | ||
Case=Loc | jednom | jedné | ||
Case=Nom | jeden | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (59362; 99%),
NOUN –[conj]–> NOUN (7222; 50%),
ADJ –[conj]–> ADJ (3669; 92%),
ADJ –[nsubj]–> NOUN (1920; 77%),
VERB –[conj]–> VERB (1077; 61%),
NOUN –[flat]–> PROPN (855; 100%),
PROPN –[conj]–> PROPN (763; 64%),
NOUN –[appos]–> NOUN (750; 53%),
PROPN –[flat]–> PROPN (613; 99%),
PROPN –[amod]–> ADJ (534; 85%).