Treebank Statistics: UD_Czech-CAC: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc, Fem|Neut, Masc|Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
252249 tokens (51%) have a non-empty value of Gender.
58313 types (93%) occur at least once with a non-empty value of Gender.
25194 lemmas (88%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (136143; 28% instances), ADJ (73916; 15% instances), DET (15352; 3% instances), VERB (10199; 2% instances), PROPN (9808; 2% instances), AUX (2821; 1% instances), PRON (2811; 1% instances), NUM (1199; 0% instances).
NOUN
136143 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (95309; 70%), Animacy=EMPTY (79759; 59%).
NOUN tokens may have the following values of Gender:
Fem(55016; 40% of non-emptyGender): práce, práci, oblasti, době, společnosti, činnosti, výroby, teorie, organizace, stranyMasc(56384; 41% of non-emptyGender): roce, roku, pracovníků, úkolů, výsledky, jazyka, procesu, lidí, člověka, úkolyNeut(24743; 18% of non-emptyGender): let, hlediska, období, prostředí, zařízení, řešení, plnění, množství, poznání, stoletíEMPTY(39): luxe, nepusto, pusto, PN, r, I, Las, MDAS, UBV, causa
| Paradigm rok | Masc | Neut |
|---|---|---|
| Animacy=Inan|Case=Acc|ExtPos=ADV|Number=Sing | rok | |
| Animacy=Inan|Case=Acc|Number=Sing | rok | |
| Animacy=Inan|Case=Acc|Number=Plur | roky | |
| Animacy=Inan|Case=Dat|Number=Sing | roku | |
| Animacy=Inan|Case=Gen|Number=Sing | roku, roka | |
| Animacy=Inan|Case=Gen|Number=Plur | roků | |
| Animacy=Inan|Case=Ins|Number=Sing | rokem | |
| Animacy=Inan|Case=Ins|Number=Plur | roky | |
| Animacy=Inan|Case=Loc|Number=Sing | roce | |
| Animacy=Inan|Case=Nom|Number=Sing | rok | |
| Animacy=Inan|Case=Nom|Number=Plur | roky | |
| Case=Gen|Number=Plur | let | |
| Case=Ins|Number=Plur | lety | |
| Case=Loc|Number=Plur | letech |
Gender seems to be lexical feature of NOUN. 100% lemmas (11128) occur only with one value of Gender.
ADJ
73916 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Polarity=Pos (71069; 96%), Degree=Pos (67618; 91%), VerbForm=EMPTY (61684; 83%), Voice=EMPTY (61684; 83%), Number=Sing (47114; 64%), Animacy=EMPTY (44951; 61%).
ADJ tokens may have the following values of Gender:
Fem(29468; 40% of non-emptyGender): pracovní, socialistické, nové, další, první, základní, současné, druhé, společenské, celéFem,Masc(1139; 2% of non-emptyGender): uvedeny, určeny, splněny, provedeny, spojeny, stanoveny, připraveny, vytvořeny, umístěny, charakterizoványFem,Neut(1143; 2% of non-emptyGender): věnována, dána, provedena, určena, zahájena, povinna, založena, dokončena, stanovena, vybudovánaMasc(29026; 39% of non-emptyGender): další, jednotlivých, první, základní, pracovní, dalších, velký, celý, pracujících, novéNeut(13140; 18% of non-emptyGender): možno, možné, nutno, nutné, národního, další, posledních, jiné, řečeno, vědeckéhoEMPTY(304): Králové, elektro, marxisticko, fit, Karpatsko, dvojí, jedněch, teoreticko, obojí, online
| Paradigm uvedený | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Case=Gen|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Anim|Case=Nom|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Anim|Case=Nom|Number=Plur|Polarity=Pos | uvedení | ||||
| Animacy=Anim|Number=Plur|Polarity=Pos|Variant=Short | uvedeni | ||||
| Animacy=Inan|Case=Acc|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Inan|Case=Acc|Number=Plur|Polarity=Neg | neuvedené | ||||
| Animacy=Inan|Case=Acc|Number=Plur|Polarity=Pos | uvedené | ||||
| Animacy=Inan|Case=Dat|Number=Plur|Polarity=Pos | uvedeným | ||||
| Animacy=Inan|Case=Gen|Number=Sing|Polarity=Pos | uvedeného | ||||
| Animacy=Inan|Case=Gen|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Inan|Case=Ins|Number=Sing|Polarity=Pos | uvedeným | ||||
| Animacy=Inan|Case=Ins|Number=Plur|Polarity=Pos | uvedenými | ||||
| Animacy=Inan|Case=Loc|Number=Sing|Polarity=Pos | uvedeném | ||||
| Animacy=Inan|Case=Loc|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Inan|Case=Nom|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Inan|Case=Nom|Number=Plur|Polarity=Pos | uvedené | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos|Variant=Short | uvedeny | ||||
| Case=Acc|Number=Sing|Polarity=Pos | uvedenou | uvedené | |||
| Case=Acc|Number=Plur|Polarity=Pos | uvedené | Uvedená | |||
| Case=Dat|Number=Sing|Polarity=Pos | uvedené | uvedenému | |||
| Case=Dat|Number=Plur|Polarity=Pos | uvedeným | ||||
| Case=Gen|Number=Sing|Polarity=Pos | uvedené | uvedeného | |||
| Case=Gen|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
| Case=Ins|Number=Sing|Polarity=Pos | uvedenou | uvedeným | |||
| Case=Ins|Number=Plur|Polarity=Pos | uvedenými | uvedenými | |||
| Case=Loc|Number=Sing|Polarity=Pos | uvedené | uvedeném | |||
| Case=Loc|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
| Case=Nom|Number=Sing|Polarity=Pos | uvedená | uvedené | |||
| Case=Nom|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
| Number=Sing|Polarity=Pos|Variant=Short | uveden | uvedeno | |||
| Number=Plur,Sing|Polarity=Pos|Variant=Short | uvedena |
DET
15352 DET tokens (77% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number[psor]=EMPTY (13828; 90%), Person=EMPTY (13828; 90%), Animacy=EMPTY (12925; 84%), Poss=EMPTY (12640; 82%), Number=Sing (12218; 80%).
DET tokens may have the following values of Gender:
Fem(4764; 31% of non-emptyGender): které, která, této, své, naší, tato, svou, tyto, kterou, tutoFem,Neut(136; 1% of non-emptyGender): naše, moje, vaše, tvojeMasc(3931; 26% of non-emptyGender): který, které, kteří, tento, každý, tyto, sám, některé, svůj, tenMasc,Neut(3616; 24% of non-emptyGender): tím, tom, toho, tomu, tohoto, tomto, našeho, svého, našem, svýmNeut(2905; 19% of non-emptyGender): to, které, toto, která, své, tato, každé, takové, některá, jejíEMPTY(4458): jejich, jeho, těchto, některých, několik, svých, mnoho, našich, jehož, jejichž
| Paradigm můj | Fem,Neut | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing|Number[psor]=Plur | našeho | ||||
| Animacy=Anim|Case=Nom|Number=Plur|Number[psor]=Sing | moji | ||||
| Animacy=Anim|Case=Nom|Number=Plur|Number[psor]=Plur | naši | ||||
| Animacy=Inan|Case=Acc|Number=Sing|Number[psor]=Sing | můj | ||||
| Animacy=Inan|Case=Acc|Number=Sing|Number[psor]=Plur | náš | ||||
| Animacy=Inan|Case=Nom|Number=Plur|Number[psor]=Plur | naše | ||||
| Case=Acc|Number=Sing|Number[psor]=Sing | mou | moje | |||
| Case=Acc|Number=Sing|Number[psor]=Plur | naši | naše | |||
| Case=Acc|Number=Plur|Number[psor]=Sing | mé | mé | |||
| Case=Dat|Number=Sing|Number[psor]=Sing | mému | mé | |||
| Case=Dat|Number=Sing|Number[psor]=Plur | našemu | naší | |||
| Case=Gen|Number=Sing|Number[psor]=Sing | mého | mé, mojí | |||
| Case=Gen|Number=Sing|Number[psor]=Plur | našeho | naší | |||
| Case=Ins|Number=Sing|Number[psor]=Sing | mým | mojí, mou | |||
| Case=Ins|Number=Sing|Number[psor]=Plur | naším | naší | |||
| Case=Ins|Number=Dual|Number[psor]=Sing | mýma | ||||
| Case=Ins|Number=Dual|Number[psor]=Plur | našima | ||||
| Case=Loc|Number=Sing|Number[psor]=Sing | mém | mé | |||
| Case=Loc|Number=Sing|Number[psor]=Plur | našem | naší | |||
| Case=Nom|Number=Sing|Number[psor]=Sing | moje | můj | má | mé | |
| Case=Nom|Number=Sing|Number[psor]=Plur | naše | náš | |||
| Case=Nom|Number=Plur|Number[psor]=Sing | moje | Mé | |||
| Case=Nom|Number=Plur|Number[psor]=Plur | naše |
VERB
10199 VERB tokens (26% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (10199; 100%), Person=EMPTY (10199; 100%), Voice=Act (10199; 100%), Tense=Past (10166; 100%), VerbForm=Part (10165; 100%), Polarity=Pos (9431; 92%).
VERB tokens may have the following values of Gender:
Fem(5; 0% of non-emptyGender): Počínajíc, chtíc, nechtíc, ponechávajíc, přejímajícFem,Masc(1129; 11% of non-emptyGender): měly, mohly, staly, vznikly, začaly, vytvořily, vedly, dosáhly, neměly, ukázalyFem,Neut(2008; 20% of non-emptyGender): měla, mohla, stala, začala, dosáhla, vznikla, dala, zůstala, objevila, přišlaMasc(5586; 55% of non-emptyGender): měl, mohli, mohl, měli, řekl, chtěl, stal, ukázal, dostal, dalNeut(1471; 14% of non-emptyGender): došlo, mělo, podařilo, mohlo, stalo, ukázalo, šlo, začalo, dosáhlo, projeviloEMPTY(28549): má, mají, musí, může, jde, lze, mohou, můžeme, mít, patří
| Paradigm chtít | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nechtěli | ||||
| Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | chtěli | ||||
| Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | Nechtěly | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | chtěly | ||||
| Aspect=Imp|ExtPos=ADV|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | chtíc | ||||
| Aspect=Imp|Number=Sing|Polarity=Neg|Tense=Pres|VerbForm=Conv | nechtíc | ||||
| Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nechtěl | nechtělo | |||
| Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | chtěl | chtělo | |||
| Number=Plur,Sing|Polarity=Pos|Tense=Past|VerbForm=Part | chtěla |
PROPN
9808 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Abbr=EMPTY (7936; 81%), Number=Sing (7192; 73%).
PROPN tokens may have the following values of Gender:
Fem(3431; 35% of non-emptyGender): KSČ, Praze, Praha, ČSAV, ČSSR, SSM, Škoda, Prahy, ČSR, NDRMasc(5431; 55% of non-emptyGender): SSSR, ÚJČ, Fučík, Erben, TIBA, Karel, Horálek, OV, USA, VÚMNeut(946; 10% of non-emptyGender): ROH, Československa, GŘ, Brně, Slovensku, Československu, MZVŽ, Brno, RVHP, ÚstíEMPTY(11): KRB, Opeplatis, Ganges, Gaudeamus, TOK, igitur
| Paradigm KSČ | Masc | Fem |
|---|---|---|
| Animacy=Inan | KSČ | |
| KSČ |
Gender seems to be lexical feature of PROPN. 99% lemmas (3427) occur only with one value of Gender.
AUX
2821 AUX tokens (18% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Aspect=Imp (2821; 100%), Mood=EMPTY (2821; 100%), Person=EMPTY (2821; 100%), Voice=Act (2821; 100%), Tense=Past (2820; 100%), VerbForm=Part (2820; 100%), Polarity=Pos (2588; 92%), Number=Sing (1549; 55%).
AUX tokens may have the following values of Gender:
Fem(3; 0% of non-emptyGender): byla, byly, jsoucFem,Masc(509; 18% of non-emptyGender): byly, nebyly, bývalyFem,Neut(633; 22% of non-emptyGender): byla, nebyla, bývalaMasc(869; 31% of non-emptyGender): byl, byli, nebyl, nebyli, býval, BývaliNeut(807; 29% of non-emptyGender): bylo, nebylo, bývalo, bylaEMPTY(13299): je, jsou, by, bude, být, není, jsme, jsem, budou, bychom
| Paradigm být | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||||
| Animacy=Anim|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyli | ||||
| Animacy=Anim|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byli | ||||
| Animacy=Inan|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | ||||
| Animacy=Inan|Number=Plur|Polarity=Neg|Tense=Past|VerbForm=Part | nebyly | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | ||||
| Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyl | nebylo | |||
| Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byl | byla | bylo | ||
| Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Conv | jsouc | ||||
| Number=Plur,Sing|Polarity=Neg|Tense=Past|VerbForm=Part | nebyla | ||||
| Number=Plur,Sing|Polarity=Pos|Tense=Past|VerbForm=Part | byla | ||||
| Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part | byly | byla |
PRON
2811 PRON tokens (18% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (2811; 100%), Variant=EMPTY (2499; 89%), Number=Sing (2067; 74%), Person=EMPTY (1539; 55%), PrepCase=EMPTY (1418; 50%).
PRON tokens may have the following values of Gender:
Fem(858; 31% of non-emptyGender): ji, všechny, níž, ní, jí, jež, ni, veškeré, jíž, veškerouMasc(620; 22% of non-emptyGender): všechny, všichni, kdo, někdo, nikdo, jeho, jenž, on, oni, veškeréMasc,Neut(996; 35% of non-emptyGender): mu, ho, němž, jej, něm, něho, ním, něj, něhož, všehoNeut(337; 12% of non-emptyGender): všechno, vše, je, všechna, jež, ně, co, ono, veškeré, všeckoEMPTY(13175): se, si, co, všech, nás, je, nám, nich, nichž, jim
| Paradigm on | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Nom|Number=Plur | oni | |||
| Case=Acc|Number=Sing|PrepCase=Npr | jeho | jej | ji | je |
| Case=Acc|Number=Sing|PrepCase=Pre | něj, něho | ni | ně | |
| Case=Acc|Number=Sing|Variant=Short | ho | |||
| Case=Dat|Number=Sing|PrepCase=Npr | jemu | jí | ||
| Case=Dat|Number=Sing|PrepCase=Pre | němu | ní | ||
| Case=Dat|Number=Sing|Variant=Short | mu | |||
| Case=Gen|Number=Sing|PrepCase=Npr | jeho | jej | jí | |
| Case=Gen|Number=Sing|PrepCase=Pre | něho, něj | ní | ||
| Case=Ins|Number=Sing|PrepCase=Npr | jím | jí | ||
| Case=Ins|Number=Sing|PrepCase=Pre | ním | ní | ||
| Case=Loc|Number=Sing|PrepCase=Pre | něm | ní | ||
| Case=Nom|Number=Sing | on | ona | ono | |
| Case=Nom|Number=Plur | ony |
NUM
1199 NUM tokens (16% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (1139; 95%), NumType=Card (1139; 95%), Number=Sing (798; 67%).
NUM tokens may have the following values of Gender:
Fem(331; 28% of non-emptyGender): jedné, jednu, jedna, jednou, třetinu, třetina, třetiny, čtvrtiny, dvanáctinu, třetinouFem,Neut(191; 16% of non-emptyGender): dvě, oběMasc(387; 32% of non-emptyGender): jeden, dva, oba, jednohoMasc,Neut(241; 20% of non-emptyGender): jednoho, jedním, jednom, jednomuNeut(49; 4% of non-emptyGender): jednoEMPTY(6108): #, dvou, tři, obou, dvěma, tří, pět, čtyři, tisíc, půl
| Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Acc | jednoho | |||
| Animacy=Inan|Case=Acc | jeden | |||
| Case=Acc | jednu | jedno | ||
| Case=Dat | jednomu | jedné | ||
| Case=Gen | jednoho | jedné | ||
| Case=Ins | jedním | jednou | ||
| Case=Loc | jednom | jedné | ||
| Case=Nom | jeden | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (59192; 99%),
NOUN –[conj]–> NOUN (7193; 50%),
ADJ –[conj]–> ADJ (3668; 92%),
ADJ –[nsubj]–> NOUN (1920; 77%),
VERB –[conj]–> VERB (1077; 61%),
NOUN –[flat]–> PROPN (855; 100%),
PROPN –[conj]–> PROPN (763; 64%),
NOUN –[appos]–> NOUN (753; 53%),
PROPN –[flat]–> PROPN (611; 99%),
PROPN –[amod]–> ADJ (533; 86%).