Treebank Statistics: UD_Czech-CLTT: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc, Fem|Neut, Masc|Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
18851 tokens (52%) have a non-empty value of Gender.
3556 types (78%) occur at least once with a non-empty value of Gender.
1592 lemmas (59%) occur at least once with a non-empty value of Gender.
The feature is used with 7 part-of-speech tags: NOUN (11062; 31% instances), ADJ (6637; 18% instances), DET (843; 2% instances), VERB (114; 0% instances), PRON (90; 0% instances), AUX (59; 0% instances), NUM (46; 0% instances).
NOUN
11062 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (7820; 71%), Animacy=EMPTY (6603; 60%).
NOUN tokens may have the following values of Gender:
Fem(4458; 40% of non-emptyGender): jednotky, jednotka, položka, závěrky, jednotek, společnosti, položek, informace, položky, závěrkuMasc(4459; 40% of non-emptyGender): majetku, dni, závazků, dne, majetek, odstavce, případě, náklady, závazky, ziskuNeut(2145; 19% of non-emptyGender): období, ocenění, účetnictví, ustanovení, vymezení, sestavení, účtování, uspořádání, použití, hospodaření
| Paradigm rok | Masc | Neut |
|---|---|---|
| Animacy=Inan|Case=Acc|Number=Sing | rok | |
| Animacy=Inan|Case=Gen|Number=Sing | roku | |
| Animacy=Inan|Case=Ins|Number=Sing | rokem | |
| Animacy=Inan|Case=Loc|Number=Sing | roce | |
| Animacy=Inan|Case=Nom|Number=Sing | rok | |
| Case=Gen|Number=Plur | let | |
| Case=Loc|Number=Plur | letech |
Gender seems to be lexical feature of NOUN. 99% lemmas (848) occur only with one value of Gender.
ADJ
6637 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Polarity=Pos (6462; 97%), Degree=Pos (6247; 94%), Number=Sing (4127; 62%), Animacy=EMPTY (3966; 60%).
ADJ tokens may have the following values of Gender:
Fem(3035; 46% of non-emptyGender): účetní, účetních, konsolidované, konsolidující, výroční, reálnou, finanční, pořizovací, českou, uvedenéFem,Masc(160; 2% of non-emptyGender): povinny, obchodovány, uvedeny, zahrnuty, vykázány, účtovány, uzavřeny, vyjádřeny, známy, ověřenyFem,Neut(78; 1% of non-emptyGender): povinna, sestavena, zavedena, uvedena, známa, dotčena, oprávněna, schopna, vyhlášena, vykazovánaMasc(2576; 39% of non-emptyGender): účetní, účetních, účetního, obchodního, peněžních, právní, právních, zvláštního, právního, zvláštníchNeut(788; 12% of non-emptyGender): účetního, účetní, účetním, obsahové, jiných, stanoveno, technické, účetních, minulé, účinnémEMPTY(6): něm, do, pod
| Paradigm uvedený | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Plur|Polarity=Neg | neuvedené | ||||
| Animacy=Inan|Case=Acc|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Inan|Case=Acc|Number=Plur|Polarity=Pos | uvedené | ||||
| Animacy=Inan|Case=Dat|Number=Sing|Polarity=Pos | uvedenému | ||||
| Animacy=Inan|Case=Gen|Number=Sing|Polarity=Pos | uvedeného | ||||
| Animacy=Inan|Case=Gen|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Inan|Case=Ins|Number=Sing|Polarity=Pos | uvedeným | ||||
| Animacy=Inan|Case=Loc|Number=Sing|Polarity=Pos | uvedeném | ||||
| Animacy=Inan|Case=Loc|Number=Plur|Polarity=Pos | uvedených | ||||
| Animacy=Inan|Case=Nom|Number=Sing|Polarity=Pos | uvedený | ||||
| Animacy=Inan|Case=Nom|Number=Plur|Polarity=Pos | uvedené | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedeny | ||||
| Case=Acc|Number=Sing|Polarity=Pos | uvedené | ||||
| Case=Acc|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
| Case=Dat|Number=Sing|Polarity=Pos | uvedené | ||||
| Case=Dat|Number=Plur|Polarity=Pos | uvedeným | ||||
| Case=Gen|Number=Sing|Polarity=Neg | neuvedené | ||||
| Case=Gen|Number=Sing|Polarity=Pos | uvedené | ||||
| Case=Gen|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
| Case=Ins|Number=Sing|Polarity=Pos | uvedenou | ||||
| Case=Ins|Number=Plur|Polarity=Pos | uvedenými | ||||
| Case=Loc|Number=Sing|Polarity=Pos | uvedené | ||||
| Case=Loc|Number=Plur|Polarity=Pos | uvedených | ||||
| Case=Nom|Number=Sing|Polarity=Neg | neuvedená | ||||
| Case=Nom|Number=Sing|Polarity=Pos | uvedená | ||||
| Case=Nom|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
| Number=Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uveden | uvedeno | |||
| Number=Plur,Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedena |
DET
843 DET tokens (74% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number[psor]=EMPTY (813; 96%), Person=EMPTY (813; 96%), Poss=EMPTY (792; 94%), Number=Sing (595; 71%).
DET tokens may have the following values of Gender:
Fem(385; 46% of non-emptyGender): které, této, která, tato, tyto, kterou, tuto, své, její, všechnyMasc(180; 21% of non-emptyGender): které, který, tento, tyto, všechny, každého, každý, svůj, takový, jejíMasc,Neut(198; 23% of non-emptyGender): tohoto, kterém, kterému, tomto, kterým, tímto, kterého, jejího, jejím, tohoNeut(80; 9% of non-emptyGender): které, to, která, toto, všechna, její, některá, každé, samo, takovéEMPTY(292): jejich, jeho, těchto, kterých, všech, kterým, jejichž, jehož, kterými, svých
| Paradigm který | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Inan|Case=Acc|Number=Sing | který | |||
| Animacy=Inan|Case=Nom|Number=Plur | které | |||
| Case=Acc|Number=Sing | kterou | které | ||
| Case=Acc|Number=Plur | které | které | ||
| Case=Dat|Number=Sing | kterému | které | ||
| Case=Gen|Number=Sing | kterého | které | ||
| Case=Ins|Number=Sing | kterým | kterou | ||
| Case=Loc|Number=Sing | kterém | které | ||
| Case=Nom|Number=Sing | který | která | které | |
| Case=Nom|Number=Plur | které | která |
VERB
114 VERB tokens (6% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (114; 100%), Person=EMPTY (114; 100%), Voice=Act (114; 100%), Tense=Past (113; 99%), VerbForm=Part (113; 99%), Polarity=Pos (105; 92%).
VERB tokens may have the following values of Gender:
Fem,Masc(33; 29% of non-emptyGender): přestaly, staly, nastaly, dosáhly, existovaly, překročily, rozhodly, navazovaly, neprošly, nesplnilyFem,Neut(51; 45% of non-emptyGender): nabyla, určila, překročila, sestavila, stanovila, podávala, provedla, dospěla, mohla, mělaMasc(11; 10% of non-emptyGender): Dal, dozvěděl, mohl, nepožádali, nezahájil, počínaje, přesáhl, rovnal, schválili, stalNeut(19; 17% of non-emptyGender): došlo, trvalo, započalo, mohlo, přešlo, uzavřeloEMPTY(1705): obsahuje, rozumí, může, uvede, mohou, použijí, stanoví, vést, musí, účtuje
| Paradigm moci | Fem,Neut | Masc | Neut |
|---|---|---|---|
| Number=Sing | mohl | mohlo | |
| Number=Plur,Sing | mohla |
PRON
90 PRON tokens (14% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (90; 100%), Variant=EMPTY (89; 99%), Number=Sing (85; 94%), Person=EMPTY (54; 60%), PronType=Rel (46; 51%).
PRON tokens may have the following values of Gender:
Fem(28; 31% of non-emptyGender): jí, ji, ní, níž, veškeré, jež, nižMasc(6; 7% of non-emptyGender): jenž, veškeréMasc,Neut(55; 61% of non-emptyGender): němž, jej, němuž, jehož, nějž, něj, veškerého, ho, jemu, jímžNeut(1; 1% of non-emptyGender): veškeréEMPTY(532): se, nichž, je, jim, jimiž, nich, sobě, jimi, nimi, ně
| Paradigm veškerý | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Inan|Case=Nom|Number=Plur | veškeré | |||
| Case=Acc|Number=Sing | veškeré | |||
| Case=Acc|Number=Plur | veškeré | veškeré | ||
| Case=Gen|Number=Sing | veškerého | |||
| Case=Nom|Number=Plur | veškeré |
AUX
59 AUX tokens (10% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Aspect=Imp (59; 100%), Mood=EMPTY (59; 100%), Person=EMPTY (59; 100%), Tense=Past (59; 100%), VerbForm=Part (59; 100%), Voice=Act (59; 100%), Polarity=Pos (47; 80%).
AUX tokens may have the following values of Gender:
Fem,Masc(26; 44% of non-emptyGender): byly, nebylyFem,Neut(9; 15% of non-emptyGender): byla, nebylaMasc(14; 24% of non-emptyGender): byl, nebylNeut(10; 17% of non-emptyGender): byloEMPTY(560): je, jsou, není, nejsou, být, by, bude, budou
| Paradigm být | Fem,Masc | Fem,Neut | Masc | Neut |
|---|---|---|---|---|
| Animacy=Inan|Number=Plur|Polarity=Neg | nebyly | |||
| Animacy=Inan|Number=Plur|Polarity=Pos | byly | |||
| Number=Sing|Polarity=Neg | nebyl | |||
| Number=Sing|Polarity=Pos | byl | bylo | ||
| Number=Plur,Sing|Polarity=Neg | nebyla | |||
| Number=Plur,Sing|Polarity=Pos | byla |
NUM
46 NUM tokens (11% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (46; 100%), NumType=Card (46; 100%), Number=Sing (38; 83%).
NUM tokens may have the following values of Gender:
Fem(11; 24% of non-emptyGender): jedné, jednou, jednuFem,Neut(7; 15% of non-emptyGender): dvě, oběMasc(19; 41% of non-emptyGender): jeden, dvaMasc,Neut(6; 13% of non-emptyGender): jednoho, jednom, jednomu, jednímNeut(3; 7% of non-emptyGender): jednoEMPTY(388): 1, 3, 2, 4, 5, 41, 7, tří, 10, 2004
| Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Inan|Case=Acc | jeden | |||
| Case=Acc | jednu | jedno | ||
| Case=Dat | jednomu | |||
| Case=Gen | jednoho | jedné | ||
| Case=Ins | jedním | jednou | ||
| Case=Loc | jednom | |||
| Case=Nom | jeden |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (5808; 98%),
NOUN –[conj]–> NOUN (981; 55%),
ADJ –[conj]–> ADJ (182; 83%),
NOUN –[appos]–> NOUN (45; 70%),
NOUN –[advcl:pred]–> ADJ (16; 94%),
DET –[nmod]–> NOUN (9; 82%),
ADJ –[dep]–> NOUN (6; 75%),
ADJ –[amod]–> ADJ (4; 80%),
ADJ –[appos]–> ADJ (4; 100%),
ADJ –[conj]–> NOUN (4; 57%).