Treebank Statistics: UD_Czech-CLTT: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc
, Fem|Neut
, Masc|Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
18851 tokens (52%) have a non-empty value of Gender
.
3556 types (78%) occur at least once with a non-empty value of Gender
.
1592 lemmas (59%) occur at least once with a non-empty value of Gender
.
The feature is used with 7 part-of-speech tags: NOUN (11062; 31% instances), ADJ (6637; 18% instances), DET (843; 2% instances), VERB (114; 0% instances), PRON (90; 0% instances), AUX (59; 0% instances), NUM (46; 0% instances).
NOUN
11062 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (7820; 71%), Animacy=EMPTY (6603; 60%).
NOUN
tokens may have the following values of Gender
:
Fem
(4458; 40% of non-emptyGender
): jednotky, jednotka, položka, závěrky, jednotek, společnosti, položek, informace, položky, závěrkuMasc
(4459; 40% of non-emptyGender
): majetku, dni, závazků, dne, majetek, odstavce, případě, náklady, závazky, ziskuNeut
(2145; 19% of non-emptyGender
): období, ocenění, účetnictví, ustanovení, vymezení, sestavení, účtování, uspořádání, použití, hospodaření
Paradigm rok | Masc | Neut |
---|---|---|
Animacy=Inan|Case=Acc|Number=Sing | rok | |
Animacy=Inan|Case=Gen|Number=Sing | roku | |
Animacy=Inan|Case=Ins|Number=Sing | rokem | |
Animacy=Inan|Case=Loc|Number=Sing | roce | |
Animacy=Inan|Case=Nom|Number=Sing | rok | |
Case=Gen|Number=Plur | let | |
Case=Loc|Number=Plur | letech |
Gender
seems to be lexical feature of NOUN
. 99% lemmas (848) occur only with one value of Gender
.
ADJ
6637 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Polarity=Pos (6462; 97%), Degree=Pos (6247; 94%), Number=Sing (4127; 62%), Animacy=EMPTY (3966; 60%).
ADJ
tokens may have the following values of Gender
:
Fem
(3035; 46% of non-emptyGender
): účetní, účetních, konsolidované, konsolidující, výroční, reálnou, finanční, pořizovací, českou, uvedenéFem,Masc
(160; 2% of non-emptyGender
): povinny, obchodovány, uvedeny, zahrnuty, vykázány, účtovány, uzavřeny, vyjádřeny, známy, ověřenyFem,Neut
(78; 1% of non-emptyGender
): povinna, sestavena, zavedena, uvedena, známa, dotčena, oprávněna, schopna, vyhlášena, vykazovánaMasc
(2576; 39% of non-emptyGender
): účetní, účetních, účetního, obchodního, peněžních, právní, právních, zvláštního, právního, zvláštníchNeut
(788; 12% of non-emptyGender
): účetního, účetní, účetním, obsahové, jiných, stanoveno, technické, účetních, minulé, účinnémEMPTY
(6): něm, do, pod
Paradigm uvedený | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Case=Acc|Number=Plur|Polarity=Neg | neuvedené | ||||
Animacy=Inan|Case=Acc|Number=Sing|Polarity=Pos | uvedený | ||||
Animacy=Inan|Case=Acc|Number=Plur|Polarity=Pos | uvedené | ||||
Animacy=Inan|Case=Dat|Number=Sing|Polarity=Pos | uvedenému | ||||
Animacy=Inan|Case=Gen|Number=Sing|Polarity=Pos | uvedeného | ||||
Animacy=Inan|Case=Gen|Number=Plur|Polarity=Pos | uvedených | ||||
Animacy=Inan|Case=Ins|Number=Sing|Polarity=Pos | uvedeným | ||||
Animacy=Inan|Case=Loc|Number=Sing|Polarity=Pos | uvedeném | ||||
Animacy=Inan|Case=Loc|Number=Plur|Polarity=Pos | uvedených | ||||
Animacy=Inan|Case=Nom|Number=Sing|Polarity=Pos | uvedený | ||||
Animacy=Inan|Case=Nom|Number=Plur|Polarity=Pos | uvedené | ||||
Animacy=Inan|Number=Plur|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedeny | ||||
Case=Acc|Number=Sing|Polarity=Pos | uvedené | ||||
Case=Acc|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
Case=Dat|Number=Sing|Polarity=Pos | uvedené | ||||
Case=Dat|Number=Plur|Polarity=Pos | uvedeným | ||||
Case=Gen|Number=Sing|Polarity=Neg | neuvedené | ||||
Case=Gen|Number=Sing|Polarity=Pos | uvedené | ||||
Case=Gen|Number=Plur|Polarity=Pos | uvedených | uvedených | |||
Case=Ins|Number=Sing|Polarity=Pos | uvedenou | ||||
Case=Ins|Number=Plur|Polarity=Pos | uvedenými | ||||
Case=Loc|Number=Sing|Polarity=Pos | uvedené | ||||
Case=Loc|Number=Plur|Polarity=Pos | uvedených | ||||
Case=Nom|Number=Sing|Polarity=Neg | neuvedená | ||||
Case=Nom|Number=Sing|Polarity=Pos | uvedená | ||||
Case=Nom|Number=Plur|Polarity=Pos | uvedené | uvedená | |||
Number=Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uveden | uvedeno | |||
Number=Plur,Sing|Polarity=Pos|Variant=Short|VerbForm=Part|Voice=Pass | uvedena |
DET
843 DET tokens (74% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number[psor]=EMPTY (813; 96%), Person=EMPTY (813; 96%), Poss=EMPTY (792; 94%), Number=Sing (595; 71%).
DET
tokens may have the following values of Gender
:
Fem
(385; 46% of non-emptyGender
): které, této, která, tato, tyto, kterou, tuto, své, její, všechnyMasc
(180; 21% of non-emptyGender
): které, který, tento, tyto, všechny, každého, každý, svůj, takový, jejíMasc,Neut
(198; 23% of non-emptyGender
): tohoto, kterém, kterému, tomto, kterým, tímto, kterého, jejího, jejím, tohoNeut
(80; 9% of non-emptyGender
): které, to, která, toto, všechna, její, některá, každé, samo, takovéEMPTY
(292): jejich, jeho, těchto, kterých, všech, kterým, jejichž, jehož, kterými, svých
Paradigm který | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Inan|Case=Acc|Number=Sing | který | |||
Animacy=Inan|Case=Nom|Number=Plur | které | |||
Case=Acc|Number=Sing | kterou | které | ||
Case=Acc|Number=Plur | které | které | ||
Case=Dat|Number=Sing | kterému | které | ||
Case=Gen|Number=Sing | kterého | které | ||
Case=Ins|Number=Sing | kterým | kterou | ||
Case=Loc|Number=Sing | kterém | které | ||
Case=Nom|Number=Sing | který | která | které | |
Case=Nom|Number=Plur | které | která |
VERB
114 VERB tokens (6% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=EMPTY (114; 100%), Person=EMPTY (114; 100%), Voice=Act (114; 100%), Tense=Past (113; 99%), VerbForm=Part (113; 99%), Polarity=Pos (105; 92%).
VERB
tokens may have the following values of Gender
:
Fem,Masc
(33; 29% of non-emptyGender
): přestaly, staly, nastaly, dosáhly, existovaly, překročily, rozhodly, navazovaly, neprošly, nesplnilyFem,Neut
(51; 45% of non-emptyGender
): nabyla, určila, překročila, sestavila, stanovila, podávala, provedla, dospěla, mohla, mělaMasc
(11; 10% of non-emptyGender
): Dal, dozvěděl, mohl, nepožádali, nezahájil, počínaje, přesáhl, rovnal, schválili, stalNeut
(19; 17% of non-emptyGender
): došlo, trvalo, započalo, mohlo, přešlo, uzavřeloEMPTY
(1705): obsahuje, rozumí, může, uvede, mohou, použijí, stanoví, vést, musí, účtuje
Paradigm moci | Fem,Neut | Masc | Neut |
---|---|---|---|
Number=Sing | mohl | mohlo | |
Number=Plur,Sing | mohla |
PRON
90 PRON tokens (14% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (90; 100%), Variant=EMPTY (89; 99%), Number=Sing (85; 94%), Person=EMPTY (54; 60%), PronType=Rel (46; 51%).
PRON
tokens may have the following values of Gender
:
Fem
(28; 31% of non-emptyGender
): jí, ji, ní, níž, veškeré, jež, nižMasc
(6; 7% of non-emptyGender
): jenž, veškeréMasc,Neut
(55; 61% of non-emptyGender
): němž, jej, němuž, jehož, nějž, něj, veškerého, ho, jemu, jímžNeut
(1; 1% of non-emptyGender
): veškeréEMPTY
(532): se, nichž, je, jim, jimiž, nich, sobě, jimi, nimi, ně
Paradigm veškerý | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Inan|Case=Nom|Number=Plur | veškeré | |||
Case=Acc|Number=Sing | veškeré | |||
Case=Acc|Number=Plur | veškeré | veškeré | ||
Case=Gen|Number=Sing | veškerého | |||
Case=Nom|Number=Plur | veškeré |
AUX
59 AUX tokens (10% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (59; 100%), Mood=EMPTY (59; 100%), Person=EMPTY (59; 100%), Tense=Past (59; 100%), VerbForm=Part (59; 100%), Voice=Act (59; 100%), Polarity=Pos (47; 80%).
AUX
tokens may have the following values of Gender
:
Fem,Masc
(26; 44% of non-emptyGender
): byly, nebylyFem,Neut
(9; 15% of non-emptyGender
): byla, nebylaMasc
(14; 24% of non-emptyGender
): byl, nebylNeut
(10; 17% of non-emptyGender
): byloEMPTY
(560): je, jsou, není, nejsou, být, by, bude, budou
Paradigm být | Fem,Masc | Fem,Neut | Masc | Neut |
---|---|---|---|---|
Animacy=Inan|Number=Plur|Polarity=Neg | nebyly | |||
Animacy=Inan|Number=Plur|Polarity=Pos | byly | |||
Number=Sing|Polarity=Neg | nebyl | |||
Number=Sing|Polarity=Pos | byl | bylo | ||
Number=Plur,Sing|Polarity=Neg | nebyla | |||
Number=Plur,Sing|Polarity=Pos | byla |
NUM
46 NUM tokens (11% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (46; 100%), NumType=Card (46; 100%), Number=Sing (38; 83%).
NUM
tokens may have the following values of Gender
:
Fem
(11; 24% of non-emptyGender
): jedné, jednou, jednuFem,Neut
(7; 15% of non-emptyGender
): dvě, oběMasc
(19; 41% of non-emptyGender
): jeden, dvaMasc,Neut
(6; 13% of non-emptyGender
): jednoho, jednom, jednomu, jednímNeut
(3; 7% of non-emptyGender
): jednoEMPTY
(388): 1, 3, 2, 4, 5, 41, 7, tří, 10, 2004
Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Inan|Case=Acc | jeden | |||
Case=Acc | jednu | jedno | ||
Case=Dat | jednomu | |||
Case=Gen | jednoho | jedné | ||
Case=Ins | jedním | jednou | ||
Case=Loc | jednom | |||
Case=Nom | jeden |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (5825; 97%),
NOUN –[conj]–> NOUN (983; 55%),
ADJ –[conj]–> ADJ (183; 83%),
NOUN –[appos]–> NOUN (45; 70%),
NOUN –[xcomp]–> ADJ (15; 94%),
DET –[nmod]–> NOUN (9; 82%),
ADJ –[dep]–> NOUN (6; 75%),
ADJ –[amod]–> ADJ (4; 80%),
ADJ –[appos]–> ADJ (4; 100%),
ADJ –[conj]–> NOUN (4; 57%).