Treebank Statistics: UD_Czech-PUD: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc
, Fem|Neut
, Masc|Neut
.
This is a layered feature with the following layers: Gender, Gender[psor].
9481 tokens (51%) have a non-empty value of Gender
.
6232 types (82%) occur at least once with a non-empty value of Gender
.
4159 lemmas (79%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (4338; 23% instances), ADJ (2229; 12% instances), PROPN (966; 5% instances), VERB (879; 5% instances), DET (644; 3% instances), AUX (260; 1% instances), PRON (103; 1% instances), NUM (62; 0% instances).
NOUN
4338 NOUN tokens (97% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (3086; 71%), Animacy=EMPTY (2424; 56%).
NOUN
tokens may have the following values of Gender
:
Fem
(1665; 38% of non-emptyGender
): době, oblasti, války, společnosti, země, policie, část, části, strany, říšeMasc
(1915; 44% of non-emptyGender
): roce, roku, l, lidí, rok, případě, dolarů, důsledku, film, denNeut
(758; 17% of non-emptyGender
): let, století, letech, území, období, moře, místo, eur, města, omezeníEMPTY
(145): GCA, MPS, Pebe, Really, my, t, A, APK, Academy, Amnesty
Paradigm rok | Masc | Neut |
---|---|---|
Animacy=Inan|Case=Acc|Number=Sing | rok | |
Animacy=Inan|Case=Acc|Number=Plur | roky | |
Animacy=Inan|Case=Gen|Number=Sing | roku, roka | |
Animacy=Inan|Case=Ins|Number=Sing | rokem | |
Animacy=Inan|Case=Loc|Number=Sing | roce, roku | |
Animacy=Inan|Case=Nom|Number=Sing | rok | |
Case=Acc|Number=Plur | léta | |
Case=Gen|Number=Plur | let | |
Case=Ins|Number=Plur | lety | |
Case=Loc|Number=Plur | letech |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (1857) occur only with one value of Gender
.
ADJ
2229 ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Polarity=Pos (2060; 92%), Degree=Pos (1969; 88%), VerbForm=EMPTY (1814; 81%), Voice=EMPTY (1814; 81%), Number=Sing (1459; 65%), Animacy=EMPTY (1361; 61%).
ADJ
tokens may have the following values of Gender
:
Fem
(833; 37% of non-emptyGender
): první, nové, druhé, jižní, další, severní, velká, velké, vlastní, východníFem,Masc
(38; 2% of non-emptyGender
): považovány, aktivovány, budovány, diskutovány, exponovány, legalizovány, odváty, otevřeny, ovlivněny, podloženyFem,Neut
(53; 2% of non-emptyGender
): poražena, vytvořena, založena, chráněna, definována, dána, hlášena, kritizována, obviněna, odstraněnaMasc
(899; 40% of non-emptyGender
): další, Spojených, nové, nový, první, schopen, vládní, americké, dalších, dalšímNeut
(406; 18% of non-emptyGender
): posledních, další, jasné, možné, řečeno, jiné, šedesátých, Karibské, Severního, britskéhoEMPTY
(40): The, National, El, New, Saint, San, a, American, Beverly, Canadian
Paradigm známý | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|
Animacy=Anim|Case=Nom|Degree=Sup|Number=Sing|Polarity=Pos | nejznámější | |||
Animacy=Inan|Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | známý | |||
Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | známých | |||
Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | známý | |||
Animacy=Inan|Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | známé | |||
Case=Nom|Degree=Pos|Number=Sing|Polarity=Neg | neznámé | |||
Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | známá | |||
Degree=Pos|Number=Sing|Polarity=Pos|Variant=Short | známo | |||
Degree=Pos|Number=Plur,Sing|Polarity=Pos|Variant=Short | známa |
PROPN
966 PROPN tokens (89% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Foreign=EMPTY (897; 93%), Number=Sing (834; 86%).
PROPN
tokens may have the following values of Gender
:
Fem
(262; 27% of non-emptyGender
): Čína, Francie, Albánie, BBC, Británii, Clintonové, Evropě, Itálii, Ameriky, AsiiMasc
(611; 63% of non-emptyGender
): USA, Trump, Trumpa, Donald, Mišima, Peking, Richarda, Seagal, Winstone, WrightNeut
(93; 10% of non-emptyGender
): CNN, Mongolsko, Německo, Řecko, Brisbane, Mexiko, Nizozemí, Norsku, Ontaria, RuskuEMPTY
(125): Čching, Danevirke, Aviva, Investors, Liao, Multi, RECO, School, Strategy, Addenbrooke
Paradigm Andy | Masc | Fem |
---|---|---|
Animacy=Anim|Case=Dat|NameType=Giv|Number=Sing | Andymu | |
Animacy=Anim|Case=Gen|NameType=Giv|Number=Sing | Andyho | |
Case=Nom|NameType=Geo|Number=Plur | Andy |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (681) occur only with one value of Gender
.
VERB
879 VERB tokens (51% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=EMPTY (879; 100%), Person=EMPTY (879; 100%), Voice=Act (879; 100%), Tense=Past (878; 100%), VerbForm=Part (877; 100%), Polarity=Pos (843; 96%), Animacy=EMPTY (692; 79%), Number=Sing (492; 56%).
VERB
tokens may have the following values of Gender
:
Fem
(3; 0% of non-emptyGender
): redukujíc, začala, řeklaFem,Masc
(79; 9% of non-emptyGender
): měly, vypadaly, začaly, mohly, používaly, umožnily, vedly, vyvíjely, Následovaly, PodávalyFem,Neut
(200; 23% of non-emptyGender
): stala, uvedla, mohla, vedla, měla, ukázala, vydala, začala, řekla, umožnilaMasc
(501; 57% of non-emptyGender
): řekl, mohl, měl, stal, vedl, pracoval, rozhodl, uvedl, vrátil, začalNeut
(96; 11% of non-emptyGender
): mohlo, mělo, začalo, došlo, konalo, podařilo, poskytovalo, vedlo, vyšlo, způsobiloEMPTY
(840): má, může, říká, mohou, mají, lze, mít, obsahuje, pomáhá, vidět
Paradigm začít | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Number=Plur | začali | ||||
Animacy=Inan|Number=Plur | začaly | ||||
Number=Sing | začal | začala | začalo | ||
Number=Plur,Sing | začala |
DET
644 DET tokens (76% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number[psor]=EMPTY (599; 93%), Person=EMPTY (599; 93%), Reflex=EMPTY (570; 89%), Animacy=EMPTY (549; 85%), Poss=EMPTY (525; 82%), Number=Sing (519; 81%), Case=Nom (327; 51%).
DET
tokens may have the following values of Gender
:
Fem
(176; 27% of non-emptyGender
): která, které, své, svou, této, té, tato, její, kterou, tutoFem,Neut
(4; 1% of non-emptyGender
): naše, MojeMasc
(172; 27% of non-emptyGender
): který, kteří, které, tento, svůj, každý, své, ten, někteří, tytoMasc,Neut
(143; 22% of non-emptyGender
): toho, tím, tohoto, n, svého, tomu, její, tom, svém, svýmNeut
(149; 23% of non-emptyGender
): to, toto, které, která, své, tohle, některá, tato, všechno, žádnáEMPTY
(200): jeho, jejich, mnoho, několik, svých, těchto, více, mnoha, všech, jejichž
Paradigm ten | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Anim|Case=Acc|Number=Plur | ty | |||
Animacy=Inan|Case=Acc|Number=Sing | ten | |||
Animacy=Inan|Case=Nom|Number=Plur | ty | |||
Case=Acc|Number=Sing | to | |||
Case=Acc|Number=Plur | ty | |||
Case=Dat|Number=Sing | tomu | |||
Case=Gen|Number=Sing | toho | té | ||
Case=Ins|Number=Sing | tím | tou | ||
Case=Loc|Number=Sing | tom | té | ||
Case=Nom|Number=Sing | ten | ta | to | |
Case=Nom|Number=Plur | ty |
AUX
260 AUX tokens (38% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Aspect=Imp (260; 100%), Mood=EMPTY (260; 100%), Person=EMPTY (260; 100%), Tense=Past (260; 100%), VerbForm=Part (260; 100%), Voice=Act (260; 100%), Polarity=Pos (242; 93%), Number=Sing (155; 60%).
AUX
tokens may have the following values of Gender
:
Fem
(1; 0% of non-emptyGender
): bylaFem,Masc
(38; 15% of non-emptyGender
): byly, nebylyFem,Neut
(53; 20% of non-emptyGender
): byla, nebylaMasc
(110; 42% of non-emptyGender
): byl, byli, nebylNeut
(58; 22% of non-emptyGender
): bylo, nebyloEMPTY
(423): je, by, jsou, bude, být, jsem, není, jsme, budou, nebude
Paradigm být | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
---|---|---|---|---|---|
Animacy=Anim|Number=Plur|Polarity=Pos | byli | ||||
Animacy=Inan|Number=Plur|Polarity=Neg | nebyly | ||||
Animacy=Inan|Number=Plur|Polarity=Pos | byly | ||||
Number=Sing|Polarity=Neg | nebyl, byl | nebylo | |||
Number=Sing|Polarity=Pos | byl | byla | bylo | ||
Number=Plur,Sing|Polarity=Neg | nebyla | ||||
Number=Plur,Sing|Polarity=Pos | byla |
PRON
103 PRON tokens (18% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (103; 100%), Number=Sing (85; 83%), Variant=EMPTY (83; 81%), Person=3 (71; 69%), PronType=Prs (71; 69%), PrepCase=EMPTY (62; 60%).
PRON
tokens may have the following values of Gender
:
Fem
(34; 33% of non-emptyGender
): ní, jí, ji, níž, veškeré, jež, niž, ona, veškerouMasc
(24; 23% of non-emptyGender
): kdo, jenž, někdo, on, kdokoli, kdokoliv, koho, nikdo, nikoho, nikýmMasc,Neut
(44; 43% of non-emptyGender
): ho, mu, něj, ním, něm, jím, něhož, jehož, něho, němuNeut
(1; 1% of non-emptyGender
): jeEMPTY
(473): se, si, co, což, nich, mě, nic, jim, něco, nimi
Paradigm on | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Animacy=Anim|Case=Nom|Number=Plur | oni | |||
Case=Acc|Number=Sing|PrepCase=Pre | něj, ho, něho | |||
Case=Acc|Number=Sing | ji | je | ||
Case=Acc|Number=Sing|Variant=Short | ho | |||
Case=Dat|Number=Sing|PrepCase=Pre | němu | |||
Case=Dat|Number=Sing | jí | |||
Case=Dat|Number=Sing|Variant=Short | mu | |||
Case=Gen|Number=Sing|PrepCase=Pre | něj | ní | ||
Case=Gen|Number=Sing | jí | |||
Case=Ins|Number=Sing|PrepCase=Pre | ním | ní | ||
Case=Ins|Number=Sing | jím | |||
Case=Loc|Number=Sing|PrepCase=Pre | něm | ní | ||
Case=Nom|Number=Sing | on | ona |
NUM
62 NUM tokens (14% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumForm=Word (62; 100%), NumType=Card (62; 100%), Number=Sing (38; 61%).
NUM
tokens may have the following values of Gender
:
Fem
(18; 29% of non-emptyGender
): jedné, jedna, jednu, jednou, unaFem,Neut
(8; 13% of non-emptyGender
): dvěMasc
(23; 37% of non-emptyGender
): dva, jeden, obaMasc,Neut
(9; 15% of non-emptyGender
): jedním, jednoho, jednomNeut
(4; 6% of non-emptyGender
): jednoEMPTY
(397): čtyři, dvou, 1, 3, 20, dvěma, 2014, 2015, 5, I
Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
---|---|---|---|---|
Case=Acc | jeden | jednu | jedno | |
Case=Gen | jednoho | jedné | ||
Case=Ins | jedním | jednou | ||
Case=Loc | jednom | jedné | ||
Case=Nom | jeden | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (1696; 99%),
VERB –[nsubj]–> PROPN (141; 66%),
ADJ –[aux:pass]–> AUX (128; 78%),
PROPN –[flat]–> PROPN (124; 88%),
PROPN –[amod]–> ADJ (87; 99%),
VERB –[conj]–> VERB (75; 63%),
PROPN –[nmod]–> NOUN (60; 87%),
ADJ –[nsubj]–> NOUN (54; 78%),
ADJ –[conj]–> ADJ (44; 86%),
PROPN –[conj]–> PROPN (33; 57%).