Treebank Statistics: UD_Czech-PUD: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
Some words have combined values of the feature; 3 combinations have been observed: Fem|Masc, Fem|Neut, Masc|Neut.
This is a layered feature with the following layers: Gender, Gender[psor].
9478 tokens (51%) have a non-empty value of Gender.
6231 types (82%) occur at least once with a non-empty value of Gender.
4159 lemmas (79%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (4337; 23% instances), ADJ (2229; 12% instances), PROPN (967; 5% instances), VERB (879; 5% instances), DET (641; 3% instances), AUX (260; 1% instances), PRON (103; 1% instances), NUM (62; 0% instances).
NOUN
4337 NOUN tokens (97% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (3085; 71%), Animacy=EMPTY (2425; 56%).
NOUN tokens may have the following values of Gender:
Fem(1666; 38% of non-emptyGender): době, oblasti, války, společnosti, země, policie, část, části, strany, říšeMasc(1913; 44% of non-emptyGender): roce, roku, l, lidí, rok, případě, dolarů, důsledku, film, denNeut(758; 17% of non-emptyGender): let, století, letech, území, období, moře, místo, eur, města, omezeníEMPTY(145): GCA, MPS, Pebe, Really, my, t, A, APK, Academy, Amnesty
| Paradigm rok | Masc | Neut |
|---|---|---|
| Animacy=Inan|Case=Acc|Number=Sing | rok | |
| Animacy=Inan|Case=Acc|Number=Plur | roky | |
| Animacy=Inan|Case=Gen|Number=Sing | roku, roka | |
| Animacy=Inan|Case=Ins|Number=Sing | rokem | |
| Animacy=Inan|Case=Loc|Number=Sing | roce, roku | |
| Animacy=Inan|Case=Nom|Number=Sing | rok | |
| Case=Acc|Number=Plur | léta | |
| Case=Gen|Number=Plur | let | |
| Case=Ins|Number=Plur | lety | |
| Case=Loc|Number=Plur | letech |
Gender seems to be lexical feature of NOUN. 100% lemmas (1856) occur only with one value of Gender.
ADJ
2229 ADJ tokens (98% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Polarity=Pos (2060; 92%), Degree=Pos (1969; 88%), VerbForm=EMPTY (1813; 81%), Voice=EMPTY (1813; 81%), Number=Sing (1460; 66%), Animacy=EMPTY (1362; 61%).
ADJ tokens may have the following values of Gender:
Fem(836; 38% of non-emptyGender): první, nové, druhé, jižní, další, severní, velká, velké, vlastní, východníFem,Masc(38; 2% of non-emptyGender): považovány, aktivovány, budovány, diskutovány, exponovány, legalizovány, odváty, otevřeny, ovlivněny, podloženyFem,Neut(52; 2% of non-emptyGender): poražena, vytvořena, založena, chráněna, definována, dána, hlášena, kritizována, obviněna, odstraněnaMasc(897; 40% of non-emptyGender): další, Spojených, nové, nový, první, schopen, vládní, americké, dalších, dalšímNeut(406; 18% of non-emptyGender): posledních, další, jasné, možné, řečeno, jiné, šedesátých, Karibské, Severního, britskéhoEMPTY(40): The, National, El, New, Saint, San, a, American, Beverly, Canadian
| Paradigm známý | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Nom|Degree=Sup|Number=Sing|Polarity=Pos | nejznámější | |||
| Animacy=Inan|Case=Acc|Degree=Pos|Number=Sing|Polarity=Pos | známý | |||
| Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur|Polarity=Pos | známých | |||
| Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | známý | |||
| Animacy=Inan|Case=Nom|Degree=Pos|Number=Plur|Polarity=Pos | známé | |||
| Case=Nom|Degree=Pos|Number=Sing|Polarity=Neg | neznámé | |||
| Case=Nom|Degree=Pos|Number=Sing|Polarity=Pos | známá | |||
| Degree=Pos|Number=Sing|Polarity=Pos|Variant=Short | známo | |||
| Degree=Pos|Number=Plur,Sing|Polarity=Pos|Variant=Short | známa |
PROPN
967 PROPN tokens (89% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Foreign=EMPTY (898; 93%), Number=Sing (835; 86%).
PROPN tokens may have the following values of Gender:
Fem(262; 27% of non-emptyGender): Čína, Francie, Albánie, BBC, Británii, Clintonové, Evropě, Itálii, Ameriky, AsiiMasc(612; 63% of non-emptyGender): USA, Trump, Trumpa, Donald, Mišima, Peking, Richarda, Seagal, Winstone, WrightNeut(93; 10% of non-emptyGender): CNN, Mongolsko, Německo, Řecko, Brisbane, Mexiko, Nizozemí, Norsku, Ontaria, RuskuEMPTY(125): Čching, Danevirke, Aviva, Investors, Liao, Multi, RECO, School, Strategy, Addenbrooke
| Paradigm Andy | Masc | Fem |
|---|---|---|
| Animacy=Anim|Case=Dat|NameType=Giv|Number=Sing | Andymu | |
| Animacy=Anim|Case=Gen|NameType=Giv|Number=Sing | Andyho | |
| Case=Nom|NameType=Geo|Number=Plur | Andy |
Gender seems to be lexical feature of PROPN. 99% lemmas (682) occur only with one value of Gender.
VERB
879 VERB tokens (51% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (879; 100%), Person=EMPTY (879; 100%), Voice=Act (879; 100%), Tense=Past (878; 100%), VerbForm=Part (877; 100%), Polarity=Pos (843; 96%), Animacy=EMPTY (692; 79%), Number=Sing (492; 56%).
VERB tokens may have the following values of Gender:
Fem(3; 0% of non-emptyGender): redukujíc, začala, řeklaFem,Masc(79; 9% of non-emptyGender): měly, vypadaly, začaly, mohly, používaly, umožnily, vedly, vyvíjely, Následovaly, PodávalyFem,Neut(200; 23% of non-emptyGender): stala, uvedla, mohla, vedla, měla, ukázala, vydala, začala, řekla, umožnilaMasc(501; 57% of non-emptyGender): řekl, mohl, měl, stal, vedl, pracoval, rozhodl, uvedl, vrátil, začalNeut(96; 11% of non-emptyGender): mělo, začalo, došlo, mohlo, konalo, podařilo, poskytovalo, vedlo, vyšlo, způsobiloEMPTY(840): má, může, říká, mohou, mají, lze, mít, obsahuje, pomáhá, vidět
| Paradigm začít | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Number=Plur | začali | ||||
| Animacy=Inan|Number=Plur | začaly | ||||
| Number=Sing | začal | začala | začalo | ||
| Number=Plur,Sing | začala |
DET
641 DET tokens (76% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number[psor]=EMPTY (596; 93%), Person=EMPTY (596; 93%), Reflex=EMPTY (567; 88%), Animacy=EMPTY (546; 85%), Poss=EMPTY (522; 81%), Number=Sing (516; 80%), Case=Nom (326; 51%).
DET tokens may have the following values of Gender:
Fem(176; 27% of non-emptyGender): která, které, své, svou, této, té, tato, její, kterou, tutoFem,Neut(4; 1% of non-emptyGender): naše, MojeMasc(172; 27% of non-emptyGender): který, kteří, které, tento, svůj, každý, své, ten, někteří, tytoMasc,Neut(142; 22% of non-emptyGender): toho, tím, tohoto, n, svého, tomu, její, tom, svém, svýmNeut(147; 23% of non-emptyGender): to, toto, které, která, své, tohle, některá, tato, všechno, žádnáEMPTY(200): jeho, jejich, mnoho, několik, svých, těchto, více, mnoha, všech, jejichž
| Paradigm který | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Acc|Number=Sing | kterého | |||
| Animacy=Anim|Case=Nom|Number=Plur | kteří | |||
| Animacy=Inan|Case=Acc|Number=Sing | který | |||
| Animacy=Inan|Case=Acc|Number=Plur | které | |||
| Animacy=Inan|Case=Nom|Number=Plur | které | |||
| Case=Acc|Number=Sing | kterou | které | ||
| Case=Acc|Number=Plur | které | které | která | |
| Case=Dat|Number=Sing | kterému | |||
| Case=Gen|Number=Sing | kterého | které | ||
| Case=Loc|Number=Sing | kterém | které | ||
| Case=Nom|Number=Sing | který | která | které | |
| Case=Nom|Number=Plur | které | které, která | která |
AUX
260 AUX tokens (38% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Aspect=Imp (260; 100%), Mood=EMPTY (260; 100%), Person=EMPTY (260; 100%), Tense=Past (260; 100%), VerbForm=Part (260; 100%), Voice=Act (260; 100%), Polarity=Pos (242; 93%), Number=Sing (156; 60%).
AUX tokens may have the following values of Gender:
Fem(3; 1% of non-emptyGender): bylaFem,Masc(38; 15% of non-emptyGender): byly, nebylyFem,Neut(52; 20% of non-emptyGender): byla, nebylaMasc(109; 42% of non-emptyGender): byl, byli, nebylNeut(58; 22% of non-emptyGender): bylo, nebyloEMPTY(422): je, by, jsou, bude, být, jsem, není, jsme, budou, nebude
| Paradigm být | Fem,Masc | Fem,Neut | Masc | Fem | Neut |
|---|---|---|---|---|---|
| Animacy=Anim|Number=Plur|Polarity=Pos | byli | ||||
| Animacy=Inan|Number=Plur|Polarity=Neg | nebyly | ||||
| Animacy=Inan|Number=Plur|Polarity=Pos | byly | ||||
| Number=Sing|Polarity=Neg | nebyl, byl | nebylo | |||
| Number=Sing|Polarity=Pos | byl | byla | bylo | ||
| Number=Plur,Sing|Polarity=Neg | nebyla | ||||
| Number=Plur,Sing|Polarity=Pos | byla |
PRON
103 PRON tokens (18% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (103; 100%), Number=Sing (85; 83%), Variant=EMPTY (83; 81%), Person=3 (71; 69%), PronType=Prs (71; 69%), PrepCase=EMPTY (62; 60%).
PRON tokens may have the following values of Gender:
Fem(34; 33% of non-emptyGender): ní, jí, ji, níž, veškeré, jež, niž, ona, veškerouMasc(24; 23% of non-emptyGender): kdo, jenž, někdo, on, kdokoli, kdokoliv, koho, nikdo, nikoho, nikýmMasc,Neut(44; 43% of non-emptyGender): ho, mu, něj, ním, něm, jím, něhož, jehož, němuNeut(1; 1% of non-emptyGender): jeEMPTY(473): se, si, co, což, nich, mě, nic, jim, něco, nimi
| Paradigm on | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Animacy=Anim|Case=Nom|Number=Plur | oni | |||
| Case=Acc|Number=Sing|PrepCase=Pre | něj, ho | |||
| Case=Acc|Number=Sing | ji | je | ||
| Case=Acc|Number=Sing|Variant=Short | ho | |||
| Case=Dat|Number=Sing|PrepCase=Pre | němu | |||
| Case=Dat|Number=Sing | jí | |||
| Case=Dat|Number=Sing|Variant=Short | mu | |||
| Case=Gen|Number=Sing|PrepCase=Pre | něj | ní | ||
| Case=Gen|Number=Sing | jí | |||
| Case=Ins|Number=Sing|PrepCase=Pre | ním | ní | ||
| Case=Ins|Number=Sing | jím | |||
| Case=Loc|Number=Sing|PrepCase=Pre | něm | ní | ||
| Case=Nom|Number=Sing | on | ona |
NUM
62 NUM tokens (14% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (62; 100%), NumType=Card (62; 100%), Number=Sing (38; 61%).
NUM tokens may have the following values of Gender:
Fem(18; 29% of non-emptyGender): jedné, jedna, jednu, jednou, unaFem,Neut(8; 13% of non-emptyGender): dvěMasc(23; 37% of non-emptyGender): dva, jeden, obaMasc,Neut(9; 15% of non-emptyGender): jedním, jednoho, jednomNeut(4; 6% of non-emptyGender): jednoEMPTY(397): čtyři, dvou, 1, 3, 20, dvěma, 2014, 2015, 5, I
| Paradigm jeden | Masc | Masc,Neut | Fem | Neut |
|---|---|---|---|---|
| Case=Acc | jeden | jednu | jedno | |
| Case=Gen | jednoho | jedné | ||
| Case=Ins | jedním | jednou | ||
| Case=Loc | jednom | jedné | ||
| Case=Nom | jeden | jedna | jedno |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (1694; 99%),
VERB –[nsubj]–> PROPN (142; 66%),
ADJ –[aux:pass]–> AUX (128; 78%),
PROPN –[flat]–> PROPN (125; 88%),
PROPN –[amod]–> ADJ (87; 99%),
VERB –[conj]–> VERB (75; 63%),
PROPN –[nmod]–> NOUN (61; 87%),
ADJ –[nsubj]–> NOUN (54; 78%),
ADJ –[conj]–> ADJ (44; 86%),
PROPN –[conj]–> PROPN (33; 57%).