Treebank Statistics: UD_Polish-PUD: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
10147 tokens (55%) have a non-empty value of Gender.
6790 types (90%) occur at least once with a non-empty value of Gender.
4455 lemmas (89%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (4481; 24% instances), ADJ (2343; 13% instances), PROPN (1348; 7% instances), VERB (765; 4% instances), DET (510; 3% instances), PRON (357; 2% instances), NUM (182; 1% instances), AUX (161; 1% instances).
NOUN
4481 NOUN tokens (96% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (3210; 72%), Animacy=EMPTY (2467; 55%).
NOUN tokens may have the following values of Gender:
Fem(1548; 35% of non-emptyGender): części, wojny, większość, osób, pracy, część, linii, ochrony, uwagę, historiiMasc(2014; 45% of non-emptyGender): lat, roku, latach, ludzi, raz, wieku, świecie, czasów, dolarów, funtówNeut(919; 21% of non-emptyGender): miejsce, miasta, euro, danych, miejscu, prawa, życia, badania, działania, miejscaEMPTY(165): r, %, p.n.e, w, mld, n.e, °C, dr, mln, tys
| Paradigm państwo | Masc | Neut |
|---|---|---|
| Animacy=Hum|Case=Nom|Number=Ptan | państwo | |
| Case=Acc|Number=Sing | państwo | |
| Case=Dat|Number=Sing | państwu | |
| Case=Gen|Number=Sing | państwa | |
| Case=Nom|Number=Sing | państwo | |
| Case=Nom|Number=Plur | państwa |
Gender seems to be lexical feature of NOUN. 100% lemmas (1920) occur only with one value of Gender.
ADJ
2343 ADJ tokens (99% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Aspect=EMPTY (1932; 82%), Polarity=EMPTY (1932; 82%), VerbForm=EMPTY (1932; 82%), Voice=EMPTY (1932; 82%), Degree=Pos (1852; 79%), Number=Sing (1641; 70%), Animacy=EMPTY (1187; 51%).
ADJ tokens may have the following values of Gender:
Fem(804; 34% of non-emptyGender): wielkiej, dużą, północna, I, Północnej, brytyjskiej, drugiej, dużej, jednej, pierwszejMasc(1156; 49% of non-emptyGender): 1, jednym, ostatnich, pierwszy, II, jeden, 60, I, III, nowegoNeut(383; 16% of non-emptyGender): pierwsze, Zjednoczonych, bezpośrednie, całe, duże, greckie, inne, małe, olimpijskich, CeltyckimEMPTY(18): północno, św, gotów, południowo, prostu, angielsku, austriacko, francusko, męsku, niedawna
| Paradigm duży | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Inan|Case=Acc|Degree=Pos|Number=Sing | duży | ||
| Animacy=Inan|Case=Acc|Degree=Sup|Number=Sing | największy | ||
| Animacy=Inan|Case=Gen|Degree=Pos|Number=Plur | dużych | ||
| Animacy=Inan|Case=Gen|Degree=Cmp|Number=Sing | większego | ||
| Animacy=Inan|Case=Ins|Degree=Sup|Number=Sing | największym | ||
| Animacy=Inan|Case=Ins|Degree=Sup|Number=Plur | największymi | ||
| Animacy=Inan|Case=Loc|Degree=Cmp|Number=Sing | większym | ||
| Animacy=Inan|Case=Loc|Degree=Sup|Number=Sing | największym | ||
| Animacy=Inan|Case=Nom|Degree=Pos|Number=Sing | duży | ||
| Animacy=Inan|Case=Nom|Degree=Cmp|Number=Sing | większy | ||
| Animacy=Inan|Case=Nom|Degree=Sup|Number=Sing | Największy | ||
| Case=Acc|Degree=Pos|Number=Sing | dużą | duże | |
| Case=Acc|Degree=Pos|Number=Plur | duże | ||
| Case=Acc|Degree=Cmp|Number=Sing | większą | ||
| Case=Acc|Degree=Cmp|Number=Plur | większe | ||
| Case=Dat|Degree=Pos|Number=Sing | dużej | ||
| Case=Gen|Degree=Pos|Number=Sing | dużej | ||
| Case=Gen|Degree=Pos|Number=Plur | dużych | ||
| Case=Gen|Degree=Cmp|Number=Sing | większej | ||
| Case=Gen|Degree=Cmp|Number=Plur | większych | ||
| Case=Gen|Degree=Sup|Number=Sing | największej | ||
| Case=Ins|Degree=Pos|Number=Sing | dużą | ||
| Case=Ins|Degree=Cmp|Number=Sing | większą | ||
| Case=Ins|Degree=Sup|Number=Sing | największym | ||
| Case=Loc|Degree=Pos|Number=Sing | dużej | ||
| Case=Loc|Degree=Cmp|Number=Plur | większych | ||
| Case=Nom|Degree=Pos|Number=Sing | duża | ||
| Case=Nom|Degree=Cmp|Number=Sing | większa |
PROPN
1348 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (1229; 91%).
PROPN tokens may have the following values of Gender:
Fem(343; 25% of non-emptyGender): Brytanii, Clinton, Azji, Europy, Francji, Kesha, Rosji, Ziemi, Albanii, AmerykiMasc(762; 57% of non-emptyGender): Trumpa, Hongkongu, Pekinu, Qing, American, Chińczyków, Disneya, Joseph, Mishima, TotmesaNeut(243; 18% of non-emptyGender): USA, Morze, Chiny, BBC, Danevirke, Ontario, Chinach, Morza, Morzu, NiemcyEMPTY(1): Z
| Paradigm Trump | Masc | Fem |
|---|---|---|
| Animacy=Hum|Case=Acc | Trumpa | |
| Animacy=Hum|Case=Dat | Trumpowi | |
| Animacy=Hum|Case=Gen | Trumpa | |
| Animacy=Hum|Case=Ins | Trumpem | |
| Animacy=Hum|Case=Nom | Trump | |
| Case=Nom | Trump |
Gender seems to be lexical feature of PROPN. 98% lemmas (948) occur only with one value of Gender.
VERB
765 VERB tokens (47% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=Ind (765; 100%), Person=EMPTY (765; 100%), VerbForm=Fin (765; 100%), Voice=Act (765; 100%), Tense=Past (761; 99%), Number=Sing (598; 78%), Aspect=Perf (494; 65%).
VERB tokens may have the following values of Gender:
Fem(202; 26% of non-emptyGender): miała, powiedziała, dotarła, mogła, stała, miały, ogłosiła, spowodowała, ujawniła, uznałaMasc(440; 58% of non-emptyGender): powiedział, miał, napisał, ogłosił, pracował, spotkał, miały, mógł, postanowił, uznałNeut(123; 16% of non-emptyGender): było, udało, stało, dostało, mogło, odbyło, przyczyniło, rozpoczęło, skutkowało, spowodowałoEMPTY(863): może, ma, mogą, można, jest, mówi, być, należy, znajduje, zrobić
| Paradigm móc | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Number=Sing | mógł | ||
| Animacy=Inan|Number=Plur | mogły | ||
| Number=Sing | mogła | mogło | |
| Number=Plur | mogły |
DET
510 DET tokens (100% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Reflex=EMPTY (445; 87%), Poss=EMPTY (430; 84%), Number=Sing (282; 55%).
DET tokens may have the following values of Gender:
Fem(175; 34% of non-emptyGender): która, swojej, które, ta, tej, więcej, swoją, której, takich, jakąMasc(258; 51% of non-emptyGender): który, tym, ten, którzy, tego, każdy, którego, które, tych, wieluNeut(77; 15% of non-emptyGender): które, wiele, takie, tych, których, swoim, swoje, to, więcej, swojego
| Paradigm który | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Case=Acc|Number=Sing|PronType=Rel | którego | ||
| Animacy=Hum|Case=Acc|Number=Plur|PronType=Rel | których | ||
| Animacy=Hum|Case=Dat|Number=Plur|PronType=Rel | którym | ||
| Animacy=Hum|Case=Gen|Number=Sing|PronType=Rel | którego | ||
| Animacy=Hum|Case=Gen|Number=Plur|PronType=Rel | których | ||
| Animacy=Hum|Case=Nom|Number=Sing|PronType=Rel | który | ||
| Animacy=Hum|Case=Nom|Number=Plur|PronType=Rel | którzy | ||
| Animacy=Inan|Case=Acc|Number=Sing|PronType=Int | który | ||
| Animacy=Inan|Case=Acc|Number=Plur|PronType=Rel | które | ||
| Animacy=Inan|Case=Dat|Number=Sing|PronType=Rel | któremu | ||
| Animacy=Inan|Case=Gen|Number=Sing|PronType=Rel | którego | ||
| Animacy=Inan|Case=Gen|Number=Plur|PronType=Rel | których | ||
| Animacy=Inan|Case=Loc|Number=Sing|PronType=Rel | którym | ||
| Animacy=Inan|Case=Nom|Number=Sing|PronType=Rel | który | ||
| Animacy=Inan|Case=Nom|Number=Plur|PronType=Rel | które | ||
| Animacy=Nhum|Case=Nom|Number=Sing|PronType=Rel | który | ||
| Case=Acc|Number=Sing|PronType=Rel | które | ||
| Case=Acc|Number=Plur|PronType=Int | które | ||
| Case=Acc|Number=Plur|PronType=Rel | które | ||
| Case=Gen|Number=Sing|PronType=Rel | której | którego | |
| Case=Gen|Number=Plur|PronType=Rel | których | których | |
| Case=Ins|Number=Sing|PronType=Rel | którą | ||
| Case=Loc|Number=Sing|PronType=Rel | której | którym | |
| Case=Loc|Number=Plur|PronType=Rel | których | ||
| Case=Nom|Number=Sing|PronType=Rel | która | które | |
| Case=Nom|Number=Plur|PronType=Rel | które | które |
PRON
357 PRON tokens (56% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (357; 100%), Number=Sing (298; 83%), PronType=Prs (226; 63%), Person=3 (208; 58%), Animacy=EMPTY (196; 55%), Variant=Long (190; 53%), PrepCase=Npr (184; 52%).
PRON tokens may have the following values of Gender:
Fem(66; 18% of non-emptyGender): jej, ją, ona, niej, ich, nich, Ja, je, niąMasc(161; 45% of non-emptyGender): jego, ich, go, mu, ktoś, im, nich, niego, ja, ktoNeut(130; 36% of non-emptyGender): to, tym, co, tego, coś, je, temu, czym, ich, jegoEMPTY(282): się, siebie, sobie
| Paradigm on | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Case=Acc|Number=Sing|PrepCase=Npr|Variant=Short | go | ||
| Animacy=Hum|Case=Acc|Number=Plur|PrepCase=Pre|Variant=Long | nich | ||
| Animacy=Hum|Case=Dat|Number=Sing|PrepCase=Npr|Variant=Short | mu | ||
| Animacy=Hum|Case=Dat|Number=Plur|PrepCase=Npr|Variant=Long | im | ||
| Animacy=Hum|Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jego | ||
| Animacy=Hum|Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niego | ||
| Animacy=Hum|Case=Gen|Number=Plur|PrepCase=Npr|Variant=Long | ich | ||
| Animacy=Hum|Case=Gen|Number=Plur|PrepCase=Pre|Variant=Long | nich | ||
| Animacy=Hum|Case=Ins|Number=Sing|PrepCase=Npr|Variant=Long | nim | ||
| Animacy=Hum|Case=Ins|Number=Sing|PrepCase=Pre|Variant=Long | nim | ||
| Animacy=Hum|Case=Ins|Number=Plur|PrepCase=Pre|Variant=Long | nimi | ||
| Animacy=Hum|Case=Loc|Number=Sing|PrepCase=Pre|Variant=Long | nim | ||
| Animacy=Hum|Case=Loc|Number=Plur|PrepCase=Pre|Variant=Long | nich | ||
| Animacy=Hum|Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | on | ||
| Animacy=Hum|Case=Nom|Number=Plur|PrepCase=Npr|Variant=Long | oni | ||
| Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Npr|Variant=Short | go | ||
| Animacy=Inan|Case=Acc|Number=Sing|PrepCase=Pre|Variant=Long | niego | ||
| Animacy=Inan|Case=Acc|Number=Plur|PrepCase=Npr|Variant=Long | ich, je | ||
| Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jego | ||
| Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Npr|Variant=Short | go | ||
| Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niego | ||
| Animacy=Inan|Case=Gen|Number=Sing|PrepCase=Pre|Variant=Short | ń | ||
| Animacy=Inan|Case=Gen|Number=Plur|PrepCase=Npr|Variant=Long | ich | ||
| Animacy=Inan|Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | on | ||
| Animacy=Inan|Case=Nom|Number=Plur|PrepCase=Npr|Variant=Long | one | ||
| Case=Acc|Number=Sing|PrepCase=Npr|Variant=Long | ją | je | |
| Case=Acc|Number=Sing|PrepCase=Pre|Variant=Long | nią | ||
| Case=Acc|Number=Plur|PrepCase=Npr|Variant=Long | je | je | |
| Case=Acc|Number=Plur|PrepCase=Pre|Variant=Long | nie | ||
| Case=Dat|Number=Sing|PrepCase=Npr|Variant=Long | jej | ||
| Case=Dat|Number=Plur|PrepCase=Npr|Variant=Long | im | ||
| Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jej | jego | |
| Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niej | niego | |
| Case=Gen|Number=Plur|PrepCase=Npr|Variant=Long | ich | ich | |
| Case=Gen|Number=Plur|PrepCase=Pre|Variant=Long | nich | ||
| Case=Loc|Number=Sing|PrepCase=Pre|Variant=Long | niej | ||
| Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | ona | ||
| Case=Nom|Number=Plur|PrepCase=Npr|Variant=Long | one |
NUM
182 NUM tokens (100% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Number=Plur (178; 98%), Animacy=Inan (112; 62%), NumForm=Digit (100; 55%), NumType=Card (100; 55%).
NUM tokens may have the following values of Gender:
Fem(24; 13% of non-emptyGender): dwie, czterech, dwiema, dwóch, sześć, trzy, 168000, 328, 330000, 45Masc(145; 80% of non-emptyGender): dwa, dwóch, 3, trzy, 5, 1,5, 10, 100, 2, 20Neut(13; 7% of non-emptyGender): 1.335, 1.365, 100, 34, 35000, 500, Trzy, cztery, dwa, dwóch
| Paradigm dwa | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Case=Acc | dwóch | ||
| Animacy=Hum|Case=Gen | dwóch | ||
| Animacy=Hum|Case=Nom | dwaj, Dwóch | ||
| Animacy=Inan|Case=Acc | dwa | ||
| Animacy=Inan|Case=Gen | dwóch | ||
| Animacy=Inan|Case=Ins | dwoma | ||
| Animacy=Inan|Case=Loc | dwóch | ||
| Animacy=Inan|Case=Nom | dwa | ||
| Case=Acc | dwie | ||
| Case=Gen | dwóch | dwóch | |
| Case=Ins | dwiema | ||
| Case=Loc | dwóch | ||
| Case=Nom | dwa |
AUX
161 AUX tokens (35% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Mood=Ind (161; 100%), Person=EMPTY (161; 100%), Tense=Past (161; 100%), VerbForm=Fin (161; 100%), Voice=Act (161; 100%), Number=Sing (122; 76%), Aspect=Imp (91; 57%).
AUX tokens may have the following values of Gender:
Fem(42; 26% of non-emptyGender): była, została, zostały, byłyMasc(84; 52% of non-emptyGender): był, został, byli, były, zostali, zostałyNeut(35; 22% of non-emptyGender): było, zostało, zostały, byłyEMPTY(299): jest, to, są, by, będzie, em, być, będą, m, śmy
| Paradigm być | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Number=Sing | był | ||
| Animacy=Hum|Number=Plur | byli | ||
| Animacy=Inan|Number=Sing | był | ||
| Animacy=Inan|Number=Plur | były | ||
| Number=Sing | była | było | |
| Number=Plur | były | były |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (1333; 99%),
VERB –[nsubj]–> NOUN (273; 53%),
NOUN –[acl]–> ADJ (226; 98%),
PROPN –[flat]–> PROPN (192; 93%),
NOUN –[det]–> DET (188; 98%),
VERB –[nsubj]–> PROPN (167; 76%),
ADJ –[aux:pass]–> AUX (91; 65%),
PROPN –[amod:flat]–> ADJ (89; 100%),
NOUN –[det:poss]–> DET (80; 100%),
ADJ –[nsubj:pass]–> NOUN (77; 97%).