Treebank Statistics: UD_Polish-MPDT: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
21464 tokens (45%) have a non-empty value of Gender.
11526 types (85%) occur at least once with a non-empty value of Gender.
6150 lemmas (81%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (9730; 21% instances), ADJ (4478; 9% instances), DET (2212; 5% instances), VERB (1805; 4% instances), PROPN (1434; 3% instances), PRON (1323; 3% instances), NUM (276; 1% instances), AUX (206; 0% instances).
NOUN
9730 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (6946; 71%).
NOUN tokens may have the following values of Gender:
Fem(3440; 35% of non-emptyGender): rzeczy, ziemi, części, rzecz, śmierci, potrzeba, częścią, miłości, ojczyzny, wodyMasc(4468; 46% of non-emptyGender): pan, roku, czas, pana, dnia, król, króla, czasu, dzień, ludziNeut(1822; 19% of non-emptyGender): serca, wojsko, miasto, miejsca, życia, miasta, prawo, wojska, prawa, drzewaEMPTY(96): p, X, r, PP, ks, zł, Logar, dń, godź, min
| Paradigm książę | Masc | Neut |
|---|---|---|
| Animacy=Hum|Case=Acc|Number=Plur | Książąt | |
| Animacy=Hum|Case=Nom|Number=Plur | książęta | |
| Case=Acc|Number=Sing | księcia | |
| Case=Dat|Number=Sing | Książęciu | |
| Case=Gen|Number=Sing | książęcia, księcia | Książęcia |
| Case=Gen|Number=Plur | książąt | |
| Case=Ins|Number=Sing | książęciem | |
| Case=Nom|Number=Sing | książę | książę |
| Case=Voc|Number=Sing | Książę |
Gender seems to be lexical feature of NOUN. 99% lemmas (3132) occur only with one value of Gender.
ADJ
4478 ADJ tokens (99% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Degree=Pos (4241; 95%), Aspect=EMPTY (3646; 81%), Polarity=EMPTY (3637; 81%), VerbForm=EMPTY (3637; 81%), Voice=EMPTY (3637; 81%), Number=Sing (3046; 68%).
ADJ tokens may have the following values of Gender:
Fem(1532; 34% of non-emptyGender): jedna, wielką, jednej, całą, inne, jednę, sama, wielka, wielkiej, drugąMasc(2166; 48% of non-emptyGender): sam, jeden, cały, jednego, jednym, samego, wielki, drugiego, on, wszytkichNeut(780; 17% of non-emptyGender): całe, dobrego, wielkie, inne, nowe, wielkim, złote, Bożego, długim, jednoEMPTY(48): ś, S, w, M, Wielm, popielato, wyż, ŚP
| Paradigm wielki | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Case=Acc|Degree=Pos|Number=Plur | Wielkich | ||
| Animacy=Hum|Case=Nom|Degree=Pos|Number=Plur | wielcy | ||
| Animacy=Hum|Case=Nom|Degree=Sup|Number=Plur | najwięksi | ||
| Animacy=Nhum|Case=Acc|Degree=Pos|Number=Sing | Wielkiego | ||
| Case=Acc|Degree=Pos|Number=Sing | wielki | wielką | wielkie |
| Case=Acc|Degree=Pos|Number=Plur | wielkie | wielkie | |
| Case=Dat|Degree=Pos|Number=Sing | wielkiemu | wielkiemu | |
| Case=Dat|Degree=Pos|Number=Plur | wielkim | ||
| Case=Gen|Degree=Pos|Number=Sing | wielkiego | wielkiej | wielkiego |
| Case=Gen|Degree=Pos|Number=Plur | wielkich | wielkich | wielkich |
| Case=Gen|Degree=Sup|Number=Sing | największej | ||
| Case=Ins|Degree=Pos|Number=Sing | wielkim | wielką | wielkim |
| Case=Ins|Degree=Pos|Number=Plur | wielkiemi, wielkimi | wielkiemi | |
| Case=Ins|Degree=Sup|Number=Sing | największym | największą | największym |
| Case=Ins|Degree=Sup|Number=Plur | największemi | ||
| Case=Loc|Degree=Pos|Number=Sing | wielkiej | wielkim | |
| Case=Loc|Degree=Cmp|Number=Plur | większych | ||
| Case=Loc|Degree=Sup|Number=Sing | największej | ||
| Case=Loc|Degree=Sup|Number=Plur | nawiętszych | ||
| Case=Nom|Degree=Pos|Number=Sing | wielki | wielka | wielkie |
| Case=Nom|Degree=Pos|Number=Plur | wielkie | wielkie | |
| Case=Nom|Degree=Cmp|Number=Sing | większe | ||
| Case=Nom|Degree=Sup|Number=Plur | największe | ||
| Case=Voc|Degree=Pos|Number=Plur | wielkie |
DET
2212 DET tokens (100% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Reflex=EMPTY (1986; 90%), Number[psor]=EMPTY (1923; 87%), Person=EMPTY (1923; 87%), Poss=EMPTY (1697; 77%), Number=Sing (1416; 64%).
DET tokens may have the following values of Gender:
Fem(735; 33% of non-emptyGender): tej, ta, której, która, tę, które, którą, swojej, których, tychMasc(1126; 51% of non-emptyGender): który, ten, tego, którzy, tym, tych, które, którego, których, którymNeut(351; 16% of non-emptyGender): które, to, te, tego, moje, tym, wiele, swego, swoje, których
| Paradigm ten | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Case=Acc|Number=Sing | tego | ||
| Animacy=Hum|Case=Acc|Number=Plur | tych | ||
| Animacy=Hum|Case=Nom|Number=Plur | ci | ||
| Animacy=Nhum|Case=Acc|Number=Sing | tego | ||
| Case=Acc|ExtPos=DET|Number=Sing | ten | ||
| Case=Acc|ExtPos=DET|Number=Plur | te | ||
| Case=Acc|Number=Sing | ten | tę | to |
| Case=Acc|Number=Sing|Variant=Short | tę | ||
| Case=Acc|Number=Plur | te | te | te |
| Case=Dat|Number=Sing | temu | tej | |
| Case=Dat|Number=Plur | tym | tym | |
| Case=Gen|Number=Sing | tego | tej | tego |
| Case=Gen|Number=Plur | tych | tych | tych |
| Case=Ins|ExtPos=ADV|Number=Sing | Tym | ||
| Case=Ins|ExtPos=DET|Number=Sing | tym | ||
| Case=Ins|Number=Sing | tym, tem | tą | tym |
| Case=Ins|Number=Plur | temi, tymi | temi | temi |
| Case=Loc|ExtPos=DET|Number=Sing | tym | ||
| Case=Loc|Number=Sing | tym, tem | tej | tym, tem |
| Case=Loc|Number=Plur | tych | tych | tych |
| Case=Nom|ExtPos=DET|Number=Sing | ten | ||
| Case=Nom|Number=Sing | ten | ta | to |
| Case=Nom|Number=Plur | te | te | te |
VERB
1805 VERB tokens (34% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=Ind (1805; 100%), Person=EMPTY (1805; 100%), VerbForm=Fin (1805; 100%), Voice=Act (1805; 100%), Tense=Past (1763; 98%), Number=Sing (1341; 74%), Aspect=Perf (905; 50%).
VERB tokens may have the following values of Gender:
Fem(304; 17% of non-emptyGender): miała, była, mogła, powinna, chciała, musiała, stała, mogły, były, miałyMasc(1279; 71% of non-emptyGender): miał, mieli, mógł, powinien, dał, był, kazał, rzekł, chciał, mówiłNeut(222; 12% of non-emptyGender): było, stało, miało, przyszło, zostało, mogło, działo, należało, pokazało, uczyniłoEMPTY(3429): ma, jest, może, mają, masz, trzeba, mieć, można, będzie, są
| Paradigm mieć | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Number=Plur | mieli | ||
| Number=Sing | miał | miała | miało |
| Number=Plur | miały | miały | miały |
PROPN
1434 PROPN tokens (98% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (1266; 88%).
PROPN tokens may have the following values of Gender:
Fem(294; 21% of non-emptyGender): Warszawie, Rzeczypospolitej, Polski, Polsce, Polszcze, Anglii, MARYI, Moskwa, Francji, MoskwyMasc(1014; 71% of non-emptyGender): Boga, Bóg, Bogu, Boże, Jan, BÓG, Chrystusa, BOGU, Turków, BOŻENeut(126; 9% of non-emptyGender): Niemczech, Węgier, CB, Jeruzalem, A, B, BD, D, E, EBEMPTY(28): M, B, N, K, T, A, D, F, J, O
| Paradigm Salem | Masc | Fem |
|---|---|---|
| Case=Acc | Salem | |
| Case=Nom | Salem |
Gender seems to be lexical feature of PROPN. 99% lemmas (874) occur only with one value of Gender.
PRON
1323 PRON tokens (51% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (1323; 100%), Number=Sing (1058; 80%), Person=3 (730; 55%), PronType=Prs (730; 55%).
PRON tokens may have the following values of Gender:
Fem(180; 14% of non-emptyGender): jej, ją, niej, nich, ona, nią, je, ich, nie, nięMasc(597; 45% of non-emptyGender): jego, ich, go, mu, kto, im, nim, on, nich, niegoNeut(546; 41% of non-emptyGender): to, co, tym, tego, nic, czego, czym, wszystko, cóż, jeEMPTY(1292): się, sobie, mi, ja, mnie, nas, nam, siebie, ciebie, mię
| Paradigm on | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Case=Acc|Number=Sing|PrepCase=Pre|Variant=Short | ń | ||
| Animacy=Hum|Case=Acc|Number=Plur|PrepCase=Npr|Variant=Short | ich | ||
| Animacy=Hum|Case=Acc|Number=Plur|PrepCase=Pre|Variant=Short | nich | ||
| Animacy=Hum|Case=Dat|Number=Plur|PrepCase=Npr|Variant=Long | im | ||
| Animacy=Hum|Case=Dat|Number=Plur|PrepCase=Npr|Variant=Short | im | ||
| Animacy=Hum|Case=Dat|Number=Plur|PrepCase=Pre|Variant=Short | nim | ||
| Animacy=Hum|Case=Gen|Number=Plur|PrepCase=Npr|Variant=Short | ich | ||
| Animacy=Hum|Case=Gen|Number=Plur|PrepCase=Pre|Variant=Short | nich | ||
| Animacy=Hum|Case=Ins|Number=Plur|PrepCase=Pre|Variant=Short | niemi, nimi | ||
| Animacy=Hum|Case=Nom|Number=Plur|PrepCase=Npr|Variant=Short | oni | ||
| Animacy=Hum|Case=Nom|Number=Plur|PrepCase=Pre|Variant=Short | oni | ||
| Case=Acc|Number=Sing|PrepCase=Npr|Variant=Short | go | ją | je |
| Case=Acc|Number=Sing|PrepCase=Pre|Variant=Long | niego | ||
| Case=Acc|Number=Sing|PrepCase=Pre|Variant=Short | ń | nią, nię | nie |
| Case=Acc|Number=Plur|PrepCase=Npr|Variant=Short | je | je, nich | je, ich |
| Case=Acc|Number=Plur|PrepCase=Pre|Variant=Short | nie | nie | nie |
| Case=Dat|Number=Sing|PrepCase=Npr|Variant=Long | jemu | ||
| Case=Dat|Number=Sing|PrepCase=Npr|Variant=Short | mu | jej | mu |
| Case=Dat|Number=Sing|PrepCase=Pre|Variant=Short | niemu | niej | |
| Case=Dat|Number=Plur|PrepCase=Npr|Variant=Short | im, Ich | im | im |
| Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jego | jej | jego |
| Case=Gen|Number=Sing|PrepCase=Npr|Variant=Short | go | jej | go |
| Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niego | ||
| Case=Gen|Number=Sing|PrepCase=Pre|Variant=Short | niej | niego, ń | |
| Case=Gen|Number=Plur|PrepCase=Npr|Variant=Short | ich | ich | ich |
| Case=Gen|Number=Plur|PrepCase=Pre|Variant=Short | nich | nich | nich |
| Case=Ins|Number=Sing|PrepCase=Npr|Variant=Short | nim | nią | |
| Case=Ins|Number=Sing|PrepCase=Pre|Variant=Short | nim, niem | nią | |
| Case=Ins|Number=Plur|PrepCase=Npr|Variant=Short | niemi, nimi | nimi | |
| Case=Ins|Number=Plur|PrepCase=Pre|Variant=Short | nimi | ||
| Case=Loc|Number=Sing|PrepCase=Npr|Variant=Short | nim | niej | nim |
| Case=Loc|Number=Sing|PrepCase=Pre|Variant=Short | nim | niej | nim |
| Case=Loc|Number=Plur|PrepCase=Npr|Variant=Short | nich | nich | |
| Case=Loc|Number=Plur|PrepCase=Pre|Variant=Short | nich | nich | nich |
| Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | on | ||
| Case=Nom|Number=Sing|PrepCase=Npr|Variant=Short | on | ona | |
| Case=Nom|Number=Sing|PrepCase=Pre|Variant=Short | ona | ||
| Case=Nom|Number=Plur|PrepCase=Npr|Variant=Short | one |
Gender seems to be lexical feature of PRON. 92% lemmas (12) occur only with one value of Gender.
NUM
276 NUM tokens (39% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumForm=Word (276; 100%), Number=Plur (244; 88%).
NUM tokens may have the following values of Gender:
Fem(75; 27% of non-emptyGender): dwie, trzy, cztery, dwu, dwóch, moc, pięć, siła, dwadzieścia, dziesięćMasc(177; 64% of non-emptyGender): dwa, pięć, sto, trzy, dwóch, cztery, dwadzieścia, dwaj, ośm, sześćNeut(24; 9% of non-emptyGender): dwoje, czworo, dwie, półtrzecia, cokolwiek, czterech, cztery, dwa, dwiema, dwóchEMPTY(440): 2, 3, 4, 1, 10, 7, 5, 12, 8, 6
| Paradigm dwa | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Case=Acc|Number=Plur | dwóch, dwu, dwoje | ||
| Animacy=Hum|Case=Nom|Number=Plur | dwaj, dwa, dwoje | ||
| Case=Acc|Number=Dual | dwa | dwie | dwie |
| Case=Acc|Number=Plur | dwa | dwie | dwoje, dwa |
| Case=Gen|Number=Dual | dwóch | ||
| Case=Gen|Number=Plur | dwóch, dwu | dwóch, dwu | |
| Case=Ins|Number=Dual | dwiema | ||
| Case=Ins|Number=Plur | dwiema, dwojgiem | dwiema, dwoma | dwiema |
| Case=Loc|Number=Plur | dwu, dwóch | dwu | dwóch |
| Case=Nom|Number=Dual | Dwa | Dwie | dwie |
| Case=Nom|Number=Plur | dwa, Dwoje | dwie | dwoje |
AUX
206 AUX tokens (18% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Mood=Ind (206; 100%), Person=EMPTY (206; 100%), Tense=Past (206; 100%), Variant=EMPTY (206; 100%), VerbForm=Fin (206; 100%), Voice=Act (206; 100%), Aspect=Imp (196; 95%), Number=Sing (150; 73%).
AUX tokens may have the following values of Gender:
Fem(45; 22% of non-emptyGender): była, były, zostałaMasc(114; 55% of non-emptyGender): był, byli, były, zostali, został, bełNeut(47; 23% of non-emptyGender): było, były, beło, zostałoEMPTY(910): jest, by, m, są, być, em, śmy, będzie, ś, to
| Paradigm być | Masc | Fem | Neut |
|---|---|---|---|
| Animacy=Hum|Number=Plur | byli | ||
| Number=Sing | był, beł | była | było, beło |
| Number=Plur | były | były | były |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (2604; 99%),
NOUN –[det]–> DET (937; 99%),
NOUN –[conj]–> NOUN (507; 50%),
NOUN –[det:poss]–> DET (485; 97%),
NOUN –[acl]–> ADJ (414; 98%),
ADJ –[conj]–> ADJ (338; 98%),
VERB –[conj]–> VERB (280; 64%),
NOUN –[nummod]–> NUM (198; 94%),
NOUN –[appos]–> PROPN (150; 64%),
VERB –[nsubj]–> PROPN (134; 65%).