Treebank Statistics: UD_Polish-LFG: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
58313 tokens (45%) have a non-empty value of Gender.
26293 types (88%) occur at least once with a non-empty value of Gender.
13954 lemmas (89%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (25323; 19% instances), VERB (9421; 7% instances), ADJ (8525; 7% instances), PRON (5742; 4% instances), PROPN (4575; 3% instances), DET (3201; 2% instances), NUM (833; 1% instances), AUX (693; 1% instances).
NOUN
25323 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (18153; 72%), SubGender=EMPTY (13456; 53%).
NOUN tokens may have the following values of Gender:
Fem(9097; 36% of non-emptyGender): pani, chwili, chwilę, głową, pracy, ręce, osób, głowę, kobieta, sprawaMasc(11867; 47% of non-emptyGender): pan, lat, domu, roku, pana, raz, czas, panie, ludzi, ludzieNeut(4359; 17% of non-emptyGender): drzwi, oczy, dzieci, życie, dziecko, miejscu, miejsce, słowa, pytanie, życia
| Paradigm de | Masc | Fem | Neut |
|---|---|---|---|
| Case=Gen | de | ||
| Case=Loc | de | ||
| Case=Nom | de | De |
Gender seems to be lexical feature of NOUN. 100% lemmas (6220) occur only with one value of Gender.
VERB
9421 VERB tokens (44% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=Ind (9421; 100%), Person=EMPTY (9421; 100%), VerbForm=Fin (9421; 100%), Voice=Act (9421; 100%), Tense=Past (9358; 99%), Number=Sing (7533; 80%), Aspect=Perf (5584; 59%), SubGender=Masc1 (5233; 56%).
VERB tokens may have the following values of Gender:
Fem(2321; 25% of non-emptyGender): miała, chciała, mogła, zaczęła, widziała, musiała, powinna, mówiła, spojrzała, stałaMasc(6036; 64% of non-emptyGender): miał, chciał, mógł, widział, zaczął, musiał, mieli, powiedział, stał, byłNeut(1064; 11% of non-emptyGender): było, udało, stało, doszło, okazało, zaczęło, głosowało, zrobiło, należało, powinnoEMPTY(12171): to, ma, mam, jest, można, może, wiem, trzeba, proszę, dziękuję
| Paradigm mieć | Masc | Fem | Neut |
|---|---|---|---|
| Number=Sing | miał | miała | miało |
| Number=Plur | mieli, miały | miały | miały |
ADJ
8525 ADJ tokens (99% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Aspect=EMPTY (7332; 86%), Polarity=EMPTY (7332; 86%), VerbForm=EMPTY (7332; 86%), Voice=EMPTY (7332; 86%), Degree=Pos (6989; 82%), Number=Sing (5897; 69%), SubGender=EMPTY (4631; 54%).
ADJ tokens may have the following values of Gender:
Fem(3225; 38% of non-emptyGender): sama, całą, jedna, jednej, drugiej, pierwszej, cała, druga, całej, jednąMasc(3894; 46% of non-emptyGender): sam, pierwszy, cały, jeden, sami, kolejny, drugi, inni, inny, dobryNeut(1406; 16% of non-emptyGender): całe, jedno, inne, pierwsze, samo, dobre, duże, innego, nowe, drugieEMPTY(61): dawna, daleka, prostu, biało, polsko, rosyjsko, swojemu, wolna, Niemiecku, Sanitarno
| Paradigm sam | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc|Number=Sing | sam | samą | samo |
| Case=Acc|Number=Plur | same, samych | same | same |
| Case=Dat|Number=Sing | samej | ||
| Case=Gen|Number=Sing | samego | samej | samego |
| Case=Gen|Number=Plur | samych | samych | |
| Case=Ins|Number=Sing | samym | samą | samym |
| Case=Loc|Number=Sing | samym | samej | samym |
| Case=Loc|Number=Plur | samych | ||
| Case=Nom|Number=Sing | sam | sama | samo |
| Case=Nom|Number=Plur | sami, same | same | same |
PRON
5742 PRON tokens (62% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Reflex=EMPTY (5742; 100%), Number=Sing (4817; 84%), PrepCase=EMPTY (3601; 63%), PronType=Prs (3567; 62%), SubGender=EMPTY (2982; 52%), Variant=EMPTY (2872; 50%).
PRON tokens may have the following values of Gender:
Fem(1065; 19% of non-emptyGender): jej, ją, ja, mnie, mi, niej, ona, ci, nią, ichMasc(2760; 48% of non-emptyGender): go, mnie, jego, mu, ja, ich, mi, on, nas, ktoNeut(1917; 33% of non-emptyGender): to, co, tym, coś, tego, wszystko, nic, czym, je, czegoEMPTY(3568): się, sobie, siebie, sobą, sie, se, sia
| Paradigm on | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc|Number=Sing|PrepCase=Npr|Variant=Long | jego | ją | je |
| Case=Acc|Number=Sing|PrepCase=Npr|Variant=Short | go | ||
| Case=Acc|Number=Sing|PrepCase=Pre|Variant=Long | niego | nią | nie |
| Case=Acc|Number=Sing|PrepCase=Pre|Variant=Short | ń | ||
| Case=Acc|Number=Plur|PrepCase=Npr|Variant=Long | ich, je | je | je |
| Case=Acc|Number=Plur|PrepCase=Pre|Variant=Long | nich | nie | nie |
| Case=Dat|Number=Sing|PrepCase=Npr|Variant=Long | jemu | jej | |
| Case=Dat|Number=Sing|PrepCase=Npr|Variant=Short | mu | mu | |
| Case=Dat|Number=Sing|PrepCase=Pre|Variant=Long | niemu | niej | |
| Case=Dat|Number=Plur|PrepCase=Npr|Variant=Long | im | im | im |
| Case=Dat|Number=Plur|PrepCase=Pre|Variant=Long | nim | nim | |
| Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jego, iego | jej | jego |
| Case=Gen|Number=Sing|PrepCase=Npr|Variant=Short | go | go | |
| Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niego | niej | niego |
| Case=Gen|Number=Plur|PrepCase=Npr|Variant=Long | ich | ich | ich |
| Case=Gen|Number=Plur|PrepCase=Pre|Variant=Long | nich | nich | nich |
| Case=Ins|Number=Sing|PrepCase=Npr|Variant=Long | nim | nią | nim |
| Case=Ins|Number=Sing|PrepCase=Pre|Variant=Long | nim | nią | nim |
| Case=Ins|Number=Plur|PrepCase=Npr|Variant=Long | nimi | ||
| Case=Ins|Number=Plur|PrepCase=Pre|Variant=Long | nimi | nimi | nimi |
| Case=Loc|Number=Sing|PrepCase=Pre|Variant=Long | nim | niej | nim |
| Case=Loc|Number=Plur|PrepCase=Pre|Variant=Long | nich | nich | nich |
| Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | on | ona | ono, one |
| Case=Nom|Number=Plur|PrepCase=Npr|Variant=Long | oni, one | one | one |
PROPN
4575 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (4255; 93%), SubGender=Masc1 (2451; 54%), Case=Nom (2304; 50%).
PROPN tokens may have the following values of Gender:
Fem(1209; 26% of non-emptyGender): Polsce, Polski, Warszawie, Warszawy, Marta, Polska, AWS, Elizabeth, Ewa, FrancjiMasc(3028; 66% of non-emptyGender): Polacy, Jerzy, Andrzej, SLD, Adam, Bóg, Michał, Krzysztof, Kwaśniewski, NiemcyNeut(338; 7% of non-emptyGender): USA, Niemczech, Niemiec, PSL, Zakopanego, PiS, Stanach, Włoszech, Betlejem, Kielc
| Paradigm PiS | Masc | Fem | Neut |
|---|---|---|---|
| Case=Dat | PiS-owi | ||
| Case=Gen | PiS-u | ||
| Case=Nom | PiS | PiS | PiS |
Gender seems to be lexical feature of PROPN. 99% lemmas (2682) occur only with one value of Gender.
DET
3201 DET tokens (100% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: NumType=EMPTY (2806; 88%), Number[psor]=EMPTY (2772; 87%), Person=EMPTY (2772; 87%), Poss=EMPTY (2455; 77%), Number=Sing (1962; 61%), SubGender=EMPTY (1625; 51%).
DET tokens may have the following values of Gender:
Fem(1092; 34% of non-emptyGender): tej, ta, tę, swoją, taka, te, moja, takie, kilka, tąMasc(1576; 49% of non-emptyGender): ten, tym, tego, te, jakiś, każdy, kilka, mój, taki, wieluNeut(533; 17% of non-emptyGender): to, swoje, tym, moje, takie, tego, takiego, jakieś, te, tych
| Paradigm ten | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc|Number=Sing | ten, tego, tyn | tę, tą, ta, te | to, te |
| Case=Acc|Number=Plur | te, tych | te | te |
| Case=Dat|Number=Sing | tej | temu | |
| Case=Dat|Number=Plur | tym | tym | |
| Case=Gen|Number=Sing | tego | tej | tego |
| Case=Gen|Number=Plur | tych | tych | tych |
| Case=Ins|Number=Sing | tym | tą | tym |
| Case=Ins|Number=Plur | tymi | tymi | tymi |
| Case=Loc|Number=Sing | tym | tej | tym |
| Case=Loc|Number=Plur | tych | tych | tych |
| Case=Nom|Number=Sing | ten | ta | to |
| Case=Nom|Number=Plur | te, ci | te | te |
NUM
833 NUM tokens (100% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Number=Plur (833; 100%), NumType=Card (828; 99%), Case=Acc (561; 67%).
NUM tokens may have the following values of Gender:
Fem(227; 27% of non-emptyGender): dwie, trzy, cztery, obie, obu, pięć, dwóch, 15, trzech, 200Masc(565; 68% of non-emptyGender): dwa, dwóch, trzy, trzech, cztery, czterech, dwadzieścia, obu, sto, pięciuNeut(41; 5% of non-emptyGender): dwa, trzy, oba, 160, cztery, 100, 150, 200, 2000, 24
| Paradigm dwa | Masc | Fem | Neut |
|---|---|---|---|
| Case=Acc | dwa, dwóch | dwie | dwa |
| Case=Gen | dwóch, dwu | dwóch | dwu |
| Case=Ins | dwoma | dwiema, dwoma | |
| Case=Loc | dwóch | dwóch | dwóch |
| Case=Nom | dwa, dwaj | dwie | dwa |
AUX
693 AUX tokens (16% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Mood=Ind (693; 100%), Person=EMPTY (693; 100%), Tense=Past (693; 100%), Variant=EMPTY (693; 100%), VerbForm=Fin (693; 100%), Aspect=Imp (577; 83%), Number=Sing (565; 82%), Voice=Act (540; 78%).
AUX tokens may have the following values of Gender:
Fem(176; 25% of non-emptyGender): była, została, były, zostały, bywała, bywałyMasc(347; 50% of non-emptyGender): był, został, byli, były, zostali, zostały, bywałNeut(170; 25% of non-emptyGender): było, były, zostało, zostałyEMPTY(3554): em, jest, m, by, śmy, są, będzie, eś, ś, być
| Paradigm być | Masc | Fem | Neut |
|---|---|---|---|
| Number=Sing | był | była | było |
| Number=Sing|Voice=Act | był | była | było |
| Number=Plur | były, byli | były | były |
| Number=Plur|Voice=Act | byli, były | były | były |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (5634; 100%),
NOUN –[det]–> DET (2591; 100%),
VERB –[nsubj]–> PROPN (1029; 73%),
NOUN –[acl]–> ADJ (725; 100%),
NOUN –[nummod]–> NUM (716; 100%),
VERB –[conj]–> VERB (670; 64%),
NOUN –[flat]–> PROPN (583; 95%),
PROPN –[flat]–> PROPN (325; 98%),
ADJ –[conj]–> ADJ (265; 93%),
ADJ –[nsubj]–> NOUN (224; 99%).