Treebank Statistics: UD_Polish-LFG: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
58313 tokens (45%) have a non-empty value of Gender
.
26293 types (88%) occur at least once with a non-empty value of Gender
.
13954 lemmas (89%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (25323; 19% instances), VERB (9421; 7% instances), ADJ (8525; 7% instances), PRON (5742; 4% instances), PROPN (4575; 3% instances), DET (3201; 2% instances), NUM (833; 1% instances), AUX (693; 1% instances).
NOUN
25323 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (18153; 72%), SubGender=EMPTY (13456; 53%).
NOUN
tokens may have the following values of Gender
:
Fem
(9097; 36% of non-emptyGender
): pani, chwili, chwilę, głową, pracy, ręce, osób, głowę, kobieta, sprawaMasc
(11867; 47% of non-emptyGender
): pan, lat, domu, roku, pana, raz, czas, panie, ludzi, ludzieNeut
(4359; 17% of non-emptyGender
): drzwi, oczy, dzieci, życie, dziecko, miejscu, miejsce, słowa, pytanie, życia
Paradigm de | Masc | Fem | Neut |
---|---|---|---|
Case=Gen | de | ||
Case=Loc | de | ||
Case=Nom | de | De |
Gender
seems to be lexical feature of NOUN
. 100% lemmas (6220) occur only with one value of Gender
.
VERB
9421 VERB tokens (44% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Mood=Ind (9421; 100%), Person=EMPTY (9421; 100%), VerbForm=Fin (9421; 100%), Voice=Act (9421; 100%), Tense=Past (9358; 99%), Number=Sing (7533; 80%), Aspect=Perf (5584; 59%), SubGender=Masc1 (5233; 56%).
VERB
tokens may have the following values of Gender
:
Fem
(2321; 25% of non-emptyGender
): miała, chciała, mogła, zaczęła, widziała, musiała, powinna, mówiła, spojrzała, stałaMasc
(6036; 64% of non-emptyGender
): miał, chciał, mógł, widział, zaczął, musiał, mieli, powiedział, stał, byłNeut
(1064; 11% of non-emptyGender
): było, udało, stało, doszło, okazało, zaczęło, głosowało, zrobiło, należało, powinnoEMPTY
(12171): to, ma, mam, jest, można, może, wiem, trzeba, proszę, dziękuję
Paradigm mieć | Masc | Fem | Neut |
---|---|---|---|
Number=Sing | miał | miała | miało |
Number=Plur | mieli, miały | miały | miały |
ADJ
8525 ADJ tokens (99% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Aspect=EMPTY (7332; 86%), Polarity=EMPTY (7332; 86%), VerbForm=EMPTY (7332; 86%), Voice=EMPTY (7332; 86%), Degree=Pos (6989; 82%), Number=Sing (5897; 69%), SubGender=EMPTY (4631; 54%).
ADJ
tokens may have the following values of Gender
:
Fem
(3225; 38% of non-emptyGender
): sama, całą, jedna, jednej, drugiej, pierwszej, cała, druga, całej, jednąMasc
(3894; 46% of non-emptyGender
): sam, pierwszy, cały, jeden, sami, kolejny, drugi, inni, inny, dobryNeut
(1406; 16% of non-emptyGender
): całe, jedno, inne, pierwsze, samo, dobre, duże, innego, nowe, drugieEMPTY
(61): dawna, daleka, prostu, biało, polsko, rosyjsko, swojemu, wolna, Niemiecku, Sanitarno
Paradigm sam | Masc | Fem | Neut |
---|---|---|---|
Case=Acc|Number=Sing | sam | samą | samo |
Case=Acc|Number=Plur | same, samych | same | same |
Case=Dat|Number=Sing | samej | ||
Case=Gen|Number=Sing | samego | samej | samego |
Case=Gen|Number=Plur | samych | samych | |
Case=Ins|Number=Sing | samym | samą | samym |
Case=Loc|Number=Sing | samym | samej | samym |
Case=Loc|Number=Plur | samych | ||
Case=Nom|Number=Sing | sam | sama | samo |
Case=Nom|Number=Plur | sami, same | same | same |
PRON
5742 PRON tokens (62% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Reflex=EMPTY (5742; 100%), Number=Sing (4817; 84%), PrepCase=EMPTY (3601; 63%), PronType=Prs (3567; 62%), SubGender=EMPTY (2982; 52%), Variant=EMPTY (2872; 50%).
PRON
tokens may have the following values of Gender
:
Fem
(1065; 19% of non-emptyGender
): jej, ją, ja, mnie, mi, niej, ona, ci, nią, ichMasc
(2760; 48% of non-emptyGender
): go, mnie, jego, mu, ja, ich, mi, on, nas, ktoNeut
(1917; 33% of non-emptyGender
): to, co, tym, coś, tego, wszystko, nic, czym, je, czegoEMPTY
(3568): się, sobie, siebie, sobą, sie, se, sia
Paradigm on | Masc | Fem | Neut |
---|---|---|---|
Case=Acc|Number=Sing|PrepCase=Npr|Variant=Long | jego | ją | je |
Case=Acc|Number=Sing|PrepCase=Npr|Variant=Short | go | ||
Case=Acc|Number=Sing|PrepCase=Pre|Variant=Long | niego | nią | nie |
Case=Acc|Number=Sing|PrepCase=Pre|Variant=Short | ń | ||
Case=Acc|Number=Plur|PrepCase=Npr|Variant=Long | ich, je | je | je |
Case=Acc|Number=Plur|PrepCase=Pre|Variant=Long | nich | nie | nie |
Case=Dat|Number=Sing|PrepCase=Npr|Variant=Long | jemu | jej | |
Case=Dat|Number=Sing|PrepCase=Npr|Variant=Short | mu | mu | |
Case=Dat|Number=Sing|PrepCase=Pre|Variant=Long | niemu | niej | |
Case=Dat|Number=Plur|PrepCase=Npr|Variant=Long | im | im | im |
Case=Dat|Number=Plur|PrepCase=Pre|Variant=Long | nim | nim | |
Case=Gen|Number=Sing|PrepCase=Npr|Variant=Long | jego, iego | jej | jego |
Case=Gen|Number=Sing|PrepCase=Npr|Variant=Short | go | go | |
Case=Gen|Number=Sing|PrepCase=Pre|Variant=Long | niego | niej | niego |
Case=Gen|Number=Plur|PrepCase=Npr|Variant=Long | ich | ich | ich |
Case=Gen|Number=Plur|PrepCase=Pre|Variant=Long | nich | nich | nich |
Case=Ins|Number=Sing|PrepCase=Npr|Variant=Long | nim | nią | nim |
Case=Ins|Number=Sing|PrepCase=Pre|Variant=Long | nim | nią | nim |
Case=Ins|Number=Plur|PrepCase=Npr|Variant=Long | nimi | ||
Case=Ins|Number=Plur|PrepCase=Pre|Variant=Long | nimi | nimi | nimi |
Case=Loc|Number=Sing|PrepCase=Pre|Variant=Long | nim | niej | nim |
Case=Loc|Number=Plur|PrepCase=Pre|Variant=Long | nich | nich | nich |
Case=Nom|Number=Sing|PrepCase=Npr|Variant=Long | on | ona | ono, one |
Case=Nom|Number=Plur|PrepCase=Npr|Variant=Long | oni, one | one | one |
PROPN
4575 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (4255; 93%), SubGender=Masc1 (2451; 54%), Case=Nom (2304; 50%).
PROPN
tokens may have the following values of Gender
:
Fem
(1209; 26% of non-emptyGender
): Polsce, Polski, Warszawie, Warszawy, Marta, Polska, AWS, Elizabeth, Ewa, FrancjiMasc
(3028; 66% of non-emptyGender
): Polacy, Jerzy, Andrzej, SLD, Adam, Bóg, Michał, Krzysztof, Kwaśniewski, NiemcyNeut
(338; 7% of non-emptyGender
): USA, Niemczech, Niemiec, PSL, Zakopanego, PiS, Stanach, Włoszech, Betlejem, Kielc
Paradigm PiS | Masc | Fem | Neut |
---|---|---|---|
Case=Dat | PiS-owi | ||
Case=Gen | PiS-u | ||
Case=Nom | PiS | PiS | PiS |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (2682) occur only with one value of Gender
.
DET
3201 DET tokens (100% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: NumType=EMPTY (2806; 88%), Number[psor]=EMPTY (2772; 87%), Person=EMPTY (2772; 87%), Poss=EMPTY (2455; 77%), Number=Sing (1962; 61%), SubGender=EMPTY (1625; 51%).
DET
tokens may have the following values of Gender
:
Fem
(1092; 34% of non-emptyGender
): tej, ta, tę, swoją, taka, te, moja, takie, kilka, tąMasc
(1576; 49% of non-emptyGender
): ten, tym, tego, te, jakiś, każdy, kilka, mój, taki, wieluNeut
(533; 17% of non-emptyGender
): to, swoje, tym, moje, takie, tego, takiego, jakieś, te, tych
Paradigm ten | Masc | Fem | Neut |
---|---|---|---|
Case=Acc|Number=Sing | ten, tego, tyn | tę, tą, ta, te | to, te |
Case=Acc|Number=Plur | te, tych | te | te |
Case=Dat|Number=Sing | tej | temu | |
Case=Dat|Number=Plur | tym | tym | |
Case=Gen|Number=Sing | tego | tej | tego |
Case=Gen|Number=Plur | tych | tych | tych |
Case=Ins|Number=Sing | tym | tą | tym |
Case=Ins|Number=Plur | tymi | tymi | tymi |
Case=Loc|Number=Sing | tym | tej | tym |
Case=Loc|Number=Plur | tych | tych | tych |
Case=Nom|Number=Sing | ten | ta | to |
Case=Nom|Number=Plur | te, ci | te | te |
NUM
833 NUM tokens (100% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Number=Plur (833; 100%), NumType=Card (828; 99%), Case=Acc (561; 67%).
NUM
tokens may have the following values of Gender
:
Fem
(227; 27% of non-emptyGender
): dwie, trzy, cztery, obie, obu, pięć, dwóch, 15, trzech, 200Masc
(565; 68% of non-emptyGender
): dwa, dwóch, trzy, trzech, cztery, czterech, dwadzieścia, obu, sto, pięciuNeut
(41; 5% of non-emptyGender
): dwa, trzy, oba, 160, cztery, 100, 150, 200, 2000, 24
Paradigm dwa | Masc | Fem | Neut |
---|---|---|---|
Case=Acc | dwa, dwóch | dwie | dwa |
Case=Gen | dwóch, dwu | dwóch | dwu |
Case=Ins | dwoma | dwiema, dwoma | |
Case=Loc | dwóch | dwóch | dwóch |
Case=Nom | dwa, dwaj | dwie | dwa |
AUX
693 AUX tokens (16% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Mood=Ind (693; 100%), Person=EMPTY (693; 100%), Tense=Past (693; 100%), Variant=EMPTY (693; 100%), VerbForm=Fin (693; 100%), Aspect=Imp (577; 83%), Number=Sing (565; 82%), Voice=Act (540; 78%).
AUX
tokens may have the following values of Gender
:
Fem
(176; 25% of non-emptyGender
): była, została, były, zostały, bywała, bywałyMasc
(347; 50% of non-emptyGender
): był, został, byli, były, zostali, zostały, bywałNeut
(170; 25% of non-emptyGender
): było, były, zostało, zostałyEMPTY
(3554): em, jest, m, by, śmy, są, będzie, eś, ś, być
Paradigm być | Masc | Fem | Neut |
---|---|---|---|
Number=Sing | był | była | było |
Number=Sing|Voice=Act | był | była | było |
Number=Plur | były, byli | były | były |
Number=Plur|Voice=Act | byli, były | były | były |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (5634; 100%),
NOUN –[det]–> DET (2591; 100%),
VERB –[nsubj]–> PROPN (1029; 73%),
NOUN –[acl]–> ADJ (725; 100%),
NOUN –[nummod]–> NUM (716; 100%),
VERB –[conj]–> VERB (670; 64%),
NOUN –[flat]–> PROPN (583; 95%),
PROPN –[flat]–> PROPN (325; 98%),
ADJ –[conj]–> ADJ (265; 93%),
ADJ –[nsubj]–> NOUN (224; 99%).