Treebank Statistics: UD_Polish-PDB: Features: Number
This feature is universal.
It occurs with 3 different values: Plur, Ptan, Sing.
This is a layered feature with the following layers: Number, Number[psor].
194527 tokens (56%) have a non-empty value of Number.
60793 types (101%) occur at least once with a non-empty value of Number.
26117 lemmas (94%) occur at least once with a non-empty value of Number.
The feature is used with 8 part-of-speech tags: NOUN (87150; 25% instances), ADJ (35432; 10% instances), VERB (31405; 9% instances), PROPN (11729; 3% instances), PRON (9871; 3% instances), DET (9348; 3% instances), AUX (6959; 2% instances), NUM (2633; 1% instances).
NOUN
87150 NOUN tokens (98% of all NOUN tokens) have a non-empty value of Number.
The most frequent other feature values with which NOUN and Number co-occurred: Animacy=EMPTY (48329; 55%).
NOUN tokens may have the following values of Number:
Plur(22712; 26% of non-emptyNumber): lat, osób, dzieci, ludzi, osoby, ludzie, dni, pieniądze, kobiety, ręcePtan(1407; 2% of non-emptyNumber): drzwi, ramach, okularach, danych, dane, środki, spodenkach, środków, warunki, spodniachSing(63031; 72% of non-emptyNumber): mężczyzna, roku, pan, kobieta, człowiek, pracy, chłopiec, dziewczynka, pani, sposóbEMPTY(1484): r, zł, art, tys, proc, ust, %, ul, godz, mln
| Paradigm człowiek | Sing | Plur | Ptan |
|---|---|---|---|
| Case=Acc | człowieka | ludzi | |
| Case=Dat | człowiekowi | ludziom | |
| Case=Gen | człowieka | ludzi | ludzi |
| Case=Ins | człowiekiem | ludźmi | |
| Case=Loc | człowieku | ludziach | |
| Case=Nom | człowiek, cztowiek | ludzie | |
| Case=Voc | człowieku | ludzie |
ADJ
35432 ADJ tokens (99% of all ADJ tokens) have a non-empty value of Number.
The most frequent other feature values with which ADJ and Number co-occurred: Aspect=EMPTY (28668; 81%), Polarity=EMPTY (28668; 81%), VerbForm=EMPTY (28668; 81%), Voice=EMPTY (28668; 81%), Degree=Pos (27510; 78%), Animacy=EMPTY (19226; 54%).
ADJ tokens may have the following values of Number:
Plur(11387; 32% of non-emptyNumber): innych, inne, różnych, nowych, dotyczące, dotyczących, członkowskich, członkowskie, europejskich, młodychSing(24045; 68% of non-emptyNumber): jeden, sam, europejskiej, pierwszy, jednym, cały, 1, jednej, drugiej, drugiEMPTY(496): prostu, czarno, św, biało, polsko, dawna, daleka, wolna, czerwono, południowo
| Paradigm jeden | Sing | Plur |
|---|---|---|
| Animacy=Hum|Case=Acc|Gender=Masc | jednego | |
| Animacy=Hum|Case=Dat|Gender=Masc | jednemu | |
| Animacy=Hum|Case=Gen|Gender=Masc | jednego | jednych |
| Animacy=Hum|Case=Ins|Gender=Masc | jednym | |
| Animacy=Hum|Case=Loc|Gender=Masc | jednym | |
| Animacy=Hum|Case=Nom|Gender=Masc | jeden | jedni |
| Animacy=Inan|Case=Acc|Gender=Masc | jeden | |
| Animacy=Inan|Case=Gen|Gender=Masc | jednego, JEDNEG0 | jednych |
| Animacy=Inan|Case=Ins|Gender=Masc | jednym | |
| Animacy=Inan|Case=Loc|Gender=Masc | jednym | jednych |
| Animacy=Inan|Case=Nom|Gender=Masc | jeden | jedne |
| Animacy=Nhum|Case=Acc|Gender=Masc | jednego | |
| Animacy=Nhum|Case=Dat|Gender=Masc | jednemu | |
| Animacy=Nhum|Case=Gen|Gender=Masc | jednego | |
| Animacy=Nhum|Case=Loc|Gender=Masc | jednym | |
| Animacy=Nhum|Case=Nom|Gender=Masc | jeden | |
| Case=Acc|Gender=Fem | jedną | |
| Case=Acc|Gender=Neut | jedno | |
| Case=Dat|Gender=Fem | jednej | |
| Case=Gen|Gender=Fem | jednej | jednych |
| Case=Gen|Gender=Neut | jednego | jednych |
| Case=Ins|Gender=Fem | jedną | |
| Case=Ins|Gender=Neut | jednym | |
| Case=Loc|Gender=Fem | jednej | |
| Case=Loc|Gender=Neut | jednym | |
| Case=Nom|Gender=Fem | jedna | jedne |
| Case=Nom|Gender=Neut | jedno |
VERB
31405 VERB tokens (79% of all VERB tokens) have a non-empty value of Number.
The most frequent other feature values with which VERB and Number co-occurred: VerbForm=Fin (31405; 100%), Voice=Act (31288; 100%), Mood=Ind (30819; 98%), Animacy=EMPTY (22207; 71%), Aspect=Imp (21110; 67%), Gender=EMPTY (17195; 55%).
VERB tokens may have the following values of Number:
Plur(7475; 24% of non-emptyNumber): mogą, mają, mamy, muszą, są, mieli, mogli, siedzą, stoją, musimySing(23930; 76% of non-emptyNumber): ma, może, stoi, jest, mówi, siedzi, miał, należy, powiedział, mamEMPTY(8122): można, trzeba, trzymając, być, powiedzieć, mieć, wiadomo, zrobić, znaleźć, patrząc
| Paradigm mieć | Sing | Plur |
|---|---|---|
| Animacy=Hum|Gender=Masc|Mood=Ind|Tense=Past | miał | mieli |
| Animacy=Inan|Gender=Masc|Mood=Ind|Tense=Past | miał | miały |
| Animacy=Nhum|Gender=Masc|Mood=Ind|Tense=Past | miał | |
| Gender=Fem|Mood=Ind|Tense=Past | miała, miala | miały |
| Gender=Neut|Mood=Ind|Tense=Past | miało | miały |
| Mood=Imp|Person=1 | miejmy | |
| Mood=Imp|Person=2 | miejcie | |
| Mood=Ind|Person=1|Tense=Pres | mam | mamy |
| Mood=Ind|Person=2|Tense=Pres | masz | macie |
| Mood=Ind|Person=3|Tense=Pres | ma | mają |
PROPN
11729 PROPN tokens (98% of all PROPN tokens) have a non-empty value of Number.
The most frequent other feature values with which PROPN and Number co-occurred: Gender=Masc (7283; 62%).
PROPN tokens may have the following values of Number:
Plur(410; 3% of non-emptyNumber): Polacy, Polaków, Rosjanie, amerykanie, Niemcy, Niemców, PKP, Francuzi, Indian, ŻydówPtan(317; 3% of non-emptyNumber): USA, Niemczech, Niemiec, Stanów, Włoszech, Chin, Indii, Stanach, Włochy, KatowicachSing(11002; 94% of non-emptyNumber): Polsce, Polski, UE, Europy, Andrzej, Polska, Europie, Warszawie, Jerzy, SLDEMPTY(271): K, S, A, M, J, b, c, H, G, P
| Paradigm Polak | Sing | Plur |
|---|---|---|
| Case=Acc | Polaków | |
| Case=Dat | Polakom | |
| Case=Gen | Polaka | Polaków |
| Case=Ins | Polakiem | Polakami |
| Case=Nom | Polak | Polacy |
Number seems to be lexical feature of PROPN. 99% lemmas (5747) occur only with one value of Number.
PRON
9871 PRON tokens (60% of all PRON tokens) have a non-empty value of Number.
The most frequent other feature values with which PRON and Number co-occurred: Reflex=EMPTY (9871; 100%), PronType=Prs (6042; 61%), PrepCase=EMPTY (5739; 58%), Animacy=EMPTY (5031; 51%).
PRON tokens may have the following values of Number:
Plur(1814; 18% of non-emptyNumber): ich, nich, nas, je, nam, im, one, nimi, oni, myPtan(114; 1% of non-emptyNumber): wszyscy, wszystkich, wszystkim, wszystkimiSing(7943; 80% of non-emptyNumber): to, co, jego, jej, go, mnie, tym, mi, mu, tegoEMPTY(6615): się, sobie, siebie, sobą, sie, se, sia
| Paradigm wszyscy | Sing | Plur | Ptan |
|---|---|---|---|
| Animacy=Hum|Case=Acc|Gender=Masc | wszystkich | wszystkich | |
| Animacy=Hum|Case=Dat|Gender=Masc | wszystkim | ||
| Animacy=Hum|Case=Gen|Gender=Masc | wszystkich | wszystkich | |
| Animacy=Hum|Case=Ins|Gender=Masc | wszystkimi | ||
| Animacy=Hum|Case=Loc|Gender=Masc | wszystkich | wszystkich | |
| Animacy=Hum|Case=Nom|Gender=Masc | wszyscy | wszyscy | |
| Animacy=Inan|Case=Acc|Gender=Masc | wszystkie | ||
| Case=Acc|Gender=Fem | wszystkie | ||
| Case=Nom|Gender=Fem | wszystkie | ||
| Case=Nom|Gender=Neut | wszystkie |
DET
9348 DET tokens (100% of all DET tokens) have a non-empty value of Number.
The most frequent other feature values with which DET and Number co-occurred: Number[psor]=EMPTY (8406; 90%), Person=EMPTY (8406; 90%), Poss=EMPTY (7636; 82%), Animacy=EMPTY (4680; 50%).
DET tokens may have the following values of Number:
Plur(3859; 41% of non-emptyNumber): które, te, tych, którzy, których, kilka, wszystkie, wszystkich, wiele, takichSing(5489; 59% of non-emptyNumber): ten, który, tej, tym, tego, która, którym, to, ta, którego
| Paradigm ten | Sing | Plur |
|---|---|---|
| Animacy=Hum|Case=Acc|Gender=Masc | tego | tych |
| Animacy=Hum|Case=Dat|Gender=Masc | temu | tym |
| Animacy=Hum|Case=Gen|Gender=Masc | tego | tych |
| Animacy=Hum|Case=Ins|Gender=Masc | tym | tymi |
| Animacy=Hum|Case=Loc|Gender=Masc | tym | tych |
| Animacy=Hum|Case=Nom|Gender=Masc | ten | ci |
| Animacy=Inan|Case=Acc|Gender=Masc | ten, tego | te |
| Animacy=Inan|Case=Dat|Gender=Masc | temu | tym |
| Animacy=Inan|Case=Gen|Gender=Masc | tego | tych |
| Animacy=Inan|Case=Ins|Gender=Masc | tym | tymi |
| Animacy=Inan|Case=Loc|Gender=Masc | tym | tych |
| Animacy=Inan|Case=Nom|Gender=Masc | ten | te |
| Animacy=Nhum|Case=Acc|Gender=Masc | tego | te |
| Animacy=Nhum|Case=Dat|Gender=Masc | temu | |
| Animacy=Nhum|Case=Gen|Gender=Masc | tych | |
| Animacy=Nhum|Case=Ins|Gender=Masc | tymi | |
| Animacy=Nhum|Case=Nom|Gender=Masc | ten | te |
| Case=Acc|Gender=Fem | tę, tą | te |
| Case=Acc|Gender=Neut | to, te | te |
| Case=Dat|Gender=Fem | tej | tym |
| Case=Dat|Gender=Neut | temu | tym |
| Case=Gen|Gender=Fem | tej | tych |
| Case=Gen|Gender=Neut | tego | tych |
| Case=Ins|Gender=Fem | tą | tymi |
| Case=Ins|Gender=Neut | tym | tymi |
| Case=Loc|Gender=Fem | tej | tych |
| Case=Loc|Gender=Neut | tym | tych |
| Case=Nom|Gender=Fem | ta | te |
| Case=Nom|Gender=Neut | to | te |
AUX
6959 AUX tokens (79% of all AUX tokens) have a non-empty value of Number.
The most frequent other feature values with which AUX and Number co-occurred: Aspect=Imp (6539; 94%), Gender=EMPTY (5609; 81%), Variant=EMPTY (4820; 69%), VerbForm=Fin (4820; 69%), Mood=Ind (4811; 69%), Voice=Act (3833; 55%).
AUX tokens may have the following values of Number:
Plur(1664; 24% of non-emptyNumber): są, śmy, będą, były, będziemy, byli, zostały, zostaną, jesteśmy, ścieSing(5295; 76% of non-emptyNumber): jest, em, będzie, m, był, było, była, eś, jestem, zostałEMPTY(1816): to, by, być, zostać, niech, będąc, niechaj, Niechby, byc, niechże
| Paradigm być | Sing | Plur |
|---|---|---|
| Animacy=Hum|Gender=Masc|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | był, byl | byli |
| Animacy=Inan|Gender=Masc|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | był | były |
| Animacy=Nhum|Gender=Masc|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | był | Były |
| Gender=Fem|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | była | były |
| Gender=Neut|Mood=Ind|Tense=Past|VerbForm=Fin|Voice=Act | było | były, była |
| Mood=Imp|Person=2|VerbForm=Fin|Voice=Act | bądź | |
| Mood=Ind|Person=1|Tense=Fut|VerbForm=Fin | będę | będziemy, będziem |
| Mood=Ind|Person=1|Tense=Pres|VerbForm=Fin|Voice=Act | jestem | jesteśmy |
| Mood=Ind|Person=2|Tense=Fut|VerbForm=Fin | będziesz, bedziesz | będziecie |
| Mood=Ind|Person=2|Tense=Pres|VerbForm=Fin|Voice=Act | jesteś | jesteście, ście |
| Mood=Ind|Person=3|Tense=Fut|VerbForm=Fin | będzie, bedzie | będą |
| Mood=Ind|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | jest | są |
| Person=1|Variant=Long | em | |
| Person=1|Variant=Short | m | śmy |
| Person=2|Variant=Long | eś | |
| Person=2|Variant=Short | ś | ście, śmy |
NUM
2633 NUM tokens (100% of all NUM tokens) have a non-empty value of Number.
The most frequent other feature values with which NUM and Number co-occurred: Gender=Masc (1853; 70%), NumForm=Word (1355; 51%), Animacy=Inan (1332; 51%).
NUM tokens may have the following values of Number:
Plur(2575; 98% of non-emptyNumber): dwie, dwa, dwóch, trzy, trzech, 10, cztery, 3, pięć, 2Sing(58; 2% of non-emptyNumber): pół, półtora, 1, 35, półtorej, 0,4, 0,5, 1,9, 13, 15
| Paradigm pół | Sing | Plur |
|---|---|---|
| Animacy=Inan|Case=Acc|Gender=Masc | pół | pół |
| Animacy=Inan|Case=Gen|Gender=Masc | pół | |
| Animacy=Inan|Case=Loc|Gender=Masc | pół | |
| Animacy=Inan|Case=Nom|Gender=Masc | pół | pół |
| Case=Acc|Gender=Fem | pół | |
| Case=Acc|Gender=Neut | pół | pół |
| Case=Loc|Gender=Fem | pół | |
| Case=Nom|Gender=Neut | pół |
Number seems to be lexical feature of NUM. 98% lemmas (397) occur only with one value of Number.
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number:
NOUN –[amod]–> ADJ (21260; 96%),
VERB –[nsubj]–> NOUN (11379; 92%),
NOUN –[nmod]–> NOUN (7783; 64%),
VERB –[obl]–> NOUN (6924; 55%),
NOUN –[acl]–> ADJ (4470; 98%),
NOUN –[nmod:arg]–> NOUN (4411; 59%),
NOUN –[conj]–> NOUN (4321; 78%),
NOUN –[det]–> DET (3904; 98%),
VERB –[conj]–> VERB (3838; 82%),
VERB –[obl:arg]–> NOUN (2276; 50%).