Treebank Statistics: UD_Czech-PUD: Features: Number
This feature is universal.
It occurs with 3 different values: Dual, Plur, Sing.
Some words have combined values of the feature; 1 combinations have been observed: Plur|Sing.
This is a layered feature with the following layers: Number, Number[psor].
10437 tokens (56%) have a non-empty value of Number.
6630 types (88%) occur at least once with a non-empty value of Number.
4304 lemmas (81%) occur at least once with a non-empty value of Number.
The feature is used with 9 part-of-speech tags: NOUN (4321; 23% instances), ADJ (2230; 12% instances), VERB (1428; 8% instances), PROPN (904; 5% instances), DET (697; 4% instances), AUX (566; 3% instances), PRON (150; 1% instances), NUM (140; 1% instances), CCONJ (1; 0% instances).
NOUN
4321 NOUN tokens (96% of all NOUN tokens) have a non-empty value of Number.
The most frequent other feature values with which NOUN and Number co-occurred: Animacy=EMPTY (2414; 56%).
NOUN tokens may have the following values of Number:
Dual(1; 0% of non-emptyNumber): ušimaPlur(1232; 29% of non-emptyNumber): let, letech, lidí, dolarů, eur, liber, lidé, voleb, obyvatel, datSing(3088; 71% of non-emptyNumber): roce, roku, století, době, oblasti, l, moře, války, území, místoEMPTY(161): DNA, GCA, MPS, Pebe, Really, m, my, t, A, AIDS
| Paradigm rok | Sing | Plur |
|---|---|---|
| Animacy=Inan|Case=Acc|Gender=Masc | rok | roky |
| Animacy=Inan|Case=Gen|Gender=Masc | roku, roka | |
| Animacy=Inan|Case=Ins|Gender=Masc | rokem | |
| Animacy=Inan|Case=Loc|Gender=Masc | roce, roku | |
| Animacy=Inan|Case=Nom|Gender=Masc | rok | |
| Case=Acc|Gender=Neut | léta | |
| Case=Gen|Gender=Neut | let | |
| Case=Ins|Gender=Neut | lety | |
| Case=Loc|Gender=Neut | letech |
ADJ
2230 ADJ tokens (98% of all ADJ tokens) have a non-empty value of Number.
The most frequent other feature values with which ADJ and Number co-occurred: Polarity=Pos (2061; 92%), Degree=Pos (1970; 88%), VerbForm=EMPTY (1814; 81%), Voice=EMPTY (1814; 81%), Animacy=EMPTY (1363; 61%).
ADJ tokens may have the following values of Number:
Dual(1; 0% of non-emptyNumber): nastraženýmaPlur(717; 32% of non-emptyNumber): další, nové, posledních, Spojených, různých, dalších, jiných, malé, nových, prvníPlur,Sing(52; 2% of non-emptyNumber): poražena, vytvořena, založena, chráněna, definována, dána, hlášena, kritizována, obviněna, odstraněnaSing(1460; 65% of non-emptyNumber): první, druhé, jižní, severní, další, hlavní, velká, větší, nové, velkéEMPTY(39): The, National, El, New, Saint, San, a, American, Beverly, Canadian
| Paradigm známý | Plur,Sing | Sing | Plur |
|---|---|---|---|
| Animacy=Anim|Case=Nom|Degree=Sup|Gender=Masc|Polarity=Pos | nejznámější | ||
| Animacy=Inan|Case=Acc|Degree=Pos|Gender=Masc|Polarity=Pos | známý | ||
| Animacy=Inan|Case=Gen|Degree=Pos|Gender=Masc|Polarity=Pos | známých | ||
| Animacy=Inan|Case=Nom|Degree=Pos|Gender=Masc|Polarity=Pos | známý | známé | |
| Case=Nom|Degree=Pos|Gender=Fem|Polarity=Pos | známá | ||
| Case=Nom|Degree=Pos|Gender=Neut|Polarity=Neg | neznámé | ||
| Degree=Pos|Gender=Fem,Neut|Polarity=Pos|Variant=Short | známa | ||
| Degree=Pos|Gender=Neut|Polarity=Pos|Variant=Short | známo |
VERB
1428 VERB tokens (83% of all VERB tokens) have a non-empty value of Number.
The most frequent other feature values with which VERB and Number co-occurred: Voice=Act (1426; 100%), Polarity=Pos (1339; 94%), Animacy=EMPTY (1241; 87%), Mood=EMPTY (880; 62%), Person=EMPTY (880; 62%), Tense=Past (878; 61%), VerbForm=Part (877; 61%).
VERB tokens may have the following values of Number:
Plur(369; 26% of non-emptyNumber): mohou, mají, měly, existují, mohli, musíme, musíte, měli, můžou, poskytujíPlur,Sing(201; 14% of non-emptyNumber): stala, uvedla, mohla, vedla, měla, ukázala, vydala, začala, řekla, umožnilaSing(858; 60% of non-emptyNumber): řekl, má, může, říká, mohl, měl, stal, lze, obsahuje, vedlEMPTY(291): mít, vidět, získat, najít, opustit, pokračovat, stát, vést, dělat, muset
| Paradigm mít | Plur,Sing | Sing | Plur |
|---|---|---|---|
| Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part | neměli | ||
| Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měli | ||
| Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měly | ||
| Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part | neměl | ||
| Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měl | ||
| Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part | neměla | ||
| Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part | měla | ||
| Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part | nemělo | ||
| Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part | mělo | ||
| Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin | máme | ||
| Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin | máte | ||
| Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin | nemá | nemají | |
| Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin | má | mají |
PROPN
904 PROPN tokens (83% of all PROPN tokens) have a non-empty value of Number.
The most frequent other feature values with which PROPN and Number co-occurred: Foreign=EMPTY (858; 95%), Gender=Masc (605; 67%).
PROPN tokens may have the following values of Number:
Plur(68; 8% of non-emptyNumber): USA, Alpy, Andy, Australané, Mayové, News, Číňanů, Řekové, Židů, AboriginciSing(836; 92% of non-emptyNumber): Čína, Francie, Albánie, Británii, Clintonové, Evropě, Itálii, Trump, Trumpa, AmerikyEMPTY(188): Čching, BBC, Danevirke, CNN, EU, Aviva, Bank, Brisbane, Company, Investors
| Paradigm Andy | Sing | Plur |
|---|---|---|
| Animacy=Anim|Case=Dat|Gender=Masc|NameType=Giv | Andymu | |
| Animacy=Anim|Case=Gen|Gender=Masc|NameType=Giv | Andyho | |
| Case=Nom|Gender=Fem|NameType=Geo | Andy |
Number seems to be lexical feature of PROPN. 100% lemmas (636) occur only with one value of Number.
DET
697 DET tokens (83% of all DET tokens) have a non-empty value of Number.
The most frequent other feature values with which DET and Number co-occurred: Number[psor]=EMPTY (642; 92%), Person=EMPTY (642; 92%), Reflex=EMPTY (610; 88%), Animacy=EMPTY (602; 86%), Poss=EMPTY (555; 80%).
DET tokens may have the following values of Number:
Plur(180; 26% of non-emptyNumber): které, kteří, své, tyto, svých, ty, těchto, která, někteří, všechSing(517; 74% of non-emptyNumber): to, který, která, toho, tím, její, tento, tohoto, své, totoEMPTY(144): jeho, jejich, mnoho, několik, více, mnoha, jejichž, víc, jehož, několika
| Paradigm který | Sing | Plur |
|---|---|---|
| Animacy=Anim|Case=Acc|Gender=Masc | kterého | |
| Animacy=Anim|Case=Nom|Gender=Masc | kteří | |
| Animacy=Inan|Case=Acc|Gender=Masc | který | které |
| Animacy=Inan|Case=Nom|Gender=Masc | které | |
| Case=Acc|Gender=Masc | které | |
| Case=Acc|Gender=Fem | kterou | které |
| Case=Acc|Gender=Neut | které | která |
| Case=Dat|Gender=Masc,Neut | kterému | |
| Case=Dat | kterým | |
| Case=Gen|Gender=Masc,Neut | kterého | |
| Case=Gen|Gender=Fem | které | |
| Case=Gen | kterých | |
| Case=Ins | kterými | |
| Case=Loc|Gender=Masc,Neut | kterém | |
| Case=Loc|Gender=Fem | které | |
| Case=Loc | kterých | |
| Case=Nom|Gender=Masc | který | které |
| Case=Nom|Gender=Fem | která | které, která |
| Case=Nom|Gender=Neut | které | která |
AUX
566 AUX tokens (83% of all AUX tokens) have a non-empty value of Number.
The most frequent other feature values with which AUX and Number co-occurred: Aspect=Imp (566; 100%), Voice=Act (562; 99%), Polarity=Pos (516; 91%), Gender=EMPTY (306; 54%), VerbForm=Fin (306; 54%), Mood=Ind (302; 53%).
AUX tokens may have the following values of Number:
Plur(119; 21% of non-emptyNumber): jsou, byly, byli, jsme, budou, nebyly, budeme, jste, nebudou, nejsouPlur,Sing(52; 9% of non-emptyNumber): byla, nebylaSing(395; 70% of non-emptyNumber): je, byl, bylo, bude, jsem, není, nebude, nebyl, byla, buduEMPTY(116): by, být
| Paradigm být | Plur,Sing | Sing | Plur |
|---|---|---|---|
| Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byli | ||
| Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyly | ||
| Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byly | ||
| Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyl, byl | ||
| Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
| Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyla | ||
| Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
| Gender=Fem|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
| Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebylo | ||
| Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bylo | ||
| Mood=Cnd|Person=1|VerbForm=Fin | bych | bychom | |
| Mood=Cnd|Person=2|VerbForm=Fin | byste | ||
| Mood=Ind|Person=1|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudu | ||
| Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | Nejsme | ||
| Mood=Ind|Person=1|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budu | budeme | |
| Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsem | jsme | |
| Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jste | ||
| Mood=Ind|Person=3|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebude | nebudou | |
| Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | není | nejsou | |
| Mood=Ind|Person=3|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | bude | budou | |
| Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je | jsou |
PRON
150 PRON tokens (26% of all PRON tokens) have a non-empty value of Number.
The most frequent other feature values with which PRON and Number co-occurred: Reflex=EMPTY (150; 100%), PronType=Prs (128; 85%), Variant=EMPTY (120; 80%), Person=3 (101; 67%), PrepCase=EMPTY (86; 57%).
PRON tokens may have the following values of Number:
Plur(49; 33% of non-emptyNumber): nich, jim, nimi, nás, je, nichž, nám, jich, ně, ježSing(101; 67% of non-emptyNumber): ho, ní, jí, mu, mě, něj, ji, ním, jenž, nížEMPTY(426): se, si, co, což, nic, něco, kdo, někdo, sebe, sobě
| Paradigm on | Sing | Plur |
|---|---|---|
| Animacy=Anim|Case=Nom|Gender=Masc | oni | |
| Case=Acc|Gender=Masc,Neut|PrepCase=Pre | něj, ho | |
| Case=Acc|Gender=Masc,Neut|Variant=Short | ho | |
| Case=Acc|Gender=Fem | ji | |
| Case=Acc|Gender=Neut | je | |
| Case=Acc|PrepCase=Pre | ně | |
| Case=Acc | je | |
| Case=Dat|Gender=Masc,Neut|PrepCase=Pre | němu | |
| Case=Dat|Gender=Masc,Neut|Variant=Short | mu | |
| Case=Dat|Gender=Fem | jí | |
| Case=Dat | jim | |
| Case=Gen|Gender=Masc,Neut|PrepCase=Pre | něj | |
| Case=Gen|Gender=Fem|PrepCase=Pre | ní | |
| Case=Gen|Gender=Fem | jí | |
| Case=Gen|PrepCase=Pre | nich | |
| Case=Gen | jich | |
| Case=Ins|Gender=Masc,Neut|PrepCase=Pre | ním | |
| Case=Ins|Gender=Masc,Neut | jím | |
| Case=Ins|Gender=Fem|PrepCase=Pre | ní | |
| Case=Ins|PrepCase=Pre | nimi | |
| Case=Loc|Gender=Masc,Neut|PrepCase=Pre | něm | |
| Case=Loc|Gender=Fem|PrepCase=Pre | ní | |
| Case=Loc|PrepCase=Pre | nich | |
| Case=Nom|Gender=Masc | on | |
| Case=Nom|Gender=Fem | ona |
NUM
140 NUM tokens (31% of all NUM tokens) have a non-empty value of Number.
The most frequent other feature values with which NUM and Number co-occurred: NumForm=Word (140; 100%), NumType=Card (140; 100%), Gender=EMPTY (78; 56%).
NUM tokens may have the following values of Number:
Plur(82; 59% of non-emptyNumber): dva, čtyři, dvou, dvě, dvěma, tři, oba, obou, šesti, desetiSing(58; 41% of non-emptyNumber): jedné, jeden, deset, jedna, jedním, jedno, jednoho, jednu, šest, devětEMPTY(319): 1, 3, 20, 2014, 2015, 5, I, 10, 100, 1492
| Paradigm deset | Sing | Plur |
|---|---|---|
| Case=Acc | deset | |
| Case=Gen | deseti |
CCONJ
1 CCONJ tokens (0% of all CCONJ tokens) have a non-empty value of Number.
CCONJ tokens may have the following values of Number:
Sing(1; 100% of non-emptyNumber): iEMPTY(660): a, ale, i, nebo, však, avšak, nicméně, až, ani, tedy
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number:
NOUN –[amod]–> ADJ (1699; 99%),
NOUN –[nmod]–> NOUN (670; 60%),
VERB –[nsubj]–> NOUN (384; 73%),
NOUN –[det]–> DET (321; 79%),
NOUN –[conj]–> NOUN (192; 75%),
VERB –[nsubj]–> PROPN (176; 80%),
NOUN –[nmod]–> PROPN (168; 55%),
ADJ –[aux:pass]–> AUX (146; 89%),
VERB –[conj]–> VERB (131; 78%),
ADJ –[cop]–> AUX (128; 86%).