Treebank Statistics: UD_Czech-PUD: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
Some words have combined values of the feature; 1 combinations have been observed: Plur|Sing
.
This is a layered feature with the following layers: Number, Number[psor].
10440 tokens (56%) have a non-empty value of Number
.
6631 types (88%) occur at least once with a non-empty value of Number
.
4303 lemmas (81%) occur at least once with a non-empty value of Number
.
The feature is used with 9 part-of-speech tags: NOUN (4322; 23% instances), ADJ (2230; 12% instances), VERB (1428; 8% instances), PROPN (903; 5% instances), DET (700; 4% instances), AUX (566; 3% instances), PRON (150; 1% instances), NUM (140; 1% instances), CCONJ (1; 0% instances).
NOUN
4322 NOUN tokens (96% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Polarity=Pos (4314; 100%), Animacy=EMPTY (2413; 56%).
NOUN
tokens may have the following values of Number
:
Dual
(1; 0% of non-emptyNumber
): ušimaPlur
(1232; 29% of non-emptyNumber
): let, letech, lidí, dolarů, eur, liber, lidé, voleb, obyvatel, datSing
(3089; 71% of non-emptyNumber
): roce, roku, století, době, oblasti, l, moře, války, území, místoEMPTY
(161): DNA, GCA, MPS, Pebe, Really, m, my, t, A, AIDS
Paradigm rok | Sing | Plur |
---|---|---|
Animacy=Inan|Case=Acc|Gender=Masc | rok | roky |
Animacy=Inan|Case=Gen|Gender=Masc | roku, roka | |
Animacy=Inan|Case=Ins|Gender=Masc | rokem | |
Animacy=Inan|Case=Loc|Gender=Masc | roce, roku | |
Animacy=Inan|Case=Nom|Gender=Masc | rok | |
Case=Acc|Gender=Neut | léta | |
Case=Gen|Gender=Neut | let | |
Case=Ins|Gender=Neut | lety | |
Case=Loc|Gender=Neut | letech |
ADJ
2230 ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Polarity=Pos (2061; 92%), VerbForm=EMPTY (1815; 81%), Voice=EMPTY (1815; 81%), Degree=Pos (1749; 78%), Animacy=EMPTY (1362; 61%).
ADJ
tokens may have the following values of Number
:
Dual
(1; 0% of non-emptyNumber
): nastraženýmaPlur
(717; 32% of non-emptyNumber
): další, nové, posledních, Spojených, různých, dalších, jiných, malé, nových, prvníPlur,Sing
(53; 2% of non-emptyNumber
): poražena, vytvořena, založena, chráněna, definována, dána, hlášena, kritizována, obviněna, odstraněnaSing
(1459; 65% of non-emptyNumber
): první, druhé, jižní, severní, další, hlavní, velká, větší, nové, velkéEMPTY
(39): The, National, El, New, Saint, San, a, American, Beverly, Canadian
Paradigm známý | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Case=Nom|Degree=Sup|Gender=Masc|Polarity=Pos | nejznámější | ||
Animacy=Inan|Case=Acc|Degree=Pos|Gender=Masc|Polarity=Pos | známý | ||
Animacy=Inan|Case=Gen|Degree=Pos|Gender=Masc|Polarity=Pos | známých | ||
Animacy=Inan|Case=Nom|Degree=Pos|Gender=Masc|Polarity=Pos | známý | známé | |
Case=Nom|Degree=Pos|Gender=Fem|Polarity=Pos | známá | ||
Case=Nom|Degree=Pos|Gender=Neut|Polarity=Neg | neznámé | ||
Gender=Fem,Neut|Polarity=Pos|Variant=Short | známa | ||
Gender=Neut|Polarity=Pos|Variant=Short | známo |
VERB
1428 VERB tokens (83% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Voice=Act (1426; 100%), Polarity=Pos (1339; 94%), Animacy=EMPTY (1241; 87%), Mood=EMPTY (880; 62%), Person=EMPTY (880; 62%), Tense=Past (878; 61%), VerbForm=Part (877; 61%).
VERB
tokens may have the following values of Number
:
Plur
(368; 26% of non-emptyNumber
): mohou, mají, měly, existují, mohli, musíme, musíte, měli, můžou, poskytujíPlur,Sing
(201; 14% of non-emptyNumber
): stala, uvedla, mohla, vedla, měla, ukázala, vydala, začala, řekla, umožnilaSing
(859; 60% of non-emptyNumber
): řekl, má, může, říká, mohl, měl, stal, lze, obsahuje, vedlEMPTY
(291): mít, vidět, získat, najít, opustit, pokračovat, stát, vést, dělat, muset
Paradigm mít | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part | neměli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měly | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part | neměl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part | měl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part | neměla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part | měla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part | nemělo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part | mělo | ||
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin | máme | ||
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin | máte | ||
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin | nemá | nemají | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin | má | mají |
PROPN
903 PROPN tokens (83% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Polarity=Pos (903; 100%), Foreign=EMPTY (857; 95%), Gender=Masc (604; 67%).
PROPN
tokens may have the following values of Number
:
Plur
(68; 8% of non-emptyNumber
): USA, Alpy, Andy, Australané, Mayové, News, Číňanů, Řekové, Židů, AboriginciSing
(835; 92% of non-emptyNumber
): Čína, Francie, Albánie, Británii, Clintonové, Evropě, Itálii, Trump, Trumpa, AmerikyEMPTY
(188): Čching, BBC, Danevirke, CNN, EU, Aviva, Bank, Brisbane, Company, Investors
Paradigm Andy | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Dat|Gender=Masc|NameType=Giv | Andymu | |
Animacy=Anim|Case=Gen|Gender=Masc|NameType=Giv | Andyho | |
Case=Nom|Gender=Fem|NameType=Geo | Andy |
Number
seems to be lexical feature of PROPN
. 100% lemmas (635) occur only with one value of Number
.
DET
700 DET tokens (83% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Number[psor]=EMPTY (645; 92%), Person=EMPTY (645; 92%), Reflex=EMPTY (613; 88%), Animacy=EMPTY (605; 86%), Poss=EMPTY (558; 80%).
DET
tokens may have the following values of Number
:
Plur
(180; 26% of non-emptyNumber
): které, kteří, své, tyto, svých, ty, těchto, která, někteří, všechSing
(520; 74% of non-emptyNumber
): to, který, která, toho, tím, její, tento, tohoto, své, totoEMPTY
(144): jeho, jejich, mnoho, několik, více, mnoha, jejichž, víc, jehož, několika
Paradigm ten | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Acc|Gender=Masc | ty | |
Animacy=Inan|Case=Acc|Gender=Masc | ten | |
Animacy=Inan|Case=Nom|Gender=Masc | ty | |
Case=Acc|Gender=Fem | ty | |
Case=Acc|Gender=Neut | to | |
Case=Dat|Gender=Masc,Neut | tomu | |
Case=Dat | těm | |
Case=Gen|Gender=Masc,Neut | toho | |
Case=Gen|Gender=Fem | té | |
Case=Gen | těch | |
Case=Ins|Gender=Masc,Neut | tím | |
Case=Ins|Gender=Fem | tou | |
Case=Ins | těmi | |
Case=Loc|Gender=Masc,Neut | tom | |
Case=Loc|Gender=Fem | té | |
Case=Nom|Gender=Masc | ten | |
Case=Nom|Gender=Fem | ta | ty |
Case=Nom|Gender=Neut | to |
AUX
566 AUX tokens (83% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Voice=Act (562; 99%), Polarity=Pos (516; 91%), Gender=EMPTY (306; 54%), VerbForm=Fin (306; 54%), Mood=Ind (302; 53%).
AUX
tokens may have the following values of Number
:
Plur
(119; 21% of non-emptyNumber
): jsou, byly, byli, jsme, budou, nebyly, budeme, jste, nebudou, nejsouPlur,Sing
(53; 9% of non-emptyNumber
): byla, nebylaSing
(394; 70% of non-emptyNumber
): je, byl, bylo, bude, jsem, není, nebude, nebyl, budu, bychEMPTY
(117): by, být
Paradigm být | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byly | ||
Aspect=Imp|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
Gender=Fem|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebylo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bylo | ||
Mood=Cnd|Person=1|VerbForm=Fin | bych | bychom | |
Mood=Cnd|Person=2|VerbForm=Fin | byste | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudu | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | Nejsme | ||
Mood=Ind|Person=1|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budu | budeme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsem | jsme | |
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jste | ||
Mood=Ind|Person=3|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebude | nebudou | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | není | nejsou | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | bude | budou | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je | jsou |
PRON
150 PRON tokens (26% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (150; 100%), PronType=Prs (128; 85%), Variant=EMPTY (120; 80%), Person=3 (101; 67%), PrepCase=EMPTY (86; 57%).
PRON
tokens may have the following values of Number
:
Plur
(49; 33% of non-emptyNumber
): nich, jim, nimi, nás, je, nichž, nám, jich, ně, ježSing
(101; 67% of non-emptyNumber
): ho, ní, jí, mu, mě, ji, něj, ním, jenž, nížEMPTY
(426): se, si, co, což, nic, něco, kdo, někdo, sebe, sobě
Paradigm on | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Nom|Gender=Masc | oni | |
Case=Acc|Gender=Masc,Neut|PrepCase=Pre | něj, ho, něho | |
Case=Acc|Gender=Masc,Neut|Variant=Short | ho | |
Case=Acc|Gender=Fem | ji | |
Case=Acc|Gender=Neut | je | |
Case=Acc|PrepCase=Pre | ně | |
Case=Acc | je | |
Case=Dat|Gender=Masc,Neut|PrepCase=Pre | němu | |
Case=Dat|Gender=Masc,Neut|Variant=Short | mu | |
Case=Dat|Gender=Fem | jí | |
Case=Dat | jim | |
Case=Gen|Gender=Masc,Neut|PrepCase=Pre | něj | |
Case=Gen|Gender=Fem|PrepCase=Pre | ní | |
Case=Gen|Gender=Fem | jí | |
Case=Gen|PrepCase=Pre | nich | |
Case=Gen | jich | |
Case=Ins|Gender=Masc,Neut|PrepCase=Pre | ním | |
Case=Ins|Gender=Masc,Neut | jím | |
Case=Ins|Gender=Fem|PrepCase=Pre | ní | |
Case=Ins|PrepCase=Pre | nimi | |
Case=Loc|Gender=Masc,Neut|PrepCase=Pre | něm | |
Case=Loc|Gender=Fem|PrepCase=Pre | ní | |
Case=Loc|PrepCase=Pre | nich | |
Case=Nom|Gender=Masc | on | |
Case=Nom|Gender=Fem | ona |
NUM
140 NUM tokens (31% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumForm=Word (140; 100%), NumType=Card (140; 100%), Gender=EMPTY (78; 56%).
NUM
tokens may have the following values of Number
:
Plur
(82; 59% of non-emptyNumber
): dva, čtyři, dvou, dvě, dvěma, tři, oba, obou, šesti, desetiSing
(58; 41% of non-emptyNumber
): jedné, jeden, deset, jedna, jedním, jedno, jednoho, jednu, šest, devětEMPTY
(319): 1, 3, 20, 2014, 2015, 5, I, 10, 100, 1492
Paradigm deset | Sing | Plur |
---|---|---|
Case=Acc | deset | |
Case=Gen | deseti |
CCONJ
1 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Number
.
CCONJ
tokens may have the following values of Number
:
Sing
(1; 100% of non-emptyNumber
): iEMPTY
(659): a, ale, i, nebo, však, avšak, nicméně, až, ani, tedy
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (1704; 99%),
NOUN –[nmod]–> NOUN (667; 60%),
VERB –[nsubj]–> NOUN (383; 73%),
NOUN –[det]–> DET (321; 78%),
NOUN –[conj]–> NOUN (192; 75%),
VERB –[nsubj]–> PROPN (175; 80%),
NOUN –[nmod]–> PROPN (168; 55%),
ADJ –[aux:pass]–> AUX (146; 89%),
VERB –[conj]–> VERB (131; 78%),
ADJ –[cop]–> AUX (128; 86%).