Treebank Statistics: UD_Czech-PDT: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
Some words have combined values of the feature; 1 combinations have been observed: Plur|Sing
.
This is a layered feature with the following layers: Number, Number[psor].
182764 tokens (55%) have a non-empty value of Number
.
51294 types (97%) occur at least once with a non-empty value of Number
.
22267 lemmas (83%) occur at least once with a non-empty value of Number
.
The feature is used with 8 part-of-speech tags: NOUN (78979; 24% instances), ADJ (40449; 12% instances), VERB (23741; 7% instances), PROPN (13840; 4% instances), DET (11234; 3% instances), AUX (8489; 3% instances), PRON (3129; 1% instances), NUM (2903; 1% instances).
NOUN
78979 NOUN tokens (95% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Animacy=EMPTY (44546; 56%).
NOUN
tokens may have the following values of Number
:
Dual
(17; 0% of non-emptyNumber
): očima, rukama, ušimaPlur
(22073; 28% of non-emptyNumber
): let, korun, lidí, procent, letech, peníze, ceny, lidé, akcií, zemíSing
(56889; 72% of non-emptyNumber
): roku, roce, případě, době, rok, zákona, společnosti, vláda, práce, světaEMPTY
(4194): p, Kč, r, m, q, s, a, j, b, HZDS
Paradigm ruka | Sing | Dual | Plur |
---|---|---|---|
Case=Acc | ruku | ruce | |
Case=Gen | ruky | rukou | |
Case=Ins | rukou | rukama | |
Case=Loc | ruce | rukou, rukách | |
Case=Nom | ruce |
ADJ
40449 ADJ tokens (99% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Polarity=Pos (37751; 93%), Degree=Pos (36176; 89%), VerbForm=EMPTY (34530; 85%), Voice=EMPTY (34530; 85%), Animacy=EMPTY (24052; 59%).
ADJ
tokens may have the following values of Number
:
Dual
(3; 0% of non-emptyNumber
): holýma, prázdnýma, českýmaPlur
(12203; 30% of non-emptyNumber
): další, dalších, českých, nové, jiných, posledních, jiné, ostatní, jednotlivých, zahraničníchPlur,Sing
(584; 1% of non-emptyNumber
): připravena, uzavřena, schopna, zahájena, podepsána, určena, dána, založena, ochotna, ohroženaSing
(27659; 68% of non-emptyNumber
): první, české, další, druhé, poslední, možné, státní, českého, národní, českáEMPTY
(318): tzv, a, čs, česko, sv, izraelsko, matematicko, know, nar, německo
Paradigm český | Sing | Dual | Plur |
---|---|---|---|
Animacy=Anim|Case=Acc|Gender=Masc | českého | české | |
Animacy=Anim|Case=Dat|Gender=Masc | českému | českým | |
Animacy=Anim|Case=Gen|Gender=Masc | českého | českých | |
Animacy=Anim|Case=Ins|Gender=Masc | českým | českými | |
Animacy=Anim|Case=Nom|Gender=Masc | český | čeští | |
Animacy=Inan|Case=Acc|Gender=Masc | český | české | |
Animacy=Inan|Case=Dat|Gender=Masc | českému | českým | |
Animacy=Inan|Case=Gen|Gender=Masc | českého | českých | |
Animacy=Inan|Case=Ins|Gender=Masc | českým | českými | |
Animacy=Inan|Case=Loc|Gender=Masc | českém | ||
Animacy=Inan|Case=Nom|Gender=Masc | český | české | |
Case=Acc|Gender=Fem | českou | české | |
Case=Acc|Gender=Neut | české | ||
Case=Dat|Gender=Fem | české | českým | |
Case=Dat|Gender=Neut | českému | ||
Case=Gen|Gender=Fem | české | českých | |
Case=Gen|Gender=Neut | českého | ||
Case=Ins|Gender=Fem | českou | českýma | českými |
Case=Loc|Gender=Fem | české | českých | |
Case=Loc|Gender=Neut | českém | českých | |
Case=Nom|Gender=Fem | česká | české | |
Case=Nom|Gender=Neut | české |
VERB
23741 VERB tokens (81% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Voice=Act (23528; 99%), Polarity=Pos (21279; 90%), Aspect=Imp (14169; 60%), Gender=EMPTY (12862; 54%), VerbForm=Fin (12860; 54%), Mood=Ind (12647; 53%), Tense=Pres (12628; 53%).
VERB
tokens may have the following values of Number
:
Plur
(7141; 30% of non-emptyNumber
): mají, mohou, měli, měly, mohli, musíme, máme, nemají, můžeme, mohlyPlur,Sing
(2110; 9% of non-emptyNumber
): měla, mohla, začala, skončila, stala, řekla, získala, dosáhla, stála, uvedlaSing
(14490; 61% of non-emptyNumber
): má, může, řekl, měl, jde, lze, musí, mělo, chce, říkáEMPTY
(5478): mít, hrát, stát, získat, platit, pokračovat, muset, hledat, vytvořit, říci
Paradigm mít | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměli | ||
Animacy=Anim|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měli | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměly | ||
Animacy=Inan|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měly | ||
Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměl | ||
Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měl | ||
Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | neměla | ||
Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | měla | ||
Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nemělo | ||
Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | mělo | ||
Mood=Imp|Person=1|Polarity=Pos|VerbForm=Fin | Mějme | ||
Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemám | nemáme | |
Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | mám | máme | |
Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemáte | ||
Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | máš | máte | |
Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nemá | nemají | |
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | má | mají |
PROPN
13840 PROPN tokens (88% of all PROPN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PROPN
and Number
co-occurred: Gender=Masc (8990; 65%), Case=Nom (7700; 56%), NameType=Giv (7541; 54%), Animacy=Anim (7232; 52%).
PROPN
tokens may have the following values of Number
:
Plur
(725; 5% of non-emptyNumber
): Němci, Čech, Čechách, Američané, Vítkovice, Budějovice, Budějovicích, Rusové, Čechy, ČešiSing
(13115; 95% of non-emptyNumber
): Praha, Praze, Jiří, Jan, Václav, Německu, Evropě, Jana, Vladimír, KlausEMPTY
(1901): ČR, ODS, LN, USA, OSN, ČSFR, NATO, SR, ČSSD, EU
Paradigm Němec | Sing | Plur |
---|---|---|
Case=Acc | Němce | Němce |
Case=Dat | Němcům | |
Case=Gen | Němce | Němců |
Case=Ins | Němcem | Němci |
Case=Loc | Němci | Němcích |
Case=Nom | Němec | Němci |
Number
seems to be lexical feature of PROPN
. 99% lemmas (4274) occur only with one value of Number
.
DET
11234 DET tokens (88% of all DET
tokens) have a non-empty value of Number
.
The most frequent other feature values with which DET
and Number
co-occurred: Number[psor]=EMPTY (10262; 91%), Person=EMPTY (10262; 91%), Animacy=EMPTY (9665; 86%), Poss=EMPTY (9146; 81%).
DET
tokens may have the following values of Number
:
Dual
(2; 0% of non-emptyNumber
): jejíma, svýmaPlur
(3019; 27% of non-emptyNumber
): které, kteří, všech, těchto, všechny, své, tyto, svých, některé, některýchSing
(8213; 73% of non-emptyNumber
): to, který, která, tím, tom, které, této, své, tomu, tohoEMPTY
(1564): jeho, jejich, několik, její, několika, jejichž, mnoho, jehož, mnoha, kolik
Paradigm jeho | Sing | Dual | Plur |
---|---|---|---|
Animacy=Anim|Case=Acc|Gender=Masc | jejího | ||
Animacy=Inan|Case=Acc|Gender=Masc | její | ||
Case=Acc|Gender=Neut | její | ||
Case=Acc | její | ||
Case=Dat|Gender=Masc,Neut | jejímu | ||
Case=Dat | jejím | ||
Case=Gen|Gender=Masc,Neut | jejího | ||
Case=Gen | jejích | ||
Case=Ins|Gender=Masc,Neut | jejím | ||
Case=Ins|Gender=Fem | jejíma | ||
Case=Ins | jejími | ||
Case=Loc|Gender=Masc,Neut | jejím | ||
Case=Loc | jejích | ||
Case=Nom|Gender=Masc,Neut | její | ||
Case=Nom | její |
AUX
8489 AUX tokens (79% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Aspect=Imp (8488; 100%), Voice=Act (8170; 96%), Polarity=Pos (7400; 87%), Gender=EMPTY (6744; 79%), VerbForm=Fin (6743; 79%), Mood=Ind (6424; 76%), Person=3 (5420; 64%), Tense=Pres (5320; 63%).
AUX
tokens may have the following values of Number
:
Plur
(2274; 27% of non-emptyNumber
): jsou, jsme, budou, byly, bychom, byli, nejsou, jste, budeme, nebylyPlur,Sing
(404; 5% of non-emptyNumber
): byla, nebyla, bývala, nebývalaSing
(5811; 68% of non-emptyNumber
): je, bude, byl, jsem, bylo, není, nebude, bych, nebyl, buďEMPTY
(2264): by, být, býti
Paradigm být | Plur,Sing | Sing | Plur |
---|---|---|---|
Animacy=Anim|Aspect=Imp|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyli | ||
Animacy=Anim|Aspect=Imp|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byli | ||
Animacy=Inan|Aspect=Imp|Gender=Fem,Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyly | ||
Animacy=Inan|Aspect=Imp|Gender=Fem,Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byly | ||
Aspect=Imp|Gender=Masc|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyl | ||
Aspect=Imp|Gender=Masc|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byl | ||
Aspect=Imp|Gender=Masc|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsa | ||
Aspect=Imp|Gender=Fem,Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebyla | ||
Aspect=Imp|Gender=Fem,Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | byla | ||
Aspect=Imp|Gender=Neut|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebylo | ||
Aspect=Imp|Gender=Neut|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bylo | ||
Aspect=Imp|Mood=Cnd|Person=1|VerbForm=Fin | bych | bychom | |
Aspect=Imp|Mood=Cnd|Person=2|VerbForm=Fin | byste | ||
Aspect=Imp|Mood=Imp|Person=2|Polarity=Pos|VerbForm=Fin | buď | buďte | |
Aspect=Imp|Mood=Imp|Person=3|Polarity=Pos|VerbForm=Fin | budiž | ||
Aspect=Imp|Mood=Ind|Person=1|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebudu | nebudeme | |
Aspect=Imp|Mood=Ind|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejsem | nejsme | |
Aspect=Imp|Mood=Ind|Person=1|Polarity=Pos|Style=Coll|Tense=Fut|VerbForm=Fin|Voice=Act | budem | ||
Aspect=Imp|Mood=Ind|Person=1|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budu | budeme | |
Aspect=Imp|Mood=Ind|Person=1|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jsem | jsme | |
Aspect=Imp|Mood=Ind|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | nejste | ||
Aspect=Imp|Mood=Ind|Person=2|Polarity=Pos|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | si | ||
Aspect=Imp|Mood=Ind|Person=2|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | budete | ||
Aspect=Imp|Mood=Ind|Person=2|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | jste | ||
Aspect=Imp|Mood=Ind|Person=3|Polarity=Neg|Style=Vrnc|Tense=Pres|VerbForm=Fin|Voice=Act | nésó | ||
Aspect=Imp|Mood=Ind|Person=3|Polarity=Neg|Tense=Fut|VerbForm=Fin|Voice=Act | nebude | nebudou | |
Aspect=Imp|Mood=Ind|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | není, Neníť | nejsou | |
Aspect=Imp|Mood=Ind|Person=3|Polarity=Pos|Tense=Fut|VerbForm=Fin|Voice=Act | bude | budou | |
Aspect=Imp|Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je, jest | jsou | |
Aspect=Imp|Polarity=Pos|Tense=Pres|VerbForm=Conv|Voice=Act | jsouce | ||
Mood=Ind|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin|Voice=Act | je |
PRON
3129 PRON tokens (31% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (3129; 100%), Variant=EMPTY (2648; 85%), PronType=Prs (2615; 84%), Gender=EMPTY (1732; 55%), Person=3 (1642; 52%).
PRON
tokens may have the following values of Number
:
Plur
(1448; 46% of non-emptyNumber
): nás, nám, je, nich, jim, nichž, jich, my, vám, vásSing
(1681; 54% of non-emptyNumber
): mu, ji, mi, ho, ní, níž, něj, mě, jej, jáEMPTY
(6967): se, si, co, což, kdo, nic, něco, nikdo, někdo, sebe
Paradigm on | Sing | Plur |
---|---|---|
Animacy=Anim|Case=Nom|Gender=Masc | oni | |
Case=Acc|Gender=Masc,Neut|PrepCase=Npr | jej | |
Case=Acc|Gender=Masc,Neut|PrepCase=Pre | něj, něho | |
Case=Acc|Gender=Masc,Neut|Variant=Short | ho | |
Case=Acc|Gender=Fem|PrepCase=Npr | ji | |
Case=Acc|Gender=Fem|PrepCase=Pre | ni | |
Case=Acc|Gender=Neut|PrepCase=Npr | je | |
Case=Acc|Gender=Neut|PrepCase=Pre | ně | |
Case=Acc|PrepCase=Npr | je | |
Case=Acc|PrepCase=Pre | ně | |
Case=Dat|Gender=Masc,Neut|PrepCase=Npr | jemu | |
Case=Dat|Gender=Masc,Neut|PrepCase=Pre | němu | |
Case=Dat|Gender=Masc,Neut|Variant=Short | mu | |
Case=Dat|Gender=Fem|PrepCase=Npr | jí | |
Case=Dat|Gender=Fem|PrepCase=Pre | ní | |
Case=Dat|PrepCase=Npr | jim | |
Case=Dat|PrepCase=Pre | nim | |
Case=Gen|Gender=Masc,Neut|PrepCase=Npr | jej | |
Case=Gen|Gender=Masc,Neut|PrepCase=Pre | něj, něho | |
Case=Gen|Gender=Masc,Neut|Variant=Short | ho | |
Case=Gen|Gender=Masc|PrepCase=Npr | jeho | |
Case=Gen|Gender=Fem|PrepCase=Npr | jí | |
Case=Gen|Gender=Fem|PrepCase=Pre | ní | |
Case=Gen|PrepCase=Npr | jich | |
Case=Gen|PrepCase=Pre | nich | |
Case=Ins|Gender=Masc,Neut|PrepCase=Npr | jím | |
Case=Ins|Gender=Masc,Neut|PrepCase=Pre | ním | |
Case=Ins|Gender=Fem|PrepCase=Npr | jí | |
Case=Ins|Gender=Fem|PrepCase=Pre | ní | |
Case=Ins|PrepCase=Npr | jimi | |
Case=Ins|PrepCase=Pre | nimi | |
Case=Loc|Gender=Masc,Neut|PrepCase=Pre | něm | |
Case=Loc|Gender=Fem|PrepCase=Pre | ní | |
Case=Loc|PrepCase=Pre | nich | |
Case=Nom|Gender=Masc | on | |
Case=Nom|Gender=Fem | ona | ony |
Case=Nom|Gender=Neut | ono |
NUM
2903 NUM tokens (31% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: NumType=Card (2895; 100%), NumForm=Word (2367; 82%).
NUM
tokens may have the following values of Number
:
Dual
(7; 0% of non-emptyNumber
): dvěma, čtyřma, oběmaPlur
(1682; 58% of non-emptyNumber
): tři, dva, dvě, dvou, čtyři, miliónů, milionů, oba, obou, dvěmaSing
(1214; 42% of non-emptyNumber
): jeden, pět, jedné, šest, jednoho, jedna, jednu, deset, jedním, jednoEMPTY
(6355): 1, 2, 3, tisíc, 4, 10, 5, 1992, 6, 1993
Paradigm dva | Dual | Plur |
---|---|---|
Case=Acc|Gender=Masc | dva | |
Case=Acc|Gender=Fem,Neut | dvě | |
Case=Dat | dvěma | |
Case=Gen | dvou | |
Case=Ins|Gender=Fem | dvěma | |
Case=Ins | dvěma | |
Case=Loc | dvou | |
Case=Nom|Gender=Masc | dva | |
Case=Nom|Gender=Fem,Neut | dvě |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (32516; 99%),
NOUN –[nmod]–> NOUN (14679; 59%),
VERB –[nsubj]–> NOUN (7993; 80%),
NOUN –[det]–> DET (5374; 82%),
NOUN –[conj]–> NOUN (3629; 77%),
NOUN –[nmod]–> PROPN (2243; 57%),
NOUN –[flat]–> PROPN (2231; 99%),
ADJ –[cop]–> AUX (2217; 86%),
VERB –[conj]–> VERB (2096; 72%),
NOUN –[cop]–> AUX (1799; 78%).