Treebank Statistics: UD_Czech-PDT: Features: Animacy
This feature is universal.
It occurs with 2 different values: Anim
, Inan
.
313620 tokens (21%) have a non-empty value of Animacy
.
62681 types (49%) occur at least once with a non-empty value of Animacy
.
28584 lemmas (49%) occur at least once with a non-empty value of Animacy
.
The feature is used with 9 part-of-speech tags: NOUN (163482; 11% instances), ADJ (75523; 5% instances), PROPN (48951; 3% instances), VERB (12511; 1% instances), DET (7003; 0% instances), PRON (4310; 0% instances), AUX (1479; 0% instances), NUM (303; 0% instances), SYM (58; 0% instances).
NOUN
163482 NOUN tokens (44% of all NOUN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NOUN
and Animacy
co-occurred: Gender=Masc (163482; 100%), Polarity=Pos (163470; 100%), Number=Sing (106842; 65%).
NOUN
tokens may have the following values of Animacy
:
Anim
(42328; 26% of non-emptyAnimacy
): lidí, ministr, předseda, lidé, ředitel, prezident, trenér, ministra, prezidenta, premiérInan
(121154; 74% of non-emptyAnimacy
): roku, roce, případě, zákona, rok, světa, trhu, zákon, zájem, státuEMPTY
(208818): korun, let, strany, procent, společnosti, době, firmy, Kč, práce, jednání
Paradigm člen | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | člena | |
Case=Acc|Number=Plur | členy | |
Case=Dat|Number=Sing | členu, členovi | |
Case=Dat|Number=Plur | členům | členům |
Case=Gen|Number=Sing | člena | |
Case=Gen|Number=Plur | členů | členů |
Case=Ins|Number=Sing | členem | ČLENEM |
Case=Ins|Number=Plur | členy | členy |
Case=Loc|Number=Sing | členovi, členu | |
Case=Loc|Number=Plur | členech | |
Case=Nom|Number=Sing | člen | člen |
Case=Nom|Number=Plur | členové |
Animacy
seems to be lexical feature of NOUN
. 99% lemmas (6950) occur only with one value of Animacy
.
ADJ
75523 ADJ tokens (40% of all ADJ
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which ADJ
and Animacy
co-occurred: Gender=Masc (73755; 98%), Polarity=Pos (70830; 94%), VerbForm=EMPTY (64728; 86%), Voice=EMPTY (64728; 86%), Degree=Pos (64638; 86%), Number=Sing (45495; 60%).
ADJ
tokens may have the following values of Animacy
:
Anim
(18900; 25% of non-emptyAnimacy
): další, bývalý, mnozí, domácí, první, generální, český, americký, českých, dalšíchInan
(56623; 75% of non-emptyAnimacy
): další, první, nový, českého, celý, český, velký, letošního, státního, minulýEMPTY
(113663): české, první, další, druhé, nové, možné, poslední, česká, třeba, státní
Paradigm český | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | českého | český |
Case=Acc|Number=Plur | české | české |
Case=Dat|Number=Sing | českému | českému |
Case=Dat|Number=Plur | českým, českých | českým |
Case=Gen|Number=Sing | českého | českého |
Case=Gen|Number=Plur | českých | českých |
Case=Ins|Number=Sing | českým | českým |
Case=Ins|Number=Plur | českými | českými |
Case=Loc|Number=Sing | českém | českém |
Case=Loc|Number=Plur | českých | českých |
Case=Nom|Number=Sing | český | český |
Case=Nom|Number=Plur | čeští | české |
PROPN
48951 PROPN tokens (58% of all PROPN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PROPN
and Animacy
co-occurred: Gender=Masc (48951; 100%), Polarity=Pos (48951; 100%), Abbr=EMPTY (45596; 93%), Number=Sing (41682; 85%), Case=Nom (27586; 56%).
PROPN
tokens may have the following values of Animacy
:
Anim
(37154; 76% of non-emptyAnimacy
): Jiří, J, Jan, Václav, Petr, Pavel, Josef, M, Vladimír, VInan
(11797; 24% of non-emptyAnimacy
): USA, York, Zlín, Liberec, FNM, SSSR, Hradec, Izrael, Londýn, YorkuEMPTY
(35081): Praha, ČR, Praze, LN, ODS, OSN, Evropy, Brno, Prahy, ODA
Paradigm York | Anim | Inan |
---|---|---|
Case=Acc|NameType=Geo | York | |
Case=Gen|NameType=Geo | Yorku | |
Case=Loc|NameType=Geo | Yorku, YORKU | |
Case=Loc|NameType=Sur | Yorku | |
Case=Nom|NameType=Geo | York, YORK | |
Case=Nom|NameType=Sur | YORK |
Animacy
seems to be lexical feature of PROPN
. 99% lemmas (10351) occur only with one value of Animacy
.
VERB
12511 VERB tokens (10% of all VERB
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which VERB
and Animacy
co-occurred: Mood=EMPTY (12511; 100%), Number=Plur (12511; 100%), Person=EMPTY (12511; 100%), Tense=Past (12511; 100%), VerbForm=Part (12511; 100%), Voice=Act (12511; 100%), Polarity=Pos (11413; 91%), Gender=Masc (8310; 66%).
VERB
tokens may have the following values of Animacy
:
Anim
(8310; 66% of non-emptyAnimacy
): měli, mohli, chtěli, začali, museli, dostali, získali, rozhodli, přišli, neměliInan
(4201; 34% of non-emptyAnimacy
): měly, mohly, začaly, objevily, dosáhly, získaly, neměly, staly, vedly, dostalyEMPTY
(117763): má, může, řekl, měl, mají, musí, jde, měla, lze, mít
Paradigm mít | Anim | Inan |
---|---|---|
Gender=Masc|Polarity=Neg | neměli | |
Gender=Masc|Polarity=Pos | měli | |
Gender=Fem,Masc|Polarity=Neg | neměly | |
Gender=Fem,Masc|Polarity=Pos | měly |
DET
7003 DET tokens (12% of all DET
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which DET
and Animacy
co-occurred: Gender=Masc (7003; 100%), Number[psor]=EMPTY (6618; 95%), Person=EMPTY (6618; 95%), Poss=EMPTY (6036; 86%), Case=Nom (4033; 58%), Number=Plur (3989; 57%).
DET
tokens may have the following values of Animacy
:
Anim
(3150; 45% of non-emptyAnimacy
): kteří, všichni, každý, ti, někteří, sami, naši, svého, každého, kteréhoInan
(3853; 55% of non-emptyAnimacy
): které, svůj, který, tento, tyto, každý, ty, některé, ten, všechnyEMPTY
(49213): to, jeho, které, který, která, jejich, své, tím, tom, této
Paradigm ten | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | toho | ten |
Case=Acc|Number=Plur | ty | ty |
Case=Nom|Number=Plur | ti | ty |
PRON
4310 PRON tokens (10% of all PRON
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PRON
and Animacy
co-occurred: Reflex=EMPTY (4310; 100%), Variant=EMPTY (4310; 100%), PrepCase=EMPTY (4249; 99%), Person=EMPTY (4229; 98%), Number=EMPTY (4137; 96%), PronType=Int,Rel (2652; 62%), Gender=EMPTY (2525; 59%), Case=Nom (2266; 53%).
PRON
tokens may have the following values of Animacy
:
Anim
(1714; 40% of non-emptyAnimacy
): kdo, nikdo, někdo, oni, koho, komu, někoho, nikoho, nikomu, někomuInan
(2596; 60% of non-emptyAnimacy
): co, něco, čím, čem, čeho, cosi, jež, čemu, něčeho, cokoliEMPTY
(40505): se, si, nás, je, nám, nich, což, mu, ji, ho
Paradigm on | Anim | Inan |
---|---|---|
oni | ony |
Animacy
seems to be lexical feature of PRON
. 93% lemmas (27) occur only with one value of Animacy
.
AUX
1479 AUX tokens (3% of all AUX
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which AUX
and Animacy
co-occurred: Mood=EMPTY (1479; 100%), Number=Plur (1479; 100%), Person=EMPTY (1479; 100%), Tense=Past (1479; 100%), VerbForm=Part (1479; 100%), Voice=Act (1479; 100%), Polarity=Pos (1332; 90%), Gender=Fem,Masc (985; 67%).
AUX
tokens may have the following values of Animacy
:
Anim
(494; 33% of non-emptyAnimacy
): byli, nebyli, bývaliInan
(985; 67% of non-emptyAnimacy
): byly, nebyly, bývaly, bývávalyEMPTY
(45121): je, by, jsou, bude, byl, být, není, bylo, jsem, jsme
Paradigm být | Anim | Inan |
---|---|---|
Gender=Masc|Polarity=Neg | nebyli | |
Gender=Masc|Polarity=Pos | byli | |
Gender=Fem,Masc|Polarity=Neg | nebyly | |
Gender=Fem,Masc|Polarity=Pos | byly |
NUM
303 NUM tokens (1% of all NUM
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NUM
and Animacy
co-occurred: Case=Acc (303; 100%), Gender=Masc (303; 100%), NumForm=Word (303; 100%), NumType=Card (303; 100%), NumValue=1,2,3 (303; 100%), Number=Sing (303; 100%).
NUM
tokens may have the following values of Animacy
:
Anim
(84; 28% of non-emptyAnimacy
): jednohoInan
(219; 72% of non-emptyAnimacy
): jedenEMPTY
(41205): 1, 2, 3, dva, tři, 4, 6, dvě, tisíc, 5
Paradigm jeden | Anim | Inan |
---|---|---|
jednoho | jeden |
SYM
58 SYM tokens (4% of all SYM
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which SYM
and Animacy
co-occurred: ConjType=EMPTY (58; 100%).
SYM
tokens may have the following values of Animacy
:
Inan
(58; 100% of non-emptyAnimacy
): §, §§EMPTY
(1310): %, x, +, =, *, /, >, :, <, $
Relations with Agreement in Animacy
The 10 most frequent relations where parent and child node agree in Animacy
:
NOUN –[amod]–> ADJ (62262; 97%),
NOUN –[flat]–> PROPN (10341; 100%),
PROPN –[flat]–> PROPN (7956; 99%),
PROPN –[conj]–> PROPN (2576; 66%),
ADJ –[conj]–> ADJ (2221; 86%),
ADJ –[nsubj]–> NOUN (1780; 68%),
PROPN –[amod]–> ADJ (1743; 73%),
PROPN –[nmod]–> NOUN (966; 51%),
PROPN –[appos]–> NOUN (599; 77%),
NOUN –[case]–> NOUN (250; 53%).