Treebank Statistics: UD_Czech-PDT: Features: Animacy
This feature is universal.
It occurs with 2 different values: Anim
, Inan
.
66612 tokens (20%) have a non-empty value of Animacy
.
22869 types (43%) occur at least once with a non-empty value of Animacy
.
11566 lemmas (43%) occur at least once with a non-empty value of Animacy
.
The feature is used with 8 part-of-speech tags: NOUN (34831; 10% instances), ADJ (16398; 5% instances), PROPN (9109; 3% instances), VERB (2853; 1% instances), DET (2098; 1% instances), PRON (933; 0% instances), AUX (334; 0% instances), NUM (56; 0% instances).
NOUN
34831 NOUN tokens (42% of all NOUN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NOUN
and Animacy
co-occurred: Gender=Masc (34831; 100%), Polarity=Pos (34825; 100%), Number=Sing (23165; 67%).
NOUN
tokens may have the following values of Animacy
:
Anim
(8907; 26% of non-emptyAnimacy
): lidí, předseda, ministr, prezident, lidé, ředitel, ministra, prezidenta, člověk, trenérInan
(25924; 74% of non-emptyAnimacy
): roku, roce, případě, rok, zákona, světa, trhu, zájem, zákon, penízeEMPTY
(48342): let, p, korun, Kč, strany, firmy, práce, společnosti, době, jednání
Paradigm člen | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | člena | |
Case=Acc|Number=Plur | členy | |
Case=Dat|Number=Plur | členům | |
Case=Gen|Number=Sing | člena | |
Case=Gen|Number=Plur | členů | |
Case=Ins|Number=Sing | členem | |
Case=Ins|Number=Plur | členy | členy |
Case=Loc|Number=Plur | členech | |
Case=Nom|Number=Sing | člen | člen |
Case=Nom|Number=Plur | členové |
Animacy
seems to be lexical feature of NOUN
. 100% lemmas (3294) occur only with one value of Animacy
.
ADJ
16398 ADJ tokens (40% of all ADJ
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which ADJ
and Animacy
co-occurred: Gender=Masc (15982; 97%), Polarity=Pos (15364; 94%), VerbForm=EMPTY (14050; 86%), Voice=EMPTY (14050; 86%), Degree=Pos (13985; 85%), Number=Sing (9985; 61%).
ADJ
tokens may have the following values of Animacy
:
Anim
(3920; 24% of non-emptyAnimacy
): další, bývalý, českých, mnozí, první, dalších, český, jediný, čeští, americkýInan
(12478; 76% of non-emptyAnimacy
): další, první, nový, českého, velký, český, celý, větší, dalším, druhýEMPTY
(24376): české, první, další, druhé, nové, možné, národní, poslední, česká, vlastní
Paradigm český | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | českého | český |
Case=Acc|Number=Plur | české | české |
Case=Dat|Number=Sing | českému | českému |
Case=Dat|Number=Plur | českým | českým |
Case=Gen|Number=Sing | českého | českého |
Case=Gen|Number=Plur | českých | českých |
Case=Ins|Number=Sing | českým | českým |
Case=Ins|Number=Plur | českými | českými |
Case=Loc|Number=Sing | českém | |
Case=Nom|Number=Sing | český | český |
Case=Nom|Number=Plur | čeští | české |
PROPN
9109 PROPN tokens (58% of all PROPN
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PROPN
and Animacy
co-occurred: Gender=Masc (9109; 100%), Polarity=Pos (9109; 100%), Number=Sing (8561; 94%), NameType=Giv (6859; 75%), Case=Nom (5609; 62%).
PROPN
tokens may have the following values of Animacy
:
Anim
(7316; 80% of non-emptyAnimacy
): Jiří, Jan, Václav, Vladimír, Klaus, Petr, Pavel, Josef, Jana, JohnInan
(1793; 20% of non-emptyAnimacy
): Londýně, Hradec, Washingtonu, Bonn, Yorku, Berlíně, Zlín, Berlín, Bonnu, ReuterEMPTY
(6632): Praha, ČR, ODS, Praze, LN, USA, OSN, Německu, Evropě, ČSFR
Paradigm Martin | Anim | Inan |
---|---|---|
Case=Acc|NameType=Giv | Martina | |
Case=Gen|NameType=Geo | Martina | |
Case=Gen|NameType=Giv | Martina | |
Case=Ins|NameType=Giv | Martinem | |
Case=Nom|NameType=Giv | Martin |
Animacy
seems to be lexical feature of PROPN
. 100% lemmas (3272) occur only with one value of Animacy
.
VERB
2853 VERB tokens (10% of all VERB
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which VERB
and Animacy
co-occurred: Mood=EMPTY (2853; 100%), Number=Plur (2853; 100%), Person=EMPTY (2853; 100%), Tense=Past (2853; 100%), VerbForm=Part (2853; 100%), Voice=Act (2853; 100%), Polarity=Pos (2624; 92%), Gender=Masc (1822; 64%), Aspect=Perf (1612; 57%).
VERB
tokens may have the following values of Animacy
:
Anim
(1822; 64% of non-emptyAnimacy
): měli, mohli, chtěli, museli, začali, neměli, přišli, dostali, získali, rozhodliInan
(1031; 36% of non-emptyAnimacy
): měly, mohly, začaly, objevily, neměly, vedly, získaly, musely, potvrdily, přišlyEMPTY
(26366): má, může, řekl, mají, měl, jde, musí, měla, lze, mít
Paradigm mít | Anim | Inan |
---|---|---|
Gender=Masc|Polarity=Neg | neměli | |
Gender=Masc|Polarity=Pos | měli | |
Gender=Fem,Masc|Polarity=Neg | neměly | |
Gender=Fem,Masc|Polarity=Pos | měly |
DET
2098 DET tokens (16% of all DET
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which DET
and Animacy
co-occurred: Gender=Masc (2098; 100%), Number[psor]=EMPTY (1994; 95%), Person=EMPTY (1994; 95%), Poss=EMPTY (1857; 89%), Number=Plur (1144; 55%), PronType=Int,Rel (1093; 52%).
DET
tokens may have the following values of Animacy
:
Anim
(685; 33% of non-emptyAnimacy
): kteří, ti, někteří, všichni, každý, sami, naši, každého, svého, kteréhoInan
(1413; 67% of non-emptyAnimacy
): tisíc, které, svůj, který, miliónů, tento, milionů, tyto, každý, tisíceEMPTY
(11420): to, které, jeho, který, která, jejich, své, tím, tom, této
Paradigm ten | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing | toho | ten |
Case=Acc|Number=Plur | ty | ty |
Case=Nom|Number=Plur | ti | ty |
PRON
933 PRON tokens (9% of all PRON
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which PRON
and Animacy
co-occurred: Reflex=EMPTY (933; 100%), Variant=EMPTY (933; 100%), PrepCase=EMPTY (930; 100%), Person=EMPTY (916; 98%), Gender=EMPTY (905; 97%), Number=EMPTY (905; 97%), PronType=Int,Rel (586; 63%), Case=Nom (484; 52%).
PRON
tokens may have the following values of Animacy
:
Anim
(361; 39% of non-emptyAnimacy
): kdo, nikdo, někdo, oni, koho, někoho, nikoho, komu, nikomu, kdokoliInan
(572; 61% of non-emptyAnimacy
): co, něco, čím, čem, čeho, cosi, čemu, cokoli, něčeho, něčemEMPTY
(9163): se, si, nás, je, nám, mu, ji, což, nich, mi
Paradigm jenž | Anim | Inan |
---|---|---|
Case=Acc|Number=Sing|PrepCase=Npr | jehož | |
Case=Nom|Number=Plur | jež |
Animacy
seems to be lexical feature of PRON
. 94% lemmas (17) occur only with one value of Animacy
.
AUX
334 AUX tokens (3% of all AUX
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which AUX
and Animacy
co-occurred: Aspect=Imp (334; 100%), Mood=EMPTY (334; 100%), Number=Plur (334; 100%), Person=EMPTY (334; 100%), Tense=Past (334; 100%), VerbForm=Part (334; 100%), Voice=Act (334; 100%), Polarity=Pos (293; 88%), Gender=Fem,Masc (226; 68%).
AUX
tokens may have the following values of Animacy
:
Anim
(108; 32% of non-emptyAnimacy
): byli, nebyliInan
(226; 68% of non-emptyAnimacy
): byly, nebyly, bývaly, bývávalyEMPTY
(10419): je, by, jsou, bude, byl, být, jsem, bylo, není, jsme
Paradigm být | Anim | Inan |
---|---|---|
Gender=Masc|Polarity=Neg | nebyli | |
Gender=Masc|Polarity=Pos | byli | |
Gender=Fem,Masc|Polarity=Neg | nebyly | |
Gender=Fem,Masc|Polarity=Pos | byly |
NUM
56 NUM tokens (1% of all NUM
tokens) have a non-empty value of Animacy
.
The most frequent other feature values with which NUM
and Animacy
co-occurred: Case=Acc (56; 100%), Gender=Masc (56; 100%), NumForm=Word (56; 100%), NumType=Card (56; 100%), NumValue=EMPTY (56; 100%), Number=Sing (56; 100%).
NUM
tokens may have the following values of Animacy
:
Anim
(15; 27% of non-emptyAnimacy
): jednohoInan
(41; 73% of non-emptyAnimacy
): jedenEMPTY
(8475): 1, 2, 3, tři, dva, dvě, 4, 10, 5, dvou
Paradigm jeden | Anim | Inan |
---|---|---|
jednoho | jeden |
Relations with Agreement in Animacy
The 10 most frequent relations where parent and child node agree in Animacy
:
NOUN –[amod]–> ADJ (13593; 98%),
NOUN –[flat]–> PROPN (2063; 100%),
PROPN –[flat]–> PROPN (1460; 99%),
PROPN –[conj]–> PROPN (509; 68%),
ADJ –[conj]–> ADJ (503; 86%),
ADJ –[nsubj]–> NOUN (407; 67%),
PROPN –[amod]–> ADJ (312; 91%),
PROPN –[appos]–> NOUN (117; 81%),
NOUN –[case]–> NOUN (55; 51%),
NOUN –[xcomp]–> ADJ (32; 70%).