Treebank Statistics: UD_Russian-Taiga: Features: Case
This feature is universal.
It occurs with 8 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Par
, Voc
.
731946 tokens (42%) have a non-empty value of Case
.
116653 types (77%) occur at least once with a non-empty value of Case
.
40916 lemmas (74%) occur at least once with a non-empty value of Case
.
The feature is used with 8 part-of-speech tags: NOUN (373634; 21% instances), ADJ (133624; 8% instances), PRON (88080; 5% instances), DET (55708; 3% instances), PROPN (54576; 3% instances), VERB (17274; 1% instances), NUM (9045; 1% instances), AUX (5; 0% instances).
NOUN
373634 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Animacy=Inan (310893; 83%), Number=Sing (272831; 73%).
NOUN
tokens may have the following values of Case
:
Acc
(72251; 19% of non-emptyCase
): время, раз, день, голову, слово, руку, минуту, слова, глаза, местоDat
(18534; 5% of non-emptyCase
): людям, человеку, словам, языку, детям, мере, дороге, слову, маме, богуGen
(97057; 26% of non-emptyCase
): языка, слов, слова, искусства, лет, жизни, времени, человека, литературы, людейIns
(35261; 9% of non-emptyCase
): образом, глазами, словами, словом, голосом, головой, помощью, руками, рукой, языкомLoc
(37989; 10% of non-emptyCase
): языке, жизни, конце, месте, речи, случае, году, мире, искусстве, значенииNom
(111958; 30% of non-emptyCase
): слово, человек, мама, слова, люди, папа, девочка, язык, дело, правдаPar
(422; 0% of non-emptyCase
): разу, народу, виду, толку, дому, чаю, лесу, смеху, полу, голодуVoc
(162; 0% of non-emptyCase
): господи, боже, мам, ребят, бабуль, баб, Батоно, Отче, Сынка, господинеEMPTY
(4488): в., г., гг., э., вв., с., т., тыс., ч., см
Paradigm век | Nom | Acc | Dat | Gen | Loc | Ins | Par |
---|---|---|---|---|---|---|---|
Number=Sing | век | век | веку | века | веке, веку | веком | веку |
Number=Plur | века, веки | века, веки | векам | веков, век | веках | веками |
ADJ
133624 ADJ tokens (86% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Degree=Pos (127854; 96%), Number=Sing (95328; 71%).
ADJ
tokens may have the following values of Case
:
Acc
(22931; 17% of non-emptyCase
): первый, большую, разные, новые, первую, новый, новую, русский, следующий, целыйDat
(4997; 4% of non-emptyCase
): крайней, русскому, разным, новому, первому, общему, великому, современному, древним, русскойGen
(32745; 25% of non-emptyCase
): русского, русской, разных, литературного, художественного, нового, русских, различных, художественной, первогоIns
(15570; 12% of non-emptyCase
): первым, главным, большим, разными, новым, большими, новыми, русским, большой, огромнымLoc
(12799; 10% of non-emptyCase
): русском, общем, современном, разных, первом, русской, литературном, первой, переносном, основномNom
(44582; 33% of non-emptyCase
): хороший, большой, первый, русский, маленькая, первая, большая, добрый, старый, железныйEMPTY
(21451): XIX, нужно, п., хорошо, XVIII, должен, лучше, XX, должны, должна
Paradigm русский | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | русского | |||||
Animacy=Anim|Number=Plur | русских | |||||
Animacy=Inan|Gender=Masc|Number=Sing | русский, русская | |||||
Animacy=Inan|Number=Plur | русские | |||||
Gender=Masc|Number=Sing | русский | русскому | русского | русском | русским | |
Gender=Fem|Number=Sing | русская | русскую | русской | русской, Русския | русской | русской |
Gender=Fem|Number=Sing|Typo=Yes | Рускую | Рускыя | ||||
Gender=Neut|Number=Sing | русское | русское | русскому | русского | русском | русским |
Number=Plur | русские | русским | русских | русских | русскими | |
Number=Plur|Typo=Yes | руския |
PRON
88080 PRON tokens (99% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Number=Sing (66902; 76%), Animacy=EMPTY (63541; 72%), PronType=Prs (62722; 71%).
PRON
tokens may have the following values of Case
:
Acc
(14722; 17% of non-emptyCase
): его, меня, что, их, ее, себя, это, тебя, нас, тоDat
(10758; 12% of non-emptyCase
): мне, ему, ей, нам, тебе, себе, вам, им, тому, немуGen
(8977; 10% of non-emptyCase
): нас, меня, ничего, него, них, того, всего, этого, чего, васIns
(4754; 5% of non-emptyCase
): тем, ним, собой, ними, ней, чем, им, нами, мной, этимLoc
(3314; 4% of non-emptyCase
): том, этом, нем, ней, чем, них, себе, чём, нём, многомNom
(45554; 52% of non-emptyCase
): я, он, она, это, мы, они, ты, что, вы, всеPar
(1; 0% of non-emptyCase
): чегоEMPTY
(745): т., пр., др., чего-л.
Paradigm что | Nom | Acc | Dat | Gen | Loc | Ins | Par |
---|---|---|---|---|---|---|---|
ExtPos=ADP|Gender=Neut|PronType=Rel | что | ||||||
ExtPos=ADV|Gender=Neut|PronType=Rel | что | что | |||||
ExtPos=DET|Gender=Masc|PronType=Int | Что | ||||||
ExtPos=DET|Gender=Neut|PronType=Exc | что | ||||||
ExtPos=DET|Gender=Neut|PronType=Int | что | что | |||||
ExtPos=DET|Gender=Neut|PronType=Rel | что | что | |||||
ExtPos=NOUN|Gender=Neut|PronType=Rel | что | ||||||
ExtPos=PRON|Gender=Neut|PronType=Rel | что | чему | чем | чем | |||
Gender=Masc|PronType=Rel | что | ||||||
Gender=Neut|PronType=Dem | что | что | |||||
Gender=Neut|PronType=Emp | Что | ||||||
Gender=Neut|PronType=Exc | что | что | чего | ||||
Gender=Neut|PronType=Ind | что | чего | |||||
Gender=Neut|PronType=Int | что | что, што, че, что́ | чему | чего | чем, чём | чем, Чам | чего |
Gender=Neut|PronType=Int|Typo=Yes | Что-о, чьто | ||||||
Gender=Neut|PronType=Neg | что | чему | чего | чем | чем | ||
Gender=Neut|PronType=Rel | что, что́ | что, што | чему | чего | чем, чём | чем | |
Gender=Neut|PronType=Rel|Typo=Yes | сто | сто, што | сём |
DET
55708 DET tokens (87% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Animacy=EMPTY (48613; 87%), Poss=EMPTY (44333; 80%), Number=Sing (38154; 68%).
DET
tokens may have the following values of Case
:
Acc
(13497; 24% of non-emptyCase
): все, свою, этот, свои, эту, это, всю, свой, эти, своеDat
(2868; 5% of non-emptyCase
): своему, этому, всем, которому, своей, своим, другим, тому, которым, всемуGen
(10296; 18% of non-emptyCase
): этого, других, этих, всех, своего, которого, которых, этой, тех, своихIns
(4638; 8% of non-emptyCase
): таким, своим, своими, своей, самым, другими, одним, этим, тем, этимиLoc
(5792; 10% of non-emptyCase
): этом, котором, самом, том, своем, своих, всех, этой, своей, которойNom
(18617; 33% of non-emptyCase
): все, которые, эти, сам, который, этот, это, эта, один, такиеEMPTY
(8125): его, ее, их, её, др., н., таковы, таков, такова, каково
Paradigm этот | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | этого | |||||
Animacy=Anim|Number=Plur | этих | |||||
Animacy=Inan|ExtPos=DET|Gender=Masc|Number=Sing | этот | |||||
Animacy=Inan|ExtPos=DET|Number=Plur | эти | |||||
Animacy=Inan|Gender=Masc|Number=Sing | этот | этот | ||||
Animacy=Inan|Gender=Neut|Number=Sing | этого | |||||
Animacy=Inan|Number=Plur | эти, этих | |||||
ExtPos=DET|Gender=Masc|Number=Sing | этот | этому | этого | этом | этим | |
ExtPos=DET|Gender=Fem|Number=Sing | эта | эту | этой | этой | этой | этой |
ExtPos=DET|Gender=Neut|Number=Sing | Это | это | этому | этого | этим | |
ExtPos=DET|Number=Plur | эти | этим | этих | этих | Этими | |
Gender=Masc|Number=Sing | этот, Это | этому | этого | этом | этим | |
Gender=Fem|Number=Sing | эта | эту | этой | этой | этой | этой, этою |
Gender=Neut|Number=Sing | это | это | этому | этого | этом | этим |
Gender=Neut|Number=Sing|Typo=Yes | это | это | этово | |||
Number=Plur | эти | этим | этих | этих | этими |
PROPN
54576 PROPN tokens (81% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Abbr=EMPTY (54565; 100%), Number=Sing (54034; 99%), Animacy=Anim (45261; 83%), Gender=Masc (35768; 66%).
PROPN
tokens may have the following values of Case
:
Acc
(3801; 7% of non-emptyCase
): Толика, Сибирочку, Лизу, Мишку, россию, кузьку, москву, Русь, Петербург, алёнуDat
(2390; 4% of non-emptyCase
): Толику, Лизе, Сибирочке, Мишке, Алёне, Фросе, Пушкину, Лидии, Матвеевне, АннеGen
(13604; 25% of non-emptyCase
): Пушкина, россии, Возрождения, Толстого, Гоголя, Достоевского, Европы, Востока, Лермонтова, ТоликаIns
(2221; 4% of non-emptyCase
): Наташей, Толиком, Нюрой, Лизой, Сибирочкой, Мишкой, Пушкиным, Петром, Иваном, АннойLoc
(3331; 6% of non-emptyCase
): россии, Москве, Руси, Франции, Европе, Германии, Италии, Риме, Англии, ПарижеNom
(29185; 53% of non-emptyCase
): Толик, Алёна, Лиза, Мишка, Кузька, Анна, Сибирочка, Соня, Фрося, иванVoc
(44; 0% of non-emptyCase
): Тань, Валь, Коль, Моть, Паш, Алён, Ань, Насть, Серёж, ЯшEMPTY
(12831): А., В., И., Н., М., С., П., Ф., Г., К.
Paradigm Алена | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
---|---|---|---|---|---|---|---|
Алёна, Алена | алёну, Алену | Алёне, Алене | Алёны, Алены | Алён | Алёне | Алёной |
VERB
17274 VERB tokens (8% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Mood=EMPTY (17274; 100%), Person=EMPTY (17274; 100%), VerbForm=Part (17132; 99%), Tense=Past (11221; 65%), Number=Sing (10589; 61%), Voice=Act (9434; 55%), Aspect=Perf (9368; 54%).
VERB
tokens may have the following values of Case
:
Acc
(3089; 18% of non-emptyCase
): связанные, написанные, посвященные, называемый, имеющие, выполненные, существующие, созданные, блестящий, заданноеDat
(792; 5% of non-emptyCase
): жившему, некому, пишущему, собравшимся, читающему, играющим, нечему, описываемым, погибшим, расчищеннойGen
(3865; 22% of non-emptyCase
): нечего, связанных, действующих, имеющих, называемого, редуцированных, изображаемого, составляющих, называемой, посвященныхIns
(1901; 11% of non-emptyCase
): дрожащим, закрытыми, дрожащими, нечем, блестящими, горящими, раскрытыми, связанными, допускающим, сверкающимиLoc
(964; 6% of non-emptyCase
): написанных, приведенном, связанном, написанном, обобщенном, приведенных, случившемся, вышедшем, изданном, называемойNom
(6663; 39% of non-emptyCase
): связанные, созданные, называемая, посвященные, называемый, написанные, называемые, созданный, связанная, созданнаяEMPTY
(194358): есть, может, можно, сказал, надо, нет, сказала, значит, было, сказать
Paradigm сказать | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Gender=Masc|Number=Sing|Voice=Act | сказавший | сказавшему | сказавшего | сказавшим | ||
Gender=Masc|Number=Sing|Voice=Pass | сказанным | |||||
Gender=Fem|Number=Sing|Voice=Pass | сказанная | |||||
Gender=Neut|Number=Sing|Voice=Pass | сказанное | сказанное | сказанному | сказанного | сказанном | |
Number=Plur|Voice=Pass | сказанные | сказанным |
NUM
9045 NUM tokens (70% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumForm=Word (9017; 100%), NumType=Card (8400; 93%), Number=EMPTY (7144; 79%), Gender=EMPTY (4901; 54%).
NUM
tokens may have the following values of Case
:
Acc
(3251; 36% of non-emptyCase
): несколько, два, много, три, один, одну, две, сколько, одно, пятьDat
(205; 2% of non-emptyCase
): одному, одной, двум, обеим, обоим, пяти, трем, нескольку, шести, семиGen
(1232; 14% of non-emptyCase
): двух, одного, одной, трех, нескольких, пяти, четырех, семи, шести, обеихIns
(414; 5% of non-emptyCase
): двумя, одним, одной, тремя, несколькими, обеими, четырьмя, семью, пятью, обоимиLoc
(420; 5% of non-emptyCase
): одном, двух, одной, нескольких, трех, обоих, трёх, семи, десяти, четырехNom
(3523; 39% of non-emptyCase
): много, два, один, три, две, одна, мало, оба, сколько, несколькоEMPTY
(3804): 2, 1, 3, 5, 4, больше, 10, 6, 20, 7
Paradigm один | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Animacy=Anim|Gender=Masc | одного | |||||
Animacy=Inan|ExtPos=PRON|Gender=Masc | один | |||||
Animacy=Inan|Gender=Masc | один | |||||
Animacy=Inan|Gender=Masc|Typo=Yes | оден | |||||
ExtPos=NUM|Gender=Masc | одним | |||||
ExtPos=NUM|Gender=Fem | Одна | |||||
Gender=Masc | один | один | одному | одного | одном | одним |
Gender=Fem | одна | одну | одной | одной | одной | одной |
Gender=Neut | одно | одно | одному | одного | одном | одним |
AUX
5 AUX tokens (0% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Mood=EMPTY (5; 100%), Person=EMPTY (5; 100%), Tense=Past (5; 100%), VerbForm=Part (5; 100%), Voice=Act (5; 100%), Number=Sing (4; 80%), Gender=Masc (3; 60%).
AUX
tokens may have the following values of Case
:
Acc
(1; 20% of non-emptyCase
): бывшегоNom
(4; 80% of non-emptyCase
): бывший, бывшая, бывшиеEMPTY
(12982): было, бы, был, была, были, быть, будет, есть, буду, будут
Paradigm быть | Nom | Acc |
---|---|---|
Animacy=Anim|Gender=Masc|Number=Sing | бывшего | |
Gender=Masc|Number=Sing | бывший | |
Gender=Fem|Number=Sing | бывшая | |
Number=Plur | бывшие |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (105268; 98%),
NOUN –[det]–> DET (37333; 84%),
NOUN –[conj]–> NOUN (35000; 94%),
NOUN –[acl]–> VERB (9724; 84%),
ADJ –[conj]–> ADJ (9128; 97%),
NOUN –[appos]–> NOUN (5766; 70%),
NOUN –[appos]–> PROPN (4403; 74%),
NOUN –[amod]–> VERB (3304; 99%),
NOUN –[nsubj]–> PRON (2913; 77%),
PROPN –[conj]–> PROPN (2890; 91%).