Treebank Statistics: UD_Russian-Taiga: Features: Case
This feature is universal.
It occurs with 8 different values: Acc, Dat, Gen, Ins, Loc, Nom, Par, Voc.
731946 tokens (42%) have a non-empty value of Case.
116653 types (77%) occur at least once with a non-empty value of Case.
40916 lemmas (74%) occur at least once with a non-empty value of Case.
The feature is used with 8 part-of-speech tags: NOUN (373634; 21% instances), ADJ (133624; 8% instances), PRON (88081; 5% instances), DET (55708; 3% instances), PROPN (54576; 3% instances), VERB (17274; 1% instances), NUM (9044; 1% instances), AUX (5; 0% instances).
NOUN
373634 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Animacy=Inan (310893; 83%), Number=Sing (272831; 73%).
NOUN tokens may have the following values of Case:
Acc(72249; 19% of non-emptyCase): время, раз, день, голову, слово, руку, минуту, слова, глаза, местоDat(18534; 5% of non-emptyCase): людям, человеку, словам, языку, детям, мере, дороге, слову, маме, богуGen(97057; 26% of non-emptyCase): языка, слов, слова, искусства, лет, жизни, времени, человека, литературы, людейIns(35261; 9% of non-emptyCase): образом, глазами, словами, словом, голосом, головой, помощью, руками, рукой, языкомLoc(37989; 10% of non-emptyCase): языке, жизни, конце, месте, речи, случае, году, мире, искусстве, значенииNom(111960; 30% of non-emptyCase): слово, человек, мама, слова, люди, папа, девочка, язык, дело, правдаPar(422; 0% of non-emptyCase): разу, народу, виду, толку, дому, чаю, лесу, смеху, полу, голодуVoc(162; 0% of non-emptyCase): господи, боже, мам, ребят, бабуль, баб, Батоно, Отче, Сынка, господинеEMPTY(4488): в., г., гг., э., вв., с., т., тыс., ч., см
| Paradigm век | Nom | Acc | Dat | Gen | Loc | Ins | Par |
|---|---|---|---|---|---|---|---|
| Number=Sing | век | век | веку | века | веке, веку | веком | веку |
| Number=Plur | века, веки | века, веки | векам | веков, век | веках | веками |
ADJ
133624 ADJ tokens (86% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Degree=Pos (127817; 96%), Number=Sing (95328; 71%).
ADJ tokens may have the following values of Case:
Acc(22931; 17% of non-emptyCase): первый, большую, разные, новые, первую, новый, новую, русский, следующий, целыйDat(4997; 4% of non-emptyCase): крайней, русскому, разным, новому, первому, общему, великому, современному, древним, русскойGen(32745; 25% of non-emptyCase): русского, русской, разных, литературного, художественного, нового, русских, различных, художественной, первогоIns(15570; 12% of non-emptyCase): первым, главным, большим, разными, новым, большими, новыми, русским, большой, огромнымLoc(12799; 10% of non-emptyCase): русском, общем, современном, разных, первом, русской, литературном, первой, переносном, основномNom(44582; 33% of non-emptyCase): хороший, большой, первый, русский, маленькая, первая, большая, добрый, старый, железныйEMPTY(21451): XIX, нужно, п., хорошо, XVIII, должен, лучше, XX, должны, должна
| Paradigm русский | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Sing | русского | |||||
| Animacy=Anim|Number=Plur | русских | |||||
| Animacy=Inan|Gender=Masc|Number=Sing | русский, русская | |||||
| Animacy=Inan|Number=Plur | русские | |||||
| Gender=Masc|Number=Sing | русский | русскому | русского | русском | русским | |
| Gender=Fem|Number=Sing | русская | русскую | русской | русской, Русския | русской | русской |
| Gender=Fem|Number=Sing|Typo=Yes | Рускую | Рускыя | ||||
| Gender=Neut|Number=Sing | русское | русское | русскому | русского | русском | русским |
| Number=Plur | русские | русским | русских | русских | русскими | |
| Number=Plur|Typo=Yes | руския |
PRON
88081 PRON tokens (99% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Number=Sing (66903; 76%), Animacy=EMPTY (63541; 72%), PronType=Prs (62722; 71%).
PRON tokens may have the following values of Case:
Acc(14724; 17% of non-emptyCase): его, меня, что, их, ее, себя, это, тебя, нас, тоDat(10758; 12% of non-emptyCase): мне, ему, ей, нам, тебе, себе, вам, им, тому, немуGen(8977; 10% of non-emptyCase): нас, меня, ничего, него, них, того, всего, этого, чего, васIns(4754; 5% of non-emptyCase): тем, ним, собой, ними, ней, чем, им, нами, мной, этимLoc(3314; 4% of non-emptyCase): том, этом, нем, ней, чем, них, себе, чём, нём, многомNom(45553; 52% of non-emptyCase): я, он, она, это, мы, они, ты, что, вы, всеPar(1; 0% of non-emptyCase): чегоEMPTY(745): т., пр., др., чего-л.
| Paradigm что | Nom | Acc | Dat | Gen | Loc | Ins | Par |
|---|---|---|---|---|---|---|---|
| ExtPos=ADP|Gender=Neut|PronType=Rel | что | ||||||
| ExtPos=ADV|Gender=Neut|PronType=Rel | что | что | |||||
| ExtPos=DET|Gender=Masc|PronType=Int | Что | ||||||
| ExtPos=DET|Gender=Neut|PronType=Exc | что | ||||||
| ExtPos=DET|Gender=Neut|PronType=Int | что | что | |||||
| ExtPos=DET|Gender=Neut|PronType=Rel | что | что | |||||
| ExtPos=NOUN|Gender=Neut|PronType=Rel | что | ||||||
| ExtPos=PRON|Gender=Neut|PronType=Rel | что | чему | чем | чем | |||
| Gender=Masc|PronType=Rel | что | ||||||
| Gender=Neut|PronType=Dem | что | что | |||||
| Gender=Neut|PronType=Emp | Что | ||||||
| Gender=Neut|PronType=Exc | что | что | чего | ||||
| Gender=Neut|PronType=Ind | что | чего | |||||
| Gender=Neut|PronType=Int | что | что, што, че, что́ | чему | чего | чем, чём | чем, Чам | чего |
| Gender=Neut|PronType=Int|Typo=Yes | Что-о, чьто | ||||||
| Gender=Neut|PronType=Neg | что | чему | чего | чем | чем | ||
| Gender=Neut|PronType=Rel | что, что́ | что, што | чему | чего | чем, чём | чем | |
| Gender=Neut|PronType=Rel|Typo=Yes | сто | сто, што | сём |
DET
55708 DET tokens (87% of all DET tokens) have a non-empty value of Case.
The most frequent other feature values with which DET and Case co-occurred: Animacy=EMPTY (48613; 87%), Poss=EMPTY (44333; 80%), Number=Sing (38154; 68%).
DET tokens may have the following values of Case:
Acc(13497; 24% of non-emptyCase): все, свою, этот, свои, эту, это, всю, свой, эти, своеDat(2868; 5% of non-emptyCase): своему, этому, всем, которому, своей, своим, другим, тому, которым, всемуGen(10296; 18% of non-emptyCase): этого, других, этих, всех, своего, которого, которых, этой, тех, своихIns(4638; 8% of non-emptyCase): таким, своим, своими, своей, самым, другими, одним, этим, тем, этимиLoc(5792; 10% of non-emptyCase): этом, котором, самом, том, своем, своих, всех, этой, своей, которойNom(18617; 33% of non-emptyCase): все, которые, эти, сам, который, этот, это, эта, один, такиеEMPTY(8125): его, ее, их, её, др., н., таковы, таков, такова, каково
| Paradigm этот | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Sing | этого | |||||
| Animacy=Anim|Number=Plur | этих | |||||
| Animacy=Inan|ExtPos=DET|Gender=Masc|Number=Sing | этот | |||||
| Animacy=Inan|ExtPos=DET|Number=Plur | эти | |||||
| Animacy=Inan|Gender=Masc|Number=Sing | этот | этот | ||||
| Animacy=Inan|Gender=Neut|Number=Sing | этого | |||||
| Animacy=Inan|Number=Plur | эти, этих | |||||
| ExtPos=DET|Gender=Masc|Number=Sing | этот | этому | этого | этом | этим | |
| ExtPos=DET|Gender=Fem|Number=Sing | эта | эту | этой | этой | этой | этой |
| ExtPos=DET|Gender=Neut|Number=Sing | Это | это | этому | этого | этим | |
| ExtPos=DET|Number=Plur | эти | этим | этих | этих | Этими | |
| Gender=Masc|Number=Sing | этот, Это | этому | этого | этом | этим | |
| Gender=Fem|Number=Sing | эта | эту | этой | этой | этой | этой, этою |
| Gender=Neut|Number=Sing | это | это | этому | этого | этом | этим |
| Gender=Neut|Number=Sing|Typo=Yes | это | это | этово | |||
| Number=Plur | эти | этим | этих | этих | этими |
PROPN
54576 PROPN tokens (81% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Abbr=EMPTY (54565; 100%), Number=Sing (54034; 99%), Animacy=Anim (45261; 83%), Gender=Masc (35768; 66%).
PROPN tokens may have the following values of Case:
Acc(3801; 7% of non-emptyCase): Толика, Сибирочку, Лизу, Мишку, россию, кузьку, москву, Русь, Петербург, алёнуDat(2390; 4% of non-emptyCase): Толику, Лизе, Сибирочке, Мишке, Алёне, Фросе, Пушкину, Лидии, Матвеевне, АннеGen(13604; 25% of non-emptyCase): Пушкина, россии, Возрождения, Толстого, Гоголя, Достоевского, Европы, Востока, Лермонтова, ТоликаIns(2221; 4% of non-emptyCase): Наташей, Толиком, Нюрой, Лизой, Сибирочкой, Мишкой, Пушкиным, Петром, Иваном, АннойLoc(3331; 6% of non-emptyCase): россии, Москве, Руси, Франции, Европе, Германии, Италии, Риме, Англии, ПарижеNom(29185; 53% of non-emptyCase): Толик, Алёна, Лиза, Мишка, Кузька, Анна, Сибирочка, Соня, Фрося, иванVoc(44; 0% of non-emptyCase): Тань, Валь, Коль, Моть, Паш, Алён, Ань, Насть, Серёж, ЯшEMPTY(12831): А., В., И., Н., М., С., П., Ф., Г., К.
| Paradigm Алена | Nom | Acc | Dat | Gen | Voc | Loc | Ins |
|---|---|---|---|---|---|---|---|
| Алёна, Алена | алёну, Алену | Алёне, Алене | Алёны, Алены | Алён | Алёне | Алёной |
VERB
17274 VERB tokens (8% of all VERB tokens) have a non-empty value of Case.
The most frequent other feature values with which VERB and Case co-occurred: Mood=EMPTY (17274; 100%), Person=EMPTY (17274; 100%), VerbForm=Part (17132; 99%), Tense=Past (11221; 65%), Number=Sing (10589; 61%), Voice=Act (9434; 55%), Aspect=Perf (9368; 54%).
VERB tokens may have the following values of Case:
Acc(3089; 18% of non-emptyCase): связанные, написанные, посвященные, называемый, имеющие, выполненные, существующие, созданные, блестящий, заданноеDat(792; 5% of non-emptyCase): жившему, некому, пишущему, собравшимся, читающему, играющим, нечему, описываемым, погибшим, расчищеннойGen(3865; 22% of non-emptyCase): нечего, связанных, действующих, имеющих, называемого, редуцированных, изображаемого, составляющих, называемой, посвященныхIns(1901; 11% of non-emptyCase): дрожащим, закрытыми, дрожащими, нечем, блестящими, горящими, раскрытыми, связанными, допускающим, сверкающимиLoc(964; 6% of non-emptyCase): написанных, приведенном, связанном, написанном, обобщенном, приведенных, случившемся, вышедшем, изданном, называемойNom(6663; 39% of non-emptyCase): связанные, созданные, называемая, посвященные, называемый, написанные, называемые, созданный, связанная, созданнаяEMPTY(194372): есть, может, можно, сказал, надо, нет, сказала, значит, было, сказать
| Paradigm сказать | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Gender=Masc|Number=Sing|Voice=Act | сказавший | сказавшему | сказавшего | сказавшим | ||
| Gender=Masc|Number=Sing|Voice=Pass | сказанным | |||||
| Gender=Fem|Number=Sing|Voice=Pass | сказанная | |||||
| Gender=Neut|Number=Sing|Voice=Pass | сказанное | сказанное | сказанному | сказанного | сказанном | |
| Number=Plur|Voice=Pass | сказанные | сказанным |
NUM
9044 NUM tokens (70% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: NumForm=Word (9016; 100%), NumType=Card (8399; 93%), Number=EMPTY (7143; 79%), Gender=EMPTY (4900; 54%).
NUM tokens may have the following values of Case:
Acc(3250; 36% of non-emptyCase): несколько, два, много, три, один, одну, две, сколько, одно, пятьDat(205; 2% of non-emptyCase): одному, одной, двум, обеим, обоим, пяти, трем, нескольку, шести, семиGen(1232; 14% of non-emptyCase): двух, одного, одной, трех, нескольких, пяти, четырех, семи, шести, обеихIns(414; 5% of non-emptyCase): двумя, одним, одной, тремя, несколькими, обеими, четырьмя, семью, пятью, обоимиLoc(420; 5% of non-emptyCase): одном, двух, одной, нескольких, трех, обоих, трёх, семи, десяти, четырехNom(3523; 39% of non-emptyCase): много, два, один, три, две, одна, мало, оба, сколько, несколькоEMPTY(3804): 2, 1, 3, 5, 4, больше, 10, 6, 20, 7
| Paradigm один | Nom | Acc | Dat | Gen | Loc | Ins |
|---|---|---|---|---|---|---|
| Animacy=Anim|Gender=Masc | одного | |||||
| Animacy=Inan|ExtPos=PRON|Gender=Masc | один | |||||
| Animacy=Inan|Gender=Masc | один | |||||
| Animacy=Inan|Gender=Masc|Typo=Yes | оден | |||||
| ExtPos=NUM|Gender=Masc | одним | |||||
| ExtPos=NUM|Gender=Fem | Одна | |||||
| Gender=Masc | один | один | одному | одного | одном | одним |
| Gender=Fem | одна | одну | одной | одной | одной | одной |
| Gender=Neut | одно | одно | одному | одного | одном | одним |
AUX
5 AUX tokens (0% of all AUX tokens) have a non-empty value of Case.
The most frequent other feature values with which AUX and Case co-occurred: Mood=EMPTY (5; 100%), Person=EMPTY (5; 100%), Tense=Past (5; 100%), VerbForm=Part (5; 100%), Voice=Act (5; 100%), Number=Sing (4; 80%), Gender=Masc (3; 60%).
AUX tokens may have the following values of Case:
Acc(1; 20% of non-emptyCase): бывшегоNom(4; 80% of non-emptyCase): бывший, бывшая, бывшиеEMPTY(12982): было, бы, был, была, были, быть, будет, есть, буду, будут
| Paradigm быть | Nom | Acc |
|---|---|---|
| Animacy=Anim|Gender=Masc|Number=Sing | бывшего | |
| Gender=Masc|Number=Sing | бывший | |
| Gender=Fem|Number=Sing | бывшая | |
| Number=Plur | бывшие |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[amod]–> ADJ (105268; 98%),
NOUN –[det]–> DET (37333; 84%),
NOUN –[conj]–> NOUN (35000; 94%),
NOUN –[acl]–> VERB (9724; 84%),
ADJ –[conj]–> ADJ (9128; 97%),
NOUN –[appos]–> NOUN (5766; 70%),
NOUN –[appos]–> PROPN (4403; 74%),
NOUN –[amod]–> VERB (3304; 99%),
NOUN –[nsubj]–> PRON (2913; 77%),
PROPN –[conj]–> PROPN (2890; 91%).