Treebank Statistics: UD_Buryat-BDT: Features: Case
This feature is universal.
It occurs with 6 different values: Abl, Acc, Com, Dat, Gen, Nom.
4060 tokens (40%) have a non-empty value of Case.
2335 types (57%) occur at least once with a non-empty value of Case.
1351 lemmas (55%) occur at least once with a non-empty value of Case.
The feature is used with 8 part-of-speech tags: NOUN (2952; 29% instances), PROPN (700; 7% instances), PRON (260; 3% instances), VERB (121; 1% instances), NUM (9; 0% instances), ADJ (8; 0% instances), AUX (6; 0% instances), ADV (4; 0% instances).
NOUN
2952 NOUN tokens (95% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Number=EMPTY (2588; 88%).
NOUN tokens may have the following values of Case:
Abl(67; 2% of non-emptyCase): нютагһаа, наһанһаа, онһоо, утаһаар, багаһаа, зүрхэнһөө, сагһаа, хотоһоо, үндэһэнһөө, һууринһааAcc(131; 4% of non-emptyCase): бэеэ, зааниие, хүниие, зониие, поэзии, хүбүүе, үхибүүниинь, үхибүүдые, Сэхыень, арадуудыеCom(90; 3% of non-emptyCase): хэрэгтэй, наһатай, бэлигтэй, соёлтой, шадабаритай, артистнартай, нэрэтэй, түүхэтэй, удхатай, үхибүүтэйDat(394; 13% of non-emptyCase): үедэ, ондо, нютагта, хотодо, һургуулида, туршада, хүндэ, сагта, жэлдэ, гэртээGen(529; 18% of non-emptyCase): аймагай, соёлой, жэлэй, театрай, хэлэнэй, хүнэй, һургуулиин, зоной, нютагай, буряадайNom(1741; 59% of non-emptyCase): хүн, зон, гэр, хэлэ, ажал, хэлэн, Буряад, бэлиг, нютаг, соёлEMPTY(162): түмэр, угаараа, хэлээр, аймагаар, багшаар, барилдаагаар, дүнгүүдээр, замаар, машинаар, наһаараа
| Paradigm нютаг | Nom | Acc | Dat | Gen | Com | Abl |
|---|---|---|---|---|---|---|
| _ | нютаг, нютагни | нютагта, нютагтамнай | нютагай, нютагайхид | нютагтай | нютагһаа | |
| Number=Plur | нютагууд | |||||
| Number[psor]=Sing|Person[psor]=3 | нютагтань | нютагайнь | ||||
| Reflex=Yes | нютагаа | нютагые | нютагтаа | нютагайнгаа |
PROPN
700 PROPN tokens (99% of all PROPN tokens) have a non-empty value of Case.
PROPN tokens may have the following values of Case:
Abl(9; 1% of non-emptyCase): Монголһоо, Алташаһаа, Зандинһаа, Суулгаһаа, Хаашагһаа, Дулмаһаа, Оулуһаань, ТуркуһааньAcc(5; 1% of non-emptyCase): Зандиниие, Тамминэни, Шанагаяа, Цыпелмаае, ЦыренгармаевыеCom(7; 1% of non-emptyCase): Борисовтай, Далбаевтай, Ивановтой, Митрошкинатай, Протасоватай, Ханхареевнатай, ЦыреноватайDat(24; 3% of non-emptyCase): Улаан-Үдэдэ, Зандинда, Абида, Баянгазада, Голливудта, Москвадашье, Париста, Суулгада, Туркада, Усть-ОрдадаGen(138; 20% of non-emptyCase): Россиин, Агын, СССР-эй, Усть-Ордын, Азиин, Ивалгын, Монголой, Сибириин, Суулгын, ТүнхэнэйNom(517; 74% of non-emptyCase): Байгал, Энэдхэг, Хойто, Булад, Улаан-Үдэ, Баянгаза, Цыпелма, Баяр, Зүдхэлиин, ЗүүнEMPTY(9): Мундаргын, Абагал, Гүрэнэй, Кондратьев, Кондратьевай, Хатареев, Хүсөөтэдэ, Шишкинские
| Paradigm Цыпелма | Nom | Acc | Dat | Gen |
|---|---|---|---|---|
| Цыпелма | Цыпелмаае | Цыпелмада | Цыпелмагай | |
| Reflex=Yes | Цыпелмае |
PRON
260 PRON tokens (90% of all PRON tokens) have a non-empty value of Case.
PRON tokens may have the following values of Case:
Abl(4; 2% of non-emptyCase): Бултанайнгаа, Тэрээнһээ, бусадһаа, энэһээAcc(21; 8% of non-emptyCase): бүгэдые, бүхэниие, маанарые, тэрэниие, энээниие, Өөһэнөө, Хамагые, Энээхэниие, бултанииемнай, бултыемнайCom(5; 2% of non-emptyCase): шамтай, Намтаяа, тэдээнтэй, тэрэнтэйDat(23; 9% of non-emptyCase): намда, бүхэндэ, Маанадта, Шамда, Энээндэнь, бидэнтэеэ, бултадаа, маанарта, танда, тэдээндэGen(77; 30% of non-emptyCase): минии, манай, намайе, тэрэнэй, өөрынгөө, Тэдэнэй, өөрын, бидэнэй, танай, өөһэдынNom(130; 50% of non-emptyCase): би, бидэ, эдэ, тэрэ, энэшни, энэ, өөрөө, та, тэдэнэр, тэрэшниEMPTY(28): нэгэниинь, тэдэнээ, хэншье, хэнэй, юугээрээ, юунһээшье, Намааршье, Хэнэйшье, Юугээ, алииеньшье
| Paradigm тэрэ | Nom | Acc | Dat | Gen | Com | Abl |
|---|---|---|---|---|---|---|
| ExtPos=ADV | тэрэ | |||||
| Number[psor]=Sing|Person[psor]=3 | тэрээндэнь | |||||
| тэрэ, тэрэшни, тэрээн, тэрэмни | тэрэниие, тэрээниие | тэрээндэ | тэрэнэй | тэрэнтэй | Тэрээнһээ |
VERB
121 VERB tokens (8% of all VERB tokens) have a non-empty value of Case.
The most frequent other feature values with which VERB and Case co-occurred: Mood=EMPTY (121; 100%), Person=EMPTY (121; 100%), Number=EMPTY (119; 98%), VerbForm=Ger (118; 98%), Tense=EMPTY (116; 96%).
VERB tokens may have the following values of Case:
Abl(2; 2% of non-emptyCase): барихаһаа, табихаһааAcc(20; 17% of non-emptyCase): байхаяа, бэдэрхэеэ, бэелүүлхэеэ, бүтээхэеэ, долгилхые, орилхыень, орохыень, сахихаяа, туһалхые, тэжээхэеэDat(63; 52% of non-emptyCase): гэхэдэ, байхада, ошоходоо, хэлэхэдэ, байхадаа, ерэхэдэнь, ерэхэдээ, харахада, хүдэлхэдөө, эхилхэдэньGen(7; 6% of non-emptyCase): болохынь, бэелүүлхын, түрэһэнэй, шэлэхын, эзэлхын, ябахын, һурахынNom(29; 24% of non-emptyCase): ерэхэб, болохоб, ошохоб, һанагшаб, Ошохоо, ажаллагшад, байхаш, байһанаа, барихаш, болохошEMPTY(1409): гэжэ, бии, байгаа, бэлэй, гээшэ, ажаһуудаг, эхилээ, ябаа, байна, ерээ
| Paradigm һура | Nom | Acc | Dat | Gen |
|---|---|---|---|---|
| Reflex=Yes | һурахадаа | |||
| һурахаш | һурахаяа | һурахадатнай | һурахын |
NUM
9 NUM tokens (4% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: NumType=Card (9; 100%).
NUM tokens may have the following values of Case:
Acc(1; 11% of non-emptyCase): нэгыеNom(8; 89% of non-emptyCase): гурбадахи, нэгэдэхи, Хоёрдохи, арбадахи, хоердохи, юһэдэхиEMPTY(214): нэгэ, зуун, хоёр, арбан, гурбан, юһэн, долоон, мянга, хоер, 1-дэхи
| Paradigm нэгэ | Nom | Acc |
|---|---|---|
| нэгэдэхи | нэгые |
ADJ
8 ADJ tokens (1% of all ADJ tokens) have a non-empty value of Case.
ADJ tokens may have the following values of Case:
Acc(2; 25% of non-emptyCase): хатууе, зориһоныеCom(4; 50% of non-emptyCase): муутай, хурсатай, хэрэгтэй, шогтойGen(1; 13% of non-emptyCase): ГорскогоNom(1; 13% of non-emptyCase): һайнуудEMPTY(806): буряад, түрэл, уран, олон, һайн, бага, үндэр, бэрхэ, агууехэ, гоё
AUX
6 AUX tokens (3% of all AUX tokens) have a non-empty value of Case.
The most frequent other feature values with which AUX and Case co-occurred: Aspect=EMPTY (6; 100%), Mood=EMPTY (6; 100%), Number=EMPTY (6; 100%), Person=EMPTY (6; 100%), Tense=EMPTY (6; 100%), VerbForm=Ger (6; 100%).
AUX tokens may have the following values of Case:
Abl(1; 17% of non-emptyCase): байхаһааDat(4; 67% of non-emptyCase): байхада, байхадааNom(1; 17% of non-emptyCase): байхалEMPTY(187): байгаа, байна, байһан, болоно, бай, болоо, байгааб, байба, байдаг, болонхой
| Paradigm бай | Nom | Dat | Abl |
|---|---|---|---|
| Reflex=Yes | байхадаа | ||
| байхал | байхада | байхаһаа |
ADV
4 ADV tokens (1% of all ADV tokens) have a non-empty value of Case.
ADV tokens may have the following values of Case:
Nom(4; 100% of non-emptyCase): тэндэхи, хаанахиEMPTY(772): ехэ, мүнөө, гэһэн, бэшэ, һайхан, эндэ, эгээл, хадаа, үшөө, ганса
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
PROPN –[flat]–> PROPN (146; 78%),
NOUN –[conj]–> NOUN (108; 76%),
PROPN –[conj]–> PROPN (43; 91%),
NOUN –[nsubj]–> NOUN (41; 85%),
NOUN –[appos]–> PROPN (33; 97%),
NOUN –[amod]–> NOUN (29; 54%),
PROPN –[compound]–> NOUN (15; 71%),
PROPN –[flat]–> NOUN (15; 58%),
PROPN –[list]–> PROPN (12; 100%),
NOUN –[parataxis]–> NOUN (10; 77%).