UD Moksha JR
Language: Moksha (code: mdf)
Family: Uralic
This treebank has been part of Universal Dependencies since the UD v2.5 release.
The following people have contributed to making this treebank part of UD: Jack Rueter, Maria Levina, Nadezhda Kabaeva, Judit Molnár, Khalid Alnajjar.
Repository: UD_Moksha-JR
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.17
License: CC BY-SA 4.0
Genre: nonfiction, news
Questions, comments? General annotation questions (either Moksha-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [rueter • jack (æt) gmail • com]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually in non-UD style, automatically converted to UD |
| UPOS | annotated manually in non-UD style, automatically converted to UD |
| XPOS | annotated manually |
| Features | annotated manually in non-UD style, automatically converted to UD |
| Relations | annotated manually in non-UD style, automatically converted to UD |
Description
Erme Universal Dependencies annotated texts Moksha are the origin of UD_Moksha-JR with annotation (CoNLL-U) for texts in the Moksha language, it originally consists of a sample from a number of fiction authors writing originals in Moksha.
This is a collection of sentences from almost entirely original Moksha-language literary sources dating back to the 1880s with Universal Dependencies (UD) annotations. It has been constructed in alignment with parallel work on Erzya language Universal Dependencies.
There are also about 20 parallel sentences translated by Marina Levina from the Erzya and Russian texts: http://ilazki.thinkgeek.co.uk/brat/#/uralic/myv and http://ilazki.thinkgeek.co.uk/brat/#/uralic/rus
The sent_id attribute value is not randomized in works published earlier than 1938. Developing UD documentation can be found at https://github.com/UniversalDependencies/docs for Erzya.
https://github.com/rueter/erme-ud-moksha
Acknowledgments
The original annotation has been performed by Jack Rueter at the University of Helsinki with the help of Marina Levina at the Mordovian State University im. P.N. Ogariova, Mordvin Languages Department using morphological tools that were originally built with funding from a Kone Foundation «Language Programme» funded project: «Creation of Morphological Parsers for Minority Finno-Ugrian Languages» (2013–2014) with the linguistic work of Merja Salo, and facilitated at the Norwegian Arctic University in Tromsø. Work with the Moksha treebank builds upon previous experience with the UD_Erzya-JR treebank and continued consultations and discussions with Francis Tyers, Tommi Pirinen, Jonathan Washington. Without the Moksha writers themselves, however, we would be no where…
Annotation work is simultaneous to finite-state transducer development by Nadjezhda Kabaeva, Marina Levina and Jack Rueter in the GiellaLT infrastucture, which also works with Constraint Grammar disambiguation of the morphological analysis.
References
If you use this data set in an academic publication, I would be ever so grateful if you cited it as follows:
Jack Rueter. (2018, January 20). Erme UD Moksha (Version v1.0) http://doi.org/10.5281/zenodo.1156112
About the authors
- Кузнецов, Юрий 1975: Сембось ушеткшни киста. Саранск.
- Mishanina, V. I. (Мишанина, В. И.) 1972: Лиендень очконяса. Мокша №3, 38–39. Саранск. (MishaninaValentina_LiendenyOchkonyasa_Moksha-1972-No2-pp38-39) (Мордовиянь Кадошкина аймаконь Адаж веле)
-
- Мокшень кяль. Синтаксис* : учебник / аноклаф-тиф Н. С. Алямкинонь и О. Е. Поляковонь профессорхнень вятемаснон ала. – Саранск : Изд-во Мордов. ун-та, 2008. – 200 с. – На морд.-мокша яз.
- Pyanzin, Fyodor (Пьянзин, Фёдор) 1991: Седить тердеманц коряс: Повесть. – Саранск: Мордов. кн. изд-во, 1991. – 120 с. Мордов.-мокша яз.
In release 2.7 additional example sentences used in the Moksha-language grammar Мокшень кяль, синтаксис: учебник (2008) were included. These sentences are marked with sent_id-s that contain the components MKS:2008:page:n-th sentence:original author. It is hoped that the inclusion of these sentences will help cover various grammatical phenomena in Moksha syntax. When refering to these sentences, we advise you also cite the original source:
- Алямкин, Н. С. (гл. ред.); Гришунина, В. П.; Иванова, Г. С.; Кабаева, Н. Ф.; Кулакова, Н. А.; Левина, М. З.; Поляков, О. Е. (гл. ред.); Рогожина, В. Ф.; Седова, П. Е. 2008: * Мокшень кяль. Синтаксис : учебник [Moksha language. Syntax: reader]. – Саранск : Изд-во Мордов. ун-та.
- Alâmkin, N. S. (chief ed.); Grushinina, V. P.; Ivanova, G. S.; Kabaeva, N. F.; Kulakova, N. A.; Levina, M. Z.; Polâkov, O. E. (chief ed.); Rogozhina, V. F.; Sedova, P. E. 2008: * Mokshen’ kâl’. Sintaksis: uchebnik [Moksha language. Syntax: reader]. – Saransk : Izd-vo Mordov. un-ta.
- Feoktistov, Aleksandr P. 1976. Očerki po istorii formirovanija mordovskix pis’menno-literaturnyx jazykov (rannij period) [Essays on the history of formation of Mordvin literary languages (early period)]. Moscow: Nauka.
- Helsingin yliopisto, FIN-CLARIN, Rueter, J., & Axelson, E. (2022). Raamatun jakeita uralilaisille kielille, rinnakkaiskorpus, Korp [aineisto]. Kielipankki. http://urn.fi/urn:nbn:fi:lb-2020021121
- Jurkiewicz-Rohrbacher, Edyta; Kehayov, Petar 2024: Deeply embedded clauses in Finno-Ugric: A pilot study on Estonian and Moksha Mordvin. * Finnish Journal of Linguistics * 37 (2024), 105–133. DOI: 10.61197/fjl.144760
- Kehayov, Petar 2020: Between facts and speech acts: The conditional and condictional-conjunctive in Moksha Mordvin. Linguistica Uralica LVI 2020 1 [https://dx.doi.org/10.3176/lu.2020.1.03]
Statistics of UD Moksha JR
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Abbr – AdpType – AdvType – Animacy – Aspect – Case – Clitic – Connegative – Definite – Degree – Derivation – ExtPos – Gender – Mood – NameType – Nomzr – NounType – Number – Number[obj] – Number[psor] – Number[subj] – NumForm – NumType – PartForm – PartType – Person – Person[obj] – Person[psor] – Person[subj] – Polarity – PronType – PunctSide – Reflex – Style – Tense – Typo – Variant – VerbForm – VerbType
Relations
acl – acl:relcl – advcl – advmod – advmod:cmp – amod – appos – aux – aux:neg – aux:opt – case – cc – cc:preconj – ccomp – compound – compound:nn – conj – cop – csubj – csubj:cop – dep – det – discourse – dislocated – expl – fixed – flat – flat:name – list – mark – nmod – nmod:bahuv – nmod:gobj – nmod:poss – nsubj – nsubj:cop – nsubj:pass – nummod – obj – obl – obl:agent – obl:cmp – obl:tmod – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 476 sentences, 4422 tokens and 4429 syntactic words.
- This corpus contains 843 tokens (19%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 41 types of words that contain both letters and punctuation. Examples: кати-коста, кодама-кодама, кой-кие, кой-кона, шинек-венек, эрямань-ащемань, 14-це, Алда-баба, Васток-васток, И., Кой-кинди, Коса-бди, Н., Панчк-ка, Пилсесь-лаксесь, Эрясть-ащесть, атят-бабат, видьмода-эрьгада, кати-мезе, кодама-бъди, кой-коста, кядьта-пильгта, лиендихть-тиихть, лийфнесамазь-тисамазь, мезе-бди, мезень-бъди, обедамста-ужнамста, однек-сиренек, ризфсь-пичефкссь, саднек-мезнек, стирьхне-цёратне, тиеда-арада, трнаты-вачкаты, тядяфтома-аляфтома, тяшнесь-нарнесь, фкя-фкянь, шталезе-урядалезе, щафтама-каряфтама, эряй-ащи, ювандема-явондема, ётай-потай
- This corpus contains 4 multi-word tokens. On average, one multi-word token consists of 2.75 syntactic words.
- There are 4 types of multi-word tokens. Examples: ласькозь-ласькихть, тостотненди, эрят-ащат, юмай-арай.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 11 word types tagged as particles (PART): вдь, въдь, дяряй, и, ли, нльне, нльня, сяда, хоть, хуш, шять
- This corpus contains 29 lemmas tagged as pronouns (PRON): иля, кати-мезе, кафонест, кафцьке, ки, кивок, кие, кой-кие, кой-кона, кона, лия, мезе, мезе-бди, мезевок, мон, монць, ня, сембе, сон, сонць, сь, ськамот, ся, тон, тона, тонць, тя, фкя-фкя, эсь
- This corpus contains 16 lemmas tagged as determiners (DET): иля, кафцьке, кодама-бди, кой-кона, лама, лия, мзяра, ня, сембе, сняра, ся, сяка, тя, тяка, тяфтама, эрь
- Out of the above, 8 lemmas occurred sometimes as PRON and sometimes as DET: иля, кафцьке, кой-кона, лия, ня, сембе, ся, тя
- This corpus contains 9 lemmas tagged as auxiliaries (AUX): аф, аш, ба, катк, ли, савомс, сашендовомс, улемс, эрявомс
- Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: савомс, эрявомс
- There are 8 (de)verbal forms:
- Conv
- VERB: вятезь, ласькозь, эцезь, ётазь, Нолдазь, Тумстост, дивандазь, завтракамста, кенордазь, мадомста
- Conv,Part
- AUX: апак
- Fin
- AUX: ульсь, ашезь, ашень, ашеть, изь, ульсть, эрявсь, ашесть, тяк, ули
- VERB: архт, марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь
- Inf
- VERB: стямс, тиемс, тонафтомс, ётамс, куцема, работама, Валдашкодомс, аделамс, анцемс, арамс
- NomAg
- VERB: ётафтысь
- Part
- VERB: мяляфтан, Кундафнень, Содаф, анеляф, ацафоль, ащи, иретьфти, лиенди, максф, маскировандафт
- Sup
- VERB: путькияма
- Vnoun
- VERB: Авардемать, Нумань, апрякама, ардомась, варьхмодема, видемда, кельгомнян, кенярдема, куломозон, ляцендемат
Nominal Features
- Fem
- PROPN: Петровна, Варвара, Васильевна, Ивановать, Людмила, Николаевнань, Светлана
- Masc
- PROPN: Вельдинонь, Голенков, Девинонь, Девятаев, Злобинонь, Келаськин, Кокоревонь, Кукушкинць, Михаил, Петр
- Hum
- NOUN: тядяц
- PRON: Кинди
- PROPN: Петровна, Варвара, Васильевичекс, Васильевна, Вельдинонь, Голенков, Девинонь, Девятаев, Елена, Злобинонь
- Plur
- ADJ: мазыхть, весялат, лямбот, малат, пяндрат, ёнюфт
- DET: ня
- NOUN: ломаттне, стирнятне, валхнень, ломатть, гулянятнень, досканят, жаворонкатне, кизотнень, коволнятнень, морот
- NUM: Кафттне, кемотть
- PRON: синь, минь, тейст, Лиятнень, кафонест, конат, синьге, сятка, теест, тейнть
- VERB: Кундафнень, Лядыхне, кельгихть, ляцендемат, маскировандафт, мярьгихть, путфт, сялондыхнень, шапфт, шнакшнематне
- VERB-Part: Кундафнень, маскировандафт, путфт, шапфт
- VERB-Vnoun: ляцендемат, шнакшнематне
- Plur,Sing
- ADJ: Ёмластокиге, Мокшень, Немойкс, аноконди, маластонь, оцюняснон, пародонга, роднойкс
- ADV: ламос, сяшкава
- DET: ламос
- NOUN: лангс, лангса, паксянь, каршес, сёксень, вирьса, кудса, ульцяв, ярмакса, Марянь
- NUM: Кемоньшка, кеветиешка, нильгемоньшка
- PRON: сембонь, Мезень, киньге, конань, мезенкса, Кой-кинди, Конашка, Мезьда, илянь, кинди
- PROPN: Архипонь, Валентинонди, Ванянди, Васильевичекс, Вельдинонь, Веряскинонди, Витянь, Девинонь, Злобинонь, Кокоревонь
- VERB: мяляфтан, Нумань, видемда, куломозон, морамаснон, мяляфтат, покодемаснон, работаманкса, саманьконь, самозост
- VERB-Part: мяляфтан, мяляфтат, сюдофокс, юкстафокс
- VERB-Vnoun: Нумань, видемда, куломозон, морамаснон, покодемаснон, работаманкса, саманьконь, самозост, сяськоманкса, тумозонза
- Sing
- ADJ: оцю, од, тяфтама, мазы, пара, сире, цебярь, акша, кодама, козя
- DET: тя, эрь, лама, сембе, ся, сяка, иля, кодама-бъди, кой-кона, лия
- NOUN: шись, тячи, ава, пингть, шиня, Тишка, ланга, ломань, пря, цёранц
- NUM: кафта, фкя, колма, 225, 7, вете, колмоцьке, комсь, ниле
- PRON: сон, мон, сонь, тя, ся, мезе, тон, тейнза, мезевок, монь
- PROPN: Петя, Иван, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Браун, Варвара
- VERB: Авардемать, Содаф, азовомшка, анеляф, аноклайхть, аноклама, апрякама, ардомась, варьхмодема, кельгомнян
- VERB-NomAg: ётафтысь
- VERB-Part: Содаф, анеляф, максф, пидефонц, праф, сафат, сивотьф, содафоль, тертьфоль, тиф
- VERB-Sup: путькияма
- VERB-Vnoun: Авардемать, апрякама, ардомась, варьхмодема, кельгомнян, кенярдема, муськома, работамась, саманцты, сувамац
- Abe
- NOUN: лемфтома, перилафтома, эрьгяфтома
- Abl
- ADJ: пародонга
- ADP: эзда, фталда, алда, ширде, эздон, эздонк, эздост
- ADV: вярде, ичкозде
- NOUN: ломаньда, ширде, Аннада, Пиледот, алядот, вайгяльда, врьгазда, занятияда, иможда, книгада
- PRON: Мезьда, Тяда, мондедон, сембода
- VERB-Inf: валдашкодомда, ванфтомода, видемда, корхтамда, крфамда, лездомда, тиемда, шашнемда, якамда
- VERB-Part: мяляфтан, мяляфтат
- VERB-Vnoun: видемда, ужнамда
- Cau
- ADP: инкса
- ADV: тянкса
- NOUN: лезксонкса
- PRON: мезенкса
- VERB-Vnoun: работаманкса, сяськоманкса
- Cmp
- ADP: эшка
- NOUN: пялешка, сурбряшка
- NUM: Кемоньшка, кеветиешка, нильгемоньшка
- PRON: Конашка
- Com
- NOUN: шинек-венек, куднек, саднек-мезнек, ульцянек
- Dat
- ADJ: аноконди
- NOUN: Алязтиге, Дарюняти, Кенкшти, Кепотьксонди, Кинди, Луканди, Маринкати, Цёранянди, Ялгати, авардематненди
- PRON: тейнза, тейть, Тейне, кинди, теень, тейст, Кой-кинди, Мондейне, Сондеенза, Сондейнза
- PROPN: Валентинонди, Ванянди, Веряскинонди, Иоанцти, Петровиченди, Шкабазти
- VERB-Vnoun: саманцты, цяпамати
- Ela
- ADJ: Ёмластокиге, маластонь
- ADP: пингста, ваксста
- ADV: вишкста, тоста, Тяста, кальдявста, кати-коста, кой-коста, эрязста, эста, беднайста, весяласта
- NOUN: велеста, комнатаста, кудста, онцтон, пингста, пингстонза, ёткста, Ёткстонт, Вирьста, Москуста
- VERB: лисемста, самста, Тумстост, завтракамста, мадомста, обедамста-ужнамста
- VERB-Conv: Тумстост, завтракамста, мадомста, обедамста-ужнамста
- Gen
- ADJ: Очижинь, омбоцеть, тячиень, Мокшень, Передовойть, главнайть, моронц, оцюняснон
- ADV: кафтонь
- NOUN: паксянь, пингть, сёксень, цёранц, шить, валхнень, велеть, менельть, мирденц, очконять
- PRON: сонь, монь, сембонь, тонь, синь, тянь, минь, Мезень, киньге, конань
- PROPN: Архипонь, Вельдинонь, Витянь, Девинонь, Злобинонь, Ивановать, Кокоревонь, Мокшеть, Николаевнань, Пашуть
- VERB: Авардемать, Кундафнень, Нумань, аноклайхть, морамаснон, пидефонц, покодемаснон, саманьконь, сялондыхнень, тушендомаснон
- VERB-Part: Кундафнень, пидефонц
- VERB-Vnoun: Авардемать, Нумань, морамаснон, покодемаснон, саманьконь, тушендомаснон, эводемать, эрямань-ащемань
- Ill
- ADP: лангс, ваксс, коряс, малас, Корязост, корязон, корязонк, корязонт, эзонза
- ADV: Коза, ламос, Мес, козовок, козонга, тяза
- DET: ламос
- NOUN: лангс, каршес, вастс, кучкас, лангозонза, вастозонза, вельхксс, воляс, кудрядс, лафтубрязонза
- PRON: эсезост
- VERB-Vnoun: куломозон, самозост, тумозонза
- Ine
- ADP: эса, ваксса, лангса, каршесонк, эсовок, эсонза, эсост
- ADV: тоса, тяса, коса, маласа, Коса-бди, косовок, пяшксетольхть
- NOUN: лангса, вирьса, кудса, ярмакса, больницяса, вайгяльса, войнаса, кизоса, мяльса, тюсса
- PRON: мезьса
- PROPN: Парижса
- Lat
- ADP: алу, шири
- ADV: вяри, алу, оду, ичкози, фталу, меки
- NOUN: инголи, ульцяв, куду, паксяв, шири, школав, Колхозу, Крыму, Мазы, Маманяв
- Loc
- ADP: ала, Инголенк, Инголест, пильгалот
- ADV: ичкозе, инголе, перьфпяле, ичкозят
- AUX: аш
- VERB-Inf: куцема, работама, шурокстомома, азонкшнема, ванондома, ватксема, вятемонза, лувома, морама, мярьгома
- VERB-Vnoun: апрякама
- Nom
- ADJ: оцю, од, тяфтама, мазы, пара, сире, цебярь, акша, кодама, козя
- DET: тя, эрь, лама, сембе, ся, сяка, иля, кодама-бъди, кой-кона, лия
- NOUN: ломаттне, шись, тячи, ава, Тишка, ломань, пря, стирнятне, шамац, визькс
- NUM: кафта, фкя, колма, 225, 7, Кафттне, вете, кемотть, колмоцьке, комсь
- PRON: сон, мон, тя, ся, мезе, тон, синь, мезевок, минь, кона
- PROPN: Петя, Иван, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Браун, Варвара
- VERB: Лядыхне, Содаф, азовомшка, анеляф, аноклама, ардомась, варьхмодема, кельгихть, кельгомнян, кенерь
- VERB-NomAg: ётафтысь
- VERB-Part: Содаф, анеляф, максф, маскировандафт, праф, путфт, сафат, сивотьф, содафоль, тертьфоль
- VERB-Sup: путькияма
- VERB-Vnoun: ардомась, варьхмодема, кельгомнян, кенярдема, ляцендемат, муськома, работамась, сувамац, тиемацка, шнакшнематне
- Prl
- ADP: алга, мельгя, эзга, Мельгат, лангаст, мельге
- ADV: перьфпяльге, Шобдава, сяшкава
- NOUN: ланга, вальмава, морява, пандонява, вастоваст, ведьгя, велькска, вельхкска, вирьгя, вярьгя
- Tem
- NOUN: шиня, Пиземня
- Tra
- ADJ: Немойкс, роднойкс
- ADP: ланга
- NOUN: сторожкс, геройкс, депутатокс, июленнекс, кизоннекс, комендантокс, крайкс, лётчикокс, лётчикокска, мокшекс
- PROPN: Васильевичекс
- VERB: сюдофокс, юкставикс, юкстафокс
- VERB-Part: сюдофокс, юкстафокс
- Def
- ADJ: омбоцеть, Передовойть, главнайть, колмоцесь, коськсь
- NOUN: ломаттне, шись, пингть, стирнятне, шить, валхнень, велеть, колхозсь, менельть, очконять
- NUM: Кафттне
- PRON: Лиятнень, Сембось, тненди
- PROPN: Васясь, Ивановать, Игуазсь, Кукушкинць, Маринкась, Марясь, Млай, Мокшеть, Парижсь, Пашуть
- VERB: Авардемать, Кундафнень, Лядыхне, аноклайхть, ардомась, работамась, сетьмось, сялондыхнень, цяпамати, шнакшнематне
- VERB-NomAg: ётафтысь
- VERB-Part: Кундафнень
- VERB-Vnoun: Авардемать, ардомась, работамась, цяпамати, шнакшнематне, эводемать
- Ind
- ADJ: оцю, од, тяфтама, мазы, пара, сире, акша, кодама, козя, пси
- ADV: кати-коста, ламос, Коса-бди, кафтонь, козовок, косовок, сяшкава
- DET: эрь, лама, сембе, сяка, кодама-бъди, кой-кона, ламос, лия, тя, тяка
- NOUN: лангс, тячи, ава, паксянь, шиня, Тишка, каршес, ланга, ломань, пря
- NUM: кафта, фкя, колма, вете, кеветиешка, кемотть, комсь, ниле, нильгемоньшка
- PRON: тя, ся, сембонь, кона, мезевок, мезе, тянь, конань, Конашка, Сянь
- PROPN: Петя, Иван, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Архипонь, Браун
- VERB: мяляфтан, Нумань, Содаф, азовомшка, анеляф, аноклама, апрякама, варьхмодема, видемда, кельгихть
- VERB-Part: мяляфтан, Содаф, анеляф, максф, маскировандафт, мяляфтат, праф, путфт, сафат, сивотьф
- VERB-Sup: путькияма
- VERB-Vnoun: Нумань, апрякама, варьхмодема, видемда, кельгомнян, кенярдема, ляцендемат, муськома, работаманкса, сяськоманкса
Degree and Polarity
- Cmp
- PART: сяда
- Dim
- ADV: аруняста, саворне
- NOUN: карденя, очконять, досканят, коволнятнень, ловнясь, пацяняц, стирнятне, Бабанять, Лефкскятнень, Луганятне
- VERB-Vnoun: кельгомнян
- Sup
- ADV: Сембода
- Neg
- ADV: аш
- AUX: аф, ашезь, апак, ашень, ашеть, изь, афоль, аш, ашесть, тяк
- AUX-Conv,Part: апак
- AUX-Fin: ашезь, ашень, ашеть, изь, ашесть, тяк, Тят, ашезе, ашельхть, исть
- INTJ: аф
- Long
- PRON: Мондейне, Сондеенза, Сондейнза, тондейть
- Short
- PRON: тейнза, тейть, Тейне, теень, тейст, теенза, теест, тейнть, эсезост
Verbal Features
- Hab
- VERB-Fin: каннель, лезнель
- Perf
- VERB-Part: анеляф, максф, содафоль, таргозьфтольхть, тиф, шапфт, эйндаф
- Cnd
- AUX: ба
- Des
- VERB-Fin: Молелексолеть
- Imp
- AUX-Fin: тяк, Тят, улендяряза
- VERB-Fin: архт, ярхцада, Лувонтт, Эрясть-ащесть, катк, кевонзасть, кизефнек, моледа, сувак, тиеда-арада
- Ind
- AUX-Fin: ульсь, ашезь, ашень, ашеть, изь, ульсть, эрявсь, ашесть, ули, эряви
- VERB: марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь, арась
- VERB-Fin: марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь, арась
- Nec
- VERB-Fin: улема
- NegCndSub
- AUX: улефтяряль
- Opt
- AUX: катк, савоза
- AUX-Fin: савоза
- VERB-Fin: кирдест, ванозазе, шачфтозан
- Prec
- AUX: тята
- VERB-Fin: Варжалите, Панчк-ка, варжака
- Sub
- AUX: афоль, Улендяряль, афолензе, афолеть, улелеть
- AUX-Fin: Улендяряль, улелеть
- VERB: Видендярялеть, Лездолень, Путондяряльхть, Рамаль, Сандяряль, Таргафтолемайть, арьселень, келептелине, корхнельхть, курендакшнельхть
- VERB-Fin: Видендярялеть, Лездолень, Путондяряльхть, Рамаль, Сандяряль, Таргафтолемайть, арьселень, келептелине, корхнельхть, курендакшнельхть
- Past
- ADJ: маниель, акшель, лямболь, пароль, сятяволь, цебярель, эреколь, якстерель
- ADV: пяшксетольхть
- AUX: ульсь, ашезь, ашень, ашеть, изь, ульсть, эрявсь, ашесть, Улень, ашезе
- AUX-Fin: ульсь, ашезь, ашень, ашеть, изь, ульсть, эрявсь, ашесть, Улень, ашезе
- NOUN: мялецоль, порядкасоль
- VERB: марявсь, лиссь, сась, варжакстсь, кармась, мольсь, рамась, тусь, арась, кармасть
- VERB-Fin: марявсь, лиссь, сась, варжакстсь, кармась, мольсь, рамась, тусь, арась, кармасть
- VERB-Part: Содаф, ацафоль, пидефонц, сивотьф, содафоль, таргозьфтольхть, тертьфоль
- Pres
- ADJ: Валдонян, Тяконян, Шумбрат
- ADV: ичкозят
- AUX: аш, эряви, Эрявихть, сашендови, ули, улян
- AUX-Fin: эряви, Эрявихть, сашендови, ули, улян
- NOUN: Маконян, ават, алят, кунцият, прясан
- PROPN: Алдуван
- VERB: моли, ащи, касан, корхтай, симат, эряви, эрят, Арьсян, Корхтайхть, ванан
- VERB-Fin: моли, касан, корхтай, симат, эрят, Арьсян, ащи, ванан, корхтан, лисенди
- VERB-Part: мяляфтан, ащи, иретьфти, лиенди, моли, мяляфтат, сай, сафат, ётай-потай
- VERB-Vnoun: кельгомнян
Pronouns, Determiners, Quantifiers
- Art
- PRON: тненди
- Dem
- ADJ: тяфтама
- ADV: тяза
- DET: тя, ня, сяка, ся, тяка, тяфтама
- PRON: тя, ся, тянь, Ня, Сянь, Тяда, сятка, тона
- Ind
- ADV: коданга, козонга
- DET: лама, мзяра, сняра, иля, кодама-бъди, кой-кона, ламос, лия
- PRON: мезевок, кивок, киньге, кой-кие, ськамот, Кой-кинди, Конашка, Лиятнень, илянь, кати-мезе
- Int
- ADJ: кодама
- ADV: Мес, коста
- DET: Мъзяра
- PRON: мезе, кие, Мезень, кинди, мезенкса, Мезьда, мезьса
- Prs
- PRON: сон, мон, сонь, синь, минь, тон, тейнза, монь, тейть, тонь
- Rcp
- PRON: фкя-фкянь
- Rel
- PRON: кона, конань, конат
- Tot
- DET: эрь, сембе, кафцьке
- PRON: сембонь, Сембось, кафонест, кафцьке, сембе, сембода, сембонди
- Card
- ADV: кафтонь
- NUM: фкя, кафта, колма, вете, Кафттне, кеветиешка, кемотть, комсь, ниле, нильгемоньшка
- Coll
- NUM: колмоцьке
- Dist
- ADJ: кодама-кодама
- Mult
- ADV: весть
- Ord
- ADJ: васенце, омбоце, омбоцеть, 14-це, Нильгемонце, ветеце, кемонце, колмоце, колмоцесь, сизьгемонце
- Sets
- DET: кафцьке
- NOUN: шинек-венек
- NUM: кафонц
- PRON: кафонест, кафцьке
- Yes
- PRON: монць, сонць, сонцьке, тонцьке, эсезост, эсь
- 1
- PRON: мон, минь, монь, Тейне, монць, теень, Мондейне, мондедон, моньге
- 2
- PRON: тон, тейть, тонь, тейнть, тинь, тонга, тондейть, тонцьке
- 3
- PRON: сон, сонь, синь, тейнза, сонць, тейст, Сондеенза, Сондейнза, кафонест, синьге
- Plur
- ADJ: оцюняснон
- ADP: корязост, Инголенк, Инголест, каршесонк, корязонк, корязонт, лангаст, мархтонк, эздонк, эздост
- NOUN: сельмосна, Ёткстонт, Казарманьконь, Мотоциклантень, бабасновок, ваймоньконь, валсна, вастоваст, веленьконь, велесонк
- VERB-Conv: Тумстост
- VERB-Vnoun: морамаснон, покодемаснон, саманьконь, самозост, тушендомаснон
- Sing
- ADJ: Нильгемонце, моронц
- ADP: мархтонза, Мельгат, корязон, перьфканза, пильгалот, эздон, эзонза, эсонза
- NOUN: цёранц, шамац, мирденц, мялец, мяльце, Алязе, брадозень, вазенц, лангозонза, мялецоль
- PRON: ськамот
- PROPN: Иоанцти, Мишазе
- VERB-Inf: вятемонза, учендомот, шнамонза
- VERB-Part: пидефонц
- VERB-Vnoun: куломозон, саманцты, сувамац, тиемацка, тумозонза
Other Features
- Abbr
- Yes
- NOUN: И., Н.
- Yes
- AdpType
- Post
- ADP: мархта, колга, вельде, карша, пачк, сюнеда, Мельгат, инкса, лангаст, мархтонк
- Post
- AdvType
- Deg
- ADV: пяк, сяда, сяшкава, конашкава, тяшкава, ёфcи, ёфси
- Loc
- ADV: тов, алу, меки, тяза
- Man
- ADV: лац, тяфта, вишкста, цебярьста, Кода, мазыста, савор, весяласта, кальдявста, павазуста
- Mod
- ADV: бта, пади, Стаки
- Sta
- ADV: кяпе
- Tim
- ADV: нинге, ни, эста, меле, тага, кунара, тяни, Кали, илять, рана
- NOUN: тячи, исяк
- SCONJ: мъзярда
- Deg
- Clitic
- Add
- ADP: эсовок
- NOUN: алтарьсонга, ульмоняцевок
- PRON: мезевок
- AddGA
- ADV: вестенге
- NOUN: Алязтиге, ведняське, лётчикокска, мялезостка, школавга
- PRON: моньге, синьге, сонцьке, сятка, тонга, тонцьке
- VERB-Vnoun: тиемацка
- AddKige
- ADJ: Ёмластокиге
- ADV: ранакиге
- AddNgA
- ADJ: пародонга
- ADV: сядонга
- AddVok
- NOUN: бабасновок, самолётовок
- VERB-Fin: поладывок
- I
- ADV: Сясы
- AUX: Афи
- SCONJ: Сясы
- Add
- Connegative
- Yes
- VERB: кирде, матодов, Маряк, абонда, ана, атказа, ваймак, виде, кадонда, карма
- Yes
- Derivation
- Cond
- AUX-Fin: Улендяряль, савондяряй, улендяряза
- VERB: Касондярян, матодовондяряй, Видендярялеть, Путондяряльхть, Сандяряль, кадондярясак, кизефтендярясамазь, кирдендярясы, лездондярятада, лисендяряль
- VERB-Fin: Касондярян, матодовондяряй, Видендярялеть, Путондяряльхть, Сандяряль, кадондярясак, кизефтендярясамазь, кирдендярясы, лездондярятада, лисендяряль
- F
- VERB-Part: анеляф, ацафоль, максф, маскировандафт, путфт, ранендаф, содафоль, таргозьфтольхть, тиф, шавф
- GenAttr
- ADJ: озадонь, маластонь
- OvOms
- VERB: азовомшка, вачкодеви, марявсь, шавовсь, шятяват
- VERB-Fin: вачкодеви, марявсь, шавовсь, шятяват
- Ozj
- VERB-Conv: ётазь, Нолдазь, дивандазь, кенордазь, палозь, путозь, учсезь
- Poss
- NOUN: вальмялангоннесь, зрняннеть, июленнекс, кизоннекс, сияннеть
- Voc
- NOUN: бабай, Тядяй, атяй, кельгомняй
- Wife
- PROPN: Цямкаерясь
- Cond
- ExtPos
- ADV
- ADV: аньцек, туркс
- SCONJ: што
- CCONJ
- AUX: аф
- CCONJ: а, но
- DET
- AUX: Аф
- PRON
- PRON: кинди
- SCONJ
- ADV: сяс
- ADV
- NameType
- Geo
- PROPN: Игуазсь, Парижса, Парижсь, Франциять
- Giv
- PROPN: Петя, Марья, Алда-баба, Анна, Архипонь, Ванянди, Варвара, Василь, Васясь, Володя
- Pat
- PROPN: Петровна, Васильевич, Васильевна, Михайлович, Светлана, Степанович
- Sur
- NOUN: Канайкинонь, Ленинонь, Мазы, Малининонь, Тумкин
- PROPN: Браун, Вельдинонь, Вельматов, Веряскинонди, Голенков, Девинонь, Девятаев, Злобинонь, Ивановать, Каргалов
- Geo
- Nomzr
- Ag
- VERB: Лядыхне, аноклайхть, кельгихть, мярьгихть, сялондыхнень, эряскодыхть
- Ag
- NounType
- Relat
- ADP: лангс, ланга
- NOUN: лангс, лангса, каршес, ланга, кучкас, лангозонза, шири, ёткста, Ёткстонт, Лангсонза
- Relat
- NumForm
- Digit
- ADJ: 14-це
- NUM: 225, 7
- Digit
- Number[obj]
- Plur
- VERB: Кельгсайне, Лихтезь, Эрясть-ащесть, азозь, азондозень, азондыне, азыне, аноклазень, вадердасыне, ванфнезь
- VERB-Fin: Кельгсайне, Лихтезь, Эрясть-ащесть, азозь, азондозень, азондыне, азыне, аноклазень, вадердасыне, ванфнезь
- Plur,Sing
- VERB-Fin: Кончайне
- Sing
- AUX: тяк, афолензе, ашезе
- AUX-Fin: тяк, ашезе
- VERB: валхтозе, кадозе, кизефтезе, няезе, содасак, сявозе, сёрмадозе, Ладяйне, Няить, Таргафтолемайть
- VERB-Fin: валхтозе, кадозе, кизефтезе, няезе, содасак, сявозе, сёрмадозе, Ладяйне, Няить, Таргафтолемайть
- Plur
- Number[subj]
- Plur
- ADV: пяшксетольхть
- AUX-Fin: ульсть, ашесть, Эрявихть, ашельхть, исть, эрявсть
- VERB: кармасть, морасть, Корхтайхть, кирдест, лиссть, работасть, тисть, уендихть, эрявихть, эряйхть
- VERB-Fin: кармасть, морасть, кирдест, лиссть, работасть, тисть, уендихть, эрявихть, эряйхть, ярхцада
- VERB-Part: таргозьфтольхть
- Sing
- ADJ: маниель, Валдонян, Муворуван, Тяконян, Шумбрат, акшель, лямболь, пароль, сятяволь, цебярель
- ADV: ичкозят
- AUX: ульсь, ашезь, ашень, ашеть, изь, эрявсь, афоль, аш, тяк, тят
- AUX-Fin: ульсь, ашезь, ашень, ашеть, изь, эрявсь, тяк, ули, эряви, Тят
- NOUN: мялецоль, Маконян, ават, алят, кунцият, порядкасоль, прясан
- PROPN: Алдуван
- VERB: архт, марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь
- VERB-Fin: архт, марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь
- VERB-Part: мяляфтан, ацафоль, мяляфтат, сафат, содафоль, тертьфоль
- VERB-Vnoun: кельгомнян
- Plur
- PartForm
- NegConvPrc
- AUX-Conv,Part: апак
- Past
- VERB-Part: мяляфтан, Кундафнень, мяляфтат, праф, сафат, сюдофокс, эцеф, юкстафокс
- NegConvPrc
- PartType
- Int
- PART: ли
- Int
- Person[obj]
- 1
- VERB-Fin: Таргафтолемайть, валхтсамазь, васьфтьсамазь, дивандафтомань, кизефтендярясамазь, лийфнесамазь-тисамазь, няйсамак, няйсамасть, пиксомань, шачфтомань
- 2
- AUX: афолензе
- VERB-Fin: стардондярятанза
- 3
- AUX-Fin: тяк, ашезе
- VERB: валхтозе, кадозе, кизефтезе, няезе, содасак, сявозе, сёрмадозе, Кельгсайне, Кончайне, Ладяйне
- VERB-Fin: валхтозе, кадозе, кизефтезе, няезе, содасак, сявозе, сёрмадозе, Кельгсайне, Кончайне, Ладяйне
- 1
- Person[psor]
- 1
- ADP: Инголенк, каршесонк, корязон, корязонк, мархтонк, эздон, эздонк
- NOUN: Алязе, брадозень, онцтон, сельмонень, Алязтиге, Казарманьконь, алязень, арьсеманень, атязе, баняня
- PROPN: Мишазе
- VERB-Vnoun: куломозон, саманьконь
- 2
- ADJ: Нильгемонце
- ADP: Мельгат, корязонт, пильгалот
- NOUN: мяльце, Ёткстонт, Кяльцень, Мотоциклантень, Пиледот, Ялгацень, алядот, ваксстот, кигат, кице
- PRON: ськамот
- PROPN: Иоанцти
- VERB-Inf: учендомот
- 3
- ADJ: моронц, оцюняснон
- ADP: мархтонза, корязост, Инголест, лангаст, перьфканза, эздост, эзонза, эсонза, эсост
- NOUN: цёранц, шамац, мирденц, мялец, вазенц, лангозонза, мялецоль, пацяняц, пингстонза, сельмосна
- VERB-Conv: Тумстост
- VERB-Inf: вятемонза, шнамонза
- VERB-Part: пидефонц
- VERB-Vnoun: морамаснон, покодемаснон, саманцты, самозост, сувамац, тиемацка, тумозонза, тушендомаснон
- 1
- Person[subj]
- 1
- ADJ: Валдонян, Муворуван, Тяконян
- AUX: ашень, Улень, тят, улян
- AUX-Fin: ашень, Улень, улян
- NOUN: Маконян, прясан
- PROPN: Алдуван
- VERB: касан, Арьсян, Касондярян, ванан, корхтан, мяляфтан, сявонь, тиень, тиян, тунь
- VERB-Fin: касан, Арьсян, Касондярян, ванан, корхтан, сявонь, тиень, тиян, тунь, туян
- VERB-Part: мяляфтан
- VERB-Vnoun: кельгомнян
- 2
- ADJ: Шумбрат
- ADV: ичкозят
- AUX: ашеть, тяк, Тят, афолеть, тята, улелеть
- AUX-Fin: ашеть, тяк, Тят, улелеть
- NOUN: ават, алят, кунцият
- VERB-Fin: архт, симат, эрят, мярьгат, сать, содасак, тарат, якат, ярхцада, ёрат
- VERB-Part: мяляфтат, сафат
- 3
- ADJ: маниель, акшель, лямболь, пароль, сятяволь, цебярель, эреколь, якстерель
- ADV: пяшксетольхть
- AUX: ульсь, ашезь, изь, ульсть, эрявсь, афоль, аш, ашесть, ули, эряви
- AUX-Fin: ульсь, ашезь, изь, ульсть, эрявсь, ашесть, ули, эряви, Улендяряль, Эрявихть
- NOUN: мялецоль, порядкасоль
- VERB: марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь, улема
- VERB-Fin: марявсь, лиссь, моли, сась, варжакстсь, кармась, мольсь, рамась, тусь, улема
- VERB-Part: ацафоль, содафоль, таргозьфтольхть, тертьфоль
- 1
- PunctSide
- Fin
- PUNCT: »
- Ini
- PUNCT: «
- Fin
- Style
- Ped
- ADV: кържа, Мзярда
- DET: Мъзяра, кодама-бъди
- PART: въдь
- PRON: мезень-бъди
- SCONJ: къда, мъзярда
- Ped
- Typo
- Yes
- NOUN: карденя, велькска, карденяв
- Yes
- VerbType
- Aux
- ADV: аш
- AUX: аф, ашезь, ба, ашеть, изь, аш, ашесть, тяк, Афоль, Тят
- AUX-Fin: ашезь, ашеть, изь, ашесть, тяк, Тят, ашельхть, ашень, исть
- Aux
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: улемс, аш.
- This corpus uses 7 lemmas as auxiliaries (aux). Examples: аф, аш, эрявомс, ба, савомс, улемс, сашендовомс.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Nom (7)
- VERB--PRON (1)
- VERB--PRON-Nom (10)
- VERB-Fin--NOUN (3)
- VERB-Fin--NOUN-Nom (198)
- VERB-Fin--NOUN-Nom-ADP(мархта) (1)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Nom (70)
- VERB-Inf--NOUN-Nom (1)
- VERB-Part--NOUN-Nom (4)
- VERB-Part--PRON-Nom (1)
- obj
- VERB--NOUN (1)
- VERB--NOUN-Gen (7)
- VERB--NOUN-Nom (5)
- VERB--PRON-Gen (1)
- VERB--PRON-Nom (4)
- VERB-Conv--NOUN-Gen (3)
- VERB-Fin--NOUN-Abl (1)
- VERB-Fin--NOUN-Ela (1)
- VERB-Fin--NOUN-Gen (68)
- VERB-Fin--NOUN-Gen-ADP(эшка) (1)
- VERB-Fin--NOUN-Ine (1)
- VERB-Fin--NOUN-Nom (57)
- VERB-Fin--PRON-Gen (7)
- VERB-Fin--PRON-Nom (3)
- VERB-Inf--NOUN-Gen (13)
- VERB-Inf--NOUN-Nom (8)
- VERB-Inf--PRON-Gen (3)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--PRON-Nom (1)
Relations Overview
- This corpus uses 16 relation subtypes: acl:relcl, advmod:cmp, aux:neg, aux:opt, cc:preconj, compound:nn, csubj:cop, flat:name, nmod:bahuv, nmod:gobj, nmod:poss, nsubj:cop, nsubj:pass, obl:agent, obl:cmp, obl:tmod
- The following 4 relation types are not used in this corpus at all: iobj, clf, goeswith, reparandum