UD Moksha JR
Language: Moksha (code: mdf
)
Family: Uralic, Mordvin
This treebank has been part of Universal Dependencies since the UD v2.5 release.
The following people have contributed to making this treebank part of UD: Jack Rueter, Maria Levina, Nadezhda Kabaeva, Judit Molnár, Khalid Alnajjar.
Repository: UD_Moksha-JR
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.13
License: CC BY-SA 4.0
Genre: nonfiction, news
Questions, comments? General annotation questions (either Moksha-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [rueter • jack (æt) gmail • com]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
Erme Universal Dependencies annotated texts Moksha are the origin of UD_Moksha-JR with annotation (CoNLL-U) for texts in the Moksha language, it originally consists of a sample from a number of fiction authors writing originals in Moksha.
This is a collection of sentences from almost entirely original Moksha-language literary sources dating back to the 1880s with Universal Dependencies (UD) annotations. It has been constructed in alignment with parallel work on Erzya language Universal Dependencies.
There are also about 20 parallel sentences translated by Marina Levina from the Erzya and Russian texts: http://ilazki.thinkgeek.co.uk/brat/#/uralic/myv and http://ilazki.thinkgeek.co.uk/brat/#/uralic/rus
The sent_id attribute value is not randomized in works published earlier than 1938. Developing UD documentation can be found at https://github.com/UniversalDependencies/docs for Erzya.
https://github.com/rueter/erme-ud-moksha
Acknowledgments
The original annotation has been performed by Jack Rueter at the University of Helsinki with the help of Marina Levina at the Mordovian State University im. P.N. Ogariova, Mordvin Languages Department using morphological tools that were originally built with funding from a Kone Foundation «Language Programme» funded project: «Creation of Morphological Parsers for Minority Finno-Ugrian Languages» (2013–2014) with the linguistic work of Merja Salo, and facilitated at the Norwegian Arctic University in Tromsø. Work with the Moksha treebank builds upon previous experience with the UD_Erzya-JR treebank and continued consultations and discussions with Francis Tyers, Tommi Pirinen, Jonathan Washington. Without the Moksha writers themselves, however, we would be no where…
Annotation work is simultaneous to finite-state transducer development by Nadjezhda Kabaeva, Marina Levina and Jack Rueter in the GiellaLT infrastucture, which also works with Constraint Grammar disambiguation of the morphological analysis.
References
If you use this data set in an academic publication, I would be ever so grateful if you cited it as follows:
Jack Rueter. (2018, January 20). Erme UD Moksha (Version v1.0) http://doi.org/10.5281/zenodo.1156112
About the authors
- Кузнецов, Юрий 1975: Сембось ушеткшни киста. Саранск.
- Mishanina, V. I. (Мишанина, В. И.) 1972: Лиендень очконяса. Мокша №3, 38–39. Саранск. (MishaninaValentina_LiendenyOchkonyasa_Moksha-1972-No2-pp38-39) (Мордовиянь Кадошкина аймаконь Адаж веле)
-
- Мокшень кяль. Синтаксис* : учебник / аноклаф-тиф Н. С. Алямкинонь и О. Е. Поляковонь профессорхнень вятемаснон ала. – Саранск : Изд-во Мордов. ун-та, 2008. – 200 с. – На морд.-мокша яз.
- Pyanzin, Fyodor (Пьянзин, Фёдор) 1991: Седить тердеманц коряс: Повесть. – Саранск: Мордов. кн. изд-во, 1991. – 120 с. Мордов.-мокша яз.
In release 2.7 additional example sentences used in the Moksha-language grammar Мокшень кяль, синтаксис: учебник (2008) were included. These sentences are marked with sent_id-s that contain the components MKS:2008:page:n-th sentence:original author
. It is hoped that the inclusion of these sentences will help cover various grammatical phenomena in Moksha syntax. When refering to these sentences, we advise you also cite the original source:
- Алямкин, Н. С. (гл. ред.); Гришунина, В. П.; Иванова, Г. С.; Кабаева, Н. Ф.; Кулакова, Н. А.; Левина, М. З.; Поляков, О. Е. (гл. ред.); Рогожина, В. Ф.; Седова, П. Е. 2008: * Мокшень кяль. Синтаксис : учебник [Moksha language. Syntax: reader]. – Саранск : Изд-во Мордов. ун-та.
- Alâmkin, N. S. (chief ed.); Grushinina, V. P.; Ivanova, G. S.; Kabaeva, N. F.; Kulakova, N. A.; Levina, M. Z.; Polâkov, O. E. (chief ed.); Rogozhina, V. F.; Sedova, P. E. 2008: * Mokshen’ kâl’. Sintaksis: uchebnik [Moksha language. Syntax: reader]. – Saransk : Izd-vo Mordov. un-ta.
- Kehayov, Petar 2020: Between facts and speech acts: The conditional and condictional-conjunctive in Moksha Mordvin. Linguistica Uralica LVI 2020 1 [https://dx.doi.org/10.3176/lu.2020.1.03]
Statistics of UD Moksha JR
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Abbr – AdpType – AdvType – Animacy – Aspect – Case – Clitic – Connegative – Definite – Degree – Derivation – Gender – Mood – NameType – NounType – Number – Number[obj] – Number[psor] – Number[subj] – NumForm – NumType – PartForm – Person – Person[obj] – Person[psor] – Person[subj] – Polarity – PronType – PunctSide – Reflex – Style – Tense – Typo – Variant – VerbForm – VerbType
Relations
acl – acl:relcl – advcl – advcl:cau – advcl:eval – advcl:tcl – advmod – advmod:cau – advmod:cmp – advmod:deg – advmod:eval – advmod:foc – advmod:freq – advmod:lmod – advmod:mmod – advmod:tmod – amod – appos – aux – aux:cnd – aux:nec – aux:neg – aux:opt – aux:q – case – cc – cc:preconj – ccomp – compound – conj – cop – csubj – csubj:cop – dep – det – discourse – dislocated – expl – fixed – flat – flat:name – list – mark – nmod – nmod:appos – nmod:bahuv – nmod:gobj – nmod:lmod – nmod:poss – nmod:tmod – nsubj – nsubj:cop – nsubj:pass – nummod – obj – obl – obl:agent – obl:cau – obl:cmp – obl:freq – obl:inst – obl:lmod – obl:tmod – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 454 sentences, 4125 tokens and 4131 syntactic words.
- This corpus contains 774 tokens (19%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 40 types of words that contain both letters and punctuation. Examples: кати-коста, кодама-кодама, кой-кие, кой-кона, эрямань-ащемань, Алда-баба, Васток-васток, И., Кой-кинди, Коса-бди, Н., Панчк-ка, Пилсесь-лаксесь, Эрясть-ащесть, атят-бабат, видьмода-эрьгада, кати-мезе, кодама-бъди, кой-коста, кядьта-пильгта, лиендихть-тиихть, лийфнесамазь-тисамазь, мезе-бди, мезень-бъди, обедамста-ужнамста, однек-сиренек, ризфсь-пичефкссь, саднек-мезнек, стирьхне-цёратне, тиеда-арада, трнаты-вачкаты, тядяфтома-аляфтома, тяшнесь-нарнесь, фкя-фкянь, шинек-венек, шталезе-урядалезе, щафтама-каряфтама, эряй-ащи, ювандема-явондема, ётай-потай
- This corpus contains 3 multi-word tokens. On average, one multi-word token consists of 3.00 syntactic words.
- There are 3 types of multi-word tokens. Examples: ласькозь-ласькихть, эрят-ащат, юмай-арай.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 10 word types tagged as particles (PART): вдь, въдь, дяряй, и, нльне, нльня, сяда, хоть, хуш, шять
- This corpus contains 28 lemmas tagged as pronouns (PRON): иля, кати-мезе, кафонест, кафцьке, ки, кивок, кие, кой-кие, кой-кона, кона, лия, мезе, мезе-бди, мезевок, мон, монць, ня, сембе, сон, сонць, ськамот, ся, сяка, тон, тона, тонць, тя, фкя-фкя
- This corpus contains 17 lemmas tagged as determiners (DET): иля, кафцьке, кодама-бди, кой-кона, лама, лия, мзяра, ня, сембе, сняра, ся, сяка, тя, тяка, тяфтама, эрь, эсь
- Out of the above, 9 lemmas occurred sometimes as PRON and sometimes as DET: иля, кафцьке, кой-кона, лия, ня, сембе, ся, сяка, тя
- This corpus contains 9 lemmas tagged as auxiliaries (AUX): аф, аш, ба, катк, ли, савомс, сашендовомс, улемс, эрявомс
- Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: савомс, эрявомс
- There are 8 (de)verbal forms:
- Conv
- VERB: вятезь, ласькозь, эцезь, ётазь, Нолдазь, Тумстост, дивандазь, завтракамста, кенордазь, мадомста
- Conv,Part
- AUX: апак
- Fin
- AUX: ашень, ульсть, ульсь, Улень, ашезе, савсь, сашендовсь, ули, эряви
- VERB: кармась, арась, кармасть, марявсь, морасть, сась, сувась, тусь, утцесь, ушедсь
- Inf
- VERB: стямс, тиемс, тонафтомс, ётамс, куцема, работама, Валдашкодомс, аделамс, анцемс, арамс
- NomAg
- VERB: ётафтысь
- Part
- VERB: мяляфтан, Кундафнень, анеляф, ацафоль, ащи, иретьфти, лиенди, максф, маскировандафт, моли
- Sup
- VERB: путькияма
- Vnoun
- VERB: Авардемать, Нумань, апрякама, ардомась, варьхмодема, видемда, кельгомнян, кенярдема, куломозон, ляцендемат
Nominal Features
- Fem
- PROPN: Петровна, Варвара, Васильевна, Ивановать, Людмила, Николаевнань, Светлана
- Masc
- PROPN: Вельдинонь, Голенков, Девинонь, Девятаев, Злобинонь, Келаськин, Кокоревонь, Кукушкинць, Михаил, Петр
- Hum
- NOUN: тядяц
- PRON: Кинди
- PROPN: Петровна, Варвара, Васильевичекс, Васильевна, Вельдинонь, Голенков, Девинонь, Девятаев, Елена, Злобинонь
- Plur
- ADJ: мазыхть, весялат, лямбот, малат, пяндрат, ёнюфт
- DET: ня
- NOUN: ломаттне, стирнятне, валхнень, ломатть, гулянятнень, досканят, жаворонкатне, кизотнень, коволнятнень, морот
- NUM: Кафттне, кемотть
- PRON: синь, минь, тейст, Лиятнень, конат, синьге, сятка, теест, тейнть, тинь
- VERB: Кундафнень, Лядыхне, кельгихть, ляцендемат, маскировандафт, мярьгихть, путфт, шапфт, шнакшнематне
- VERB-Part: Кундафнень, маскировандафт, путфт, шапфт
- VERB-Vnoun: ляцендемат, шнакшнематне
- Plur,Sing
- ADJ: Ёмластокиге, Мокшень, Немойкс, аноконди, маластонь, оцюняснон, пародонга, роднойкс
- ADV: ламос
- DET: ламос
- NOUN: лангс, паксянь, каршес, вирьса, кудса, лангса, сёксень, ульцяв, ярмакса, Марянь
- NUM: Кемоньшка, кеветиешка, нильгемоньшка
- PRON: сембонь, Мезень, конань, Кой-кинди, Конашка, Мезьда, илянь, кинди, киньге, мезень-бъди
- PROPN: Архипонь, Валентинонди, Ванянди, Васильевичекс, Вельдинонь, Веряскинонди, Витянь, Девинонь, Злобинонь, Кокоревонь
- VERB: мяляфтан, Нумань, видемда, куломозон, морамаснон, мяляфтат, покодемаснон, работаманкса, саманьконь, самозост
- VERB-Part: мяляфтан, мяляфтат, сюдофокс, юкстафокс
- VERB-Vnoun: Нумань, видемда, куломозон, морамаснон, покодемаснон, работаманкса, саманьконь, самозост, сяськоманкса, тумозонза
- Sing
- ADJ: оцю, од, тяфтама, мазы, акша, кодама, козя, пара, пси, равжа
- DET: эрь, лама, сембе, Тя, ся, иля, кодама-бъди, кой-кона, лия, тяка
- NOUN: шись, ава, Тишка, ланга, ломань, пингть, пря, цёранц, шамац, шиня
- NUM: кафта, фкя, колма, 225, 7, вете, колмоцьке, комсь, ниле
- PRON: сон, мон, тя, сонь, ся, тон, мезевок, монь, тейнза, тейть
- PROPN: Петя, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Браун, Варвара, Василь
- VERB: Авардемать, азовомшка, анеляф, аноклайхть, аноклама, апрякама, ардомась, варьхмодема, кельгомнян, кенерь
- VERB-Fin: туват
- VERB-NomAg: ётафтысь
- VERB-Part: анеляф, максф, праф, сафат, содафоль, тертьфоль, тиф, эйндаф, эцеф
- VERB-Sup: путькияма
- VERB-Vnoun: Авардемать, апрякама, ардомась, варьхмодема, кельгомнян, кенярдема, муськома, работамась, саманцты, сувамац
- Abe
- NOUN: лемфтома, перилафтома, эрьгяфтома
- Abl
- ADJ: пародонга
- ADP: эзда, фталда, ширде, эздон, эздонк, эздост
- ADV: вярде, ичкозде
- NOUN: ломаньда, ширде, Аннада, алда, алядот, вайгяльда, врьгазда, занятияда, иможда, класста
- PRON: Мезьда, Тяда, мондедон, сембода
- VERB-Inf: валдашкодомда, ванфтомода, видемда, корхтамда, крфамда, лездомда, тиемда, шашнемда
- VERB-Part: мяляфтан, мяляфтат
- VERB-Vnoun: видемда, ужнамда
- Cau
- ADP: инкса
- ADV: тянкса
- NOUN: лезксонкса
- VERB-Vnoun: работаманкса, сяськоманкса
- Cmp
- ADP: эшка
- NOUN: пялешка, сурбряшка
- NUM: Кемоньшка, кеветиешка, нильгемоньшка
- PRON: Конашка
- Com
- NOUN: куднек, саднек-мезнек, ульцянек, шинек-венек
- Dat
- ADJ: аноконди
- NOUN: Алязтиге, Дарюняти, Кенкшти, Кепотьксонди, Кинди, Луканди, Маринкати, Цёранянди, Ялгати, авардематненди
- PRON: тейнза, тейть, Тейне, кинди, теень, тейст, Кой-кинди, Мондейне, Сондеенза, Сондейнза
- PROPN: Валентинонди, Ванянди, Веряскинонди
- VERB-Vnoun: саманцты, цяпамати
- Ela
- ADJ: Ёмластокиге, маластонь
- ADP: пингста, ваксста
- ADV: тоста, Тяста, кати-коста, кой-коста, курокста, эста, коста, тяза
- NOUN: велеста, комнатаста, кудста, онцтон, пингста, пингстонза, ёткста, Вирьста, Москуста, базарста
- VERB: лисемста, самста, Тумстост, завтракамста, мадомста, обедамста-ужнамста
- VERB-Conv: Тумстост, завтракамста, мадомста, обедамста-ужнамста
- Gen
- ADJ: Очижинь, омбоцеть, тячиень, Мокшень, Передовойть, главнайть, моронц, оцюняснон
- ADV: кафтонь
- NOUN: паксянь, пингть, цёранц, шить, валхнень, велеть, менельть, очконять, сёксень, Лугать
- PRON: сонь, монь, сембонь, тонь, синь, тянь, минь, Мезень, конань, Лиятнень
- PROPN: Архипонь, Вельдинонь, Витянь, Девинонь, Злобинонь, Ивановать, Кокоревонь, Мокшеть, Николаевнань, Петянь
- VERB: Авардемать, Кундафнень, Нумань, аноклайхть, морамаснон, покодемаснон, саманьконь, тушендомаснон, эводемать, эрямань-ащемань
- VERB-Part: Кундафнень
- VERB-Vnoun: Авардемать, Нумань, морамаснон, покодемаснон, саманьконь, тушендомаснон, эводемать, эрямань-ащемань
- Ill
- ADP: лангс, ваксс, коряс, малас, Корязост, корязон, корязонк, корязонт, эзонза
- ADV: Коза, ламос, Мес, козовок, тяза
- DET: ламос
- NOUN: лангс, каршес, вастс, кучкас, лангозонза, вастозонза, вельхксс, воляс, кудрядс, лафтубрязонза
- PRON: эсезост
- VERB-Vnoun: куломозон, самозост, тумозонза
- Ine
- ADP: эса, ваксса, лангса, каршесонк, эсонза, эсост
- ADV: тоса, тяса, коса, маласа, Коса-бди, косовок, пяшксетольхть
- NOUN: вирьса, кудса, лангса, ярмакса, больницяса, вайгяльса, войнаса, кизоса, мяльса, тюсса
- PRON: мезьса
- PROPN: Парижса
- Lat
- ADP: алу, шири
- ADV: вяри, алу, ичкози, оду, фталу, меки
- NOUN: инголи, ульцяв, куду, шири, школав, Колхозу, Крыму, Мазы, Маманяв, Ошу
- Loc
- ADP: ала, Инголенк, Инголест, пильгалот
- ADV: ичкозе, инголе, перьфпяле, ичкозят
- AUX: аш
- VERB-Inf: куцема, работама, шурокстомома, азонкшнема, ванондома, ватксема, вятемонза, лувома, морама, мярьгома
- VERB-Vnoun: апрякама
- Nom
- ADJ: оцю, од, тяфтама, мазы, акша, кодама, козя, пара, пси, равжа
- DET: эрь, лама, сембе, Тя, ся, иля, кодама-бъди, кой-кона, лия, тяка
- NOUN: ломаттне, шись, ава, Тишка, ланга, ломань, пря, стирнятне, шамац, визькс
- NUM: кафта, фкя, колма, 225, 7, Кафттне, вете, кемотть, колмоцьке, комсь
- PRON: сон, мон, тя, ся, тон, синь, мезевок, минь, кона, кивок
- PROPN: Петя, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Браун, Варвара, Василь
- VERB: Лядыхне, азовомшка, анеляф, аноклама, ардомась, варьхмодема, кельгихть, кельгомнян, кенерь, кенярдема
- VERB-Fin: туват
- VERB-NomAg: ётафтысь
- VERB-Part: анеляф, максф, маскировандафт, праф, путфт, сафат, содафоль, тертьфоль, тиф, шапфт
- VERB-Sup: путькияма
- VERB-Vnoun: ардомась, варьхмодема, кельгомнян, кенярдема, ляцендемат, муськома, работамась, сувамац, тиемацка, шнакшнематне
- Prl
- ADP: мельгя, эзга, Мельгат, лангаст, мельге
- ADV: перьфпяльге, Шобдава
- NOUN: вальмава, морява, пандонява, алга, вастоваст, ведьгя, велькска, вельхкска, вирьгя, вярьгя
- Tem
- NOUN: шиня, Пиземня
- Tra
- ADJ: Немойкс, роднойкс
- ADP: ланга
- NOUN: сторожкс, геройкс, депутатокс, июленнекс, кизоннекс, комендантокс, крайкс, лётчикокс, лётчикокска, мокшекс
- PROPN: Васильевичекс
- VERB: сюдофокс, юкставикс, юкстафокс
- VERB-Part: сюдофокс, юкстафокс
- Def
- ADJ: омбоцеть, Передовойть, главнайть, колмоцесь, коськсь
- NOUN: ломаттне, шись, пингть, стирнятне, шить, валхнень, велеть, менельть, очконять, Вармась
- NUM: Кафттне
- PRON: Лиятнень, Сембось
- PROPN: Васясь, Ивановать, Игуазсь, Кукушкинць, Маринкась, Марясь, Млай, Мокшеть, Парижсь, Тугановть
- VERB: Авардемать, Кундафнень, Лядыхне, аноклайхть, ардомась, работамась, сетьмось, цяпамати, шнакшнематне, эводемать
- VERB-NomAg: ётафтысь
- VERB-Part: Кундафнень
- VERB-Vnoun: Авардемать, ардомась, работамась, цяпамати, шнакшнематне, эводемать
- Ind
- ADJ: оцю, од, тяфтама, мазы, акша, кодама, козя, пара, пси, равжа
- ADV: кати-коста, ламос, Коса-бди, кафтонь, козовок, косовок
- DET: эрь, лама, сембе, кодама-бъди, кой-кона, ламос, лия, тяка, тяфтама, эсь
- NOUN: лангс, ава, паксянь, шиня, Тишка, каршес, ланга, ломань, пря, визькс
- NUM: кафта, фкя, колма, вете, кеветиешка, кемотть, комсь, ниле, нильгемоньшка
- PRON: тя, ся, сембонь, кона, мезевок, тянь, конань, сяка, Конашка, Сянь
- PROPN: Петя, Игорь, Марья, Петровна, Алда-баба, Алдуван, Анна, Архипонь, Браун, Валентинонди
- VERB: мяляфтан, Нумань, азовомшка, анеляф, аноклама, апрякама, варьхмодема, видемда, кельгихть, кельгомнян
- VERB-Fin: туват
- VERB-Part: мяляфтан, анеляф, максф, маскировандафт, мяляфтат, праф, путфт, сафат, содафоль, сюдофокс
- VERB-Sup: путькияма
- VERB-Vnoun: Нумань, апрякама, варьхмодема, видемда, кельгомнян, кенярдема, ляцендемат, муськома, работаманкса, сяськоманкса
Degree and Polarity
- Cmp
- PART: сяда
- Dim
- ADV: аруняста, саворне
- NOUN: карденя, очконять, досканят, коволнятнень, ловнясь, пацяняц, стирнятне, Бабанять, Луганятне, Макарня
- VERB-Vnoun: кельгомнян
- Sup
- ADV: Сембода
- Neg
- ADV: аш
- AUX: аф, ашезь, ашень, апак, ашеть, изь, афоль, аш, ашесть, тяк
- AUX-Conv,Part: апак
- AUX-Fin: ашень, ашезе
- INTJ: аф
- Long
- PRON: Мондейне, Сондеенза, Сондейнза, тондейть
- Short
- PRON: тейнза, тейть, Тейне, теень, тейст, теенза, теест, тейнть, эсезост
Verbal Features
- Hab
- VERB-Fin: каннель, лезнель
- Perf
- VERB-Part: анеляф, максф, содафоль, таргозьфтольхть, тиф, шапфт, эйндаф
- Des
- VERB: Молелексолеть
- Imp
- AUX: тяк, Тят
- VERB: архт, ярхцада, Эрясть-ащесть, кевонзасть, моледа, тиеда-арада, тик
- Ind
- AUX: ульсь, ашезь, ашень, ашеть, изь, ульсть, эрявсь, ашесть, ба, эряви
- AUX-Fin: ашень, ульсть, ульсь, Улень, ашезе, савсь, сашендовсь, ули, эряви
- VERB: марявсь, лиссь, сась, варжакстсь, кармась, моли, мольсь, рамась, тусь, арась
- VERB-Fin: кармась, арась, кармасть, марявсь, морасть, сась, сувась, тусь, утцесь, ушедсь
- Nec
- VERB: улема
- NegCndSub
- AUX: улефтяряль
- Opt
- AUX: катк, савоза
- VERB: кирдест, ванозазе, шачфтозан
- Prec
- AUX: тята
- VERB: Варжалите, Панчк-ка, варжака
- Sub
- AUX: афоль, ба, Улендяряль, афолензе, афолеть, улелеть
- VERB: Видендярялеть, Лездолень, Путондяряльхть, Рамаль, Сандяряль, Таргафтолемайть, арьселень, келептелине, корхнельхть, курендакшнельхть
- Past
- ADJ: маниель, акшель, лямболь, пароль, сятяволь, цебярель, эреколь, якстерель
- ADV: пяшксетольхть
- AUX: ульсь, ашезь, ашень, ашеть, изь, ульсть, эрявсь, ашесть, Улень, ашезе
- AUX-Fin: ашень, ульсть, ульсь, Улень, ашезе, савсь, сашендовсь
- NOUN: мялецоль, порядкасоль
- VERB: марявсь, лиссь, сась, варжакстсь, кармась, мольсь, рамась, тусь, арась, кармасть
- VERB-Fin: кармась, арась, кармасть, марявсь, морасть, сась, сувась, тусь, утцесь, ушедсь
- VERB-Part: ацафоль, содафоль, таргозьфтольхть, тертьфоль
- Pres
- ADJ: Валдонян, Тяконян, Шумбрат
- ADV: ичкозят
- AUX: аш, эряви, Эрявихть, сашендови, ули, улян
- AUX-Fin: ули, эряви
- NOUN: Маконян, ават, алят, прясан
- PROPN: Алдуван
- VERB: моли, ащи, касан, корхтай, Арьсян, Корхтайхть, ванан, корхтан, лисенди, лиси
- VERB-Fin: корхтан, лиси, моли, мярьгат, пели, содасак, тиян, туян, эрявихть, эряйхть
- VERB-Part: мяляфтан, ащи, иретьфти, лиенди, моли, мяляфтат, сай, сафат, ётай-потай
- VERB-Vnoun: кельгомнян
Pronouns, Determiners, Quantifiers
- Dem
- ADJ: тяфтама
- ADV: тяза
- DET: ня, Тя, ся, тяка, тяфтама
- PRON: тя, ся, тянь, Сянь, Тяда, сятка, тона
- Ind
- ADV: коданга, козонга
- DET: кодама-бъди
- PRON: мезевок, кивок, кой-кие, Кой-кинди, кати-мезе, киньге, кой-кона, мезе-бди, мезень-бъди
- Int
- ADJ: кодама
- ADV: Мес, коста
- DET: Мъзяра
- PRON: кие, кинди, мезе, Мезень, мезьса
- Prs
- PRON: сон, мон, сонь, синь, минь, тон, монь, тейнза, тейть, тонь
- Rcp
- PRON: фкя-фкянь
- Rel
- PRON: кона, конань, конат
- Tot
- DET: кафцьке
- PRON: кафцьке
- Card
- ADV: кафтонь
- NUM: фкя, кафта, колма, вете, Кафттне, кеветиешка, кемотть, комсь, ниле, нильгемоньшка
- Coll
- NUM: колмоцьке
- Dist
- ADJ: кодама-кодама
- Mult
- ADV: весть
- Ord
- ADJ: васенце, омбоце, омбоцеть, Нильгемонце, ветеце, кемонце, колмоце, колмоцесь, сизьгемонце
- Sets
- DET: кафцьке
- NOUN: шинек-венек
- NUM: кафонц
- PRON: кафонест, кафцьке
- Yes
- DET: эсь
- PRON: монць, сонць, сонцьке, тонцьке, эсезост
- 1
- PRON: мон, минь, монь, Тейне, монць, теень, Мондейне, мондедон, моньге
- 2
- PRON: тон, тейть, тонь, тейнть, тинь, тонга, тондейть, тонцьке
- 3
- PRON: сон, сонь, синь, тейнза, сонць, тейст, Сондеенза, Сондейнза, синьге, сонцьке
- Plur
- ADJ: оцюняснон
- ADP: корязост, Инголенк, Инголест, каршесонк, корязонк, корязонт, лангаст, эздонк, эздост, эсост
- NOUN: сельмосна, Казарманьконь, Мотоциклантень, бабасновок, ваймоньконь, валсна, вастоваст, веленьконь, велесонк, дружбаснон
- PRON: кафонест
- VERB-Conv: Тумстост
- VERB-Vnoun: морамаснон, покодемаснон, саманьконь, самозост, тушендомаснон
- Sing
- ADJ: Нильгемонце, моронц
- ADP: мархтонза, Мельгат, корязон, перьфканза, пильгалот, эздон, эзонза, эсонза
- NOUN: цёранц, шамац, мялец, Алязе, брадозень, вазенц, лангозонза, мирденц, мялецоль, онцтон
- PRON: ськамот
- PROPN: Мишазе
- VERB-Inf: вятемонза, учендомот, шнамонза
- VERB-Vnoun: куломозон, саманцты, сувамац, тиемацка, тумозонза
Other Features
- Abbr
- Yes
- NOUN: И., Н.
- Yes
- AdpType
- Post
- ADP: мархта, колга, пачк, сюнеда, Мельгат, инкса, лангаст, мельге, пильгалот, фталда
- Post
- AdvType
- Deg
- ADV: пяк, сяда, сяшкава, конашкава, тяшкава, ёфcи, ёфси
- Loc
- ADV: тов, алу, меки, тяза
- Man
- ADV: цебярьста, мазыста, Кода, Тяфта, весяласта, вишкста, павазуста, хитрайста, цебярняста
- Mod
- ADV: бта, пади, Стаки
- Sta
- ADV: кяпе
- Tim
- ADV: нинге, ни, эста, тага, кунара, меле, рана, Кизонда, илять, тяни
- NOUN: илять
- SCONJ: мъзярда
- Deg
- Clitic
- Add
- NOUN: алтарьсонга, ульмоняцевок
- PRON: мезевок
- AddGA
- ADV: вестенге
- NOUN: Алязтиге, ведняське, лётчикокска, мялезостка, школавга
- PRON: моньге, синьге, сонцьке, сятка, тонга, тонцьке
- VERB-Vnoun: тиемацка
- AddKige
- ADJ: Ёмластокиге
- ADV: ранакиге
- AddNgA
- ADJ: пародонга
- ADV: сядонга
- AddVok
- NOUN: бабасновок, самолётовок
- VERB-Fin: поладывок
- I
- ADV: Сясы
- AUX: Афи
- SCONJ: Сясы
- Add
- Connegative
- Yes
- VERB: кирде, матодов, абонда, ана, атказа, ваймак, виде, кадонда, карма, кенере
- Yes
- Derivation
- Cond
- AUX: ба, Улендяряль, савондяряй
- VERB: Касондярян, матодовондяряй, Видендярялеть, Путондяряльхть, Сандяряль, кадондярясак, кизефтендярясамазь, кирдендярясы, лездондярятада, лисендяряль
- F
- VERB-Part: анеляф, ацафоль, максф, маскировандафт, путфт, ранендаф, содафоль, таргозьфтольхть, тиф, шавф
- GenAttr
- ADJ: озадонь, маластонь
- NomAg
- VERB: Лядыхне, аноклайхть, кельгихть, мярьгихть
- OvOms
- VERB: азовомшка, вачкодеви, марявсь, шавовсь, шятяват
- Ozj
- VERB-Conv: ётазь, Нолдазь, дивандазь, кенордазь, палозь, путозь, учсезь
- Poss
- NOUN: зрняннеть, июленнекс, кизоннекс, сияннеть
- Voc
- NOUN: Тядяй, атяй, кельгомняй
- Wife
- PROPN: Цямкаерясь
- Cond
- NameType
- Geo
- PROPN: Игуазсь, Парижса, Парижсь, Франциять
- Giv
- PROPN: Петя, Марья, Алда-баба, Анна, Архипонь, Ванянди, Варвара, Василь, Васясь, Володя
- Pat
- PROPN: Петровна, Васильевич, Васильевна, Михайлович, Светлана, Степанович
- Sur
- NOUN: Канайкинонь, Ленинонь, Мазы, Малининонь, Тумкин
- PROPN: Браун, Вельдинонь, Вельматов, Веряскинонди, Голенков, Девинонь, Девятаев, Злобинонь, Ивановать, Каргалов
- Geo
- NounType
- Relat
- ADP: лангс, ланга
- NOUN: лангс, каршес, ланга, лангса, кучкас, лангозонза, шири, ёткста, Лангсонза, алга
- Relat
- NumForm
- Digit
- NUM: 225, 7
- Digit
- Number[obj]
- Plur
- VERB: Кельгсайне, Лихтезь, Эрясть-ащесть, азозь, азондозень, азондыне, аноклазень, вадердасыне, ванфнезь, васьфтьсамазь
- VERB-Fin: Кельгсайне, азозь, аноклазень, вадердасыне, ванфнезь, васьфтьсамазь, кепсезь, крьвястезень, лемдеськ, нолязень
- Plur,Sing
- VERB: Кончайне
- Sing
- AUX: тяк, афолензе, ашезе
- AUX-Fin: ашезе
- VERB: валхтозе, кизефтезе, няезе, содасак, сявозе, сёрмадозе, Ладяйне, Няить, Таргафтолемайть, архтозе
- VERB-Fin: валхтозе, кизефтезе, содасак, вархцодезе, дивандафтомань, кадозе, каязе, каяфтозе, кельксезе, кеподьсы
- Plur
- Number[subj]
- Plur
- ADV: пяшксетольхть
- AUX: ульсть, ашесть, Эрявихть, ашельхть, исть, эрявсть
- AUX-Fin: ульсть
- VERB: кармасть, морасть, Корхтайхть, кирдест, лиссть, работасть, тисть, уендихть, эрявихть, эряйхть
- VERB-Fin: кармасть, морасть, работасть, эрявихть, эряйхть, Ушедоме, азозь, ардоме, ащесть, ванфнезь
- VERB-Part: таргозьфтольхть
- Sing
- ADJ: маниель, Валдонян, Муворуван, Тяконян, Шумбрат, акшель, лямболь, пароль, сятяволь, цебярель
- ADV: ичкозят
- AUX: ульсь, ашезь, ашень, ашеть, изь, эрявсь, афоль, аш, тяк, эряви
- AUX-Fin: ашень, ульсь, Улень, ашезе, савсь, сашендовсь, ули, эряви
- NOUN: мялецоль, Маконян, ават, алят, порядкасоль, прясан
- PROPN: Алдуван
- VERB: марявсь, лиссь, сась, варжакстсь, кармась, моли, мольсь, рамась, тусь, улема
- VERB-Fin: кармась, арась, марявсь, сась, сувась, тусь, утцесь, ушедсь, ётась, аськолясь
- VERB-Part: мяляфтан, ацафоль, мяляфтат, сафат, содафоль, тертьфоль
- VERB-Vnoun: кельгомнян
- Plur
- PartForm
- NegConvPrc
- AUX: апак
- AUX-Conv,Part: апак
- Past
- VERB-Part: мяляфтан, Кундафнень, мяляфтат, праф, сафат, сюдофокс, эцеф, юкстафокс
- NegConvPrc
- Person[obj]
- 1
- VERB: Таргафтолемайть, валхтсамазь, васьфтьсамазь, дивандафтомань, кизефтендярясамазь, лийфнесамазь-тисамазь, няйсамак, няйсамасть, пиксомань, шачфтомань
- VERB-Fin: васьфтьсамазь, дивандафтомань, лийфнесамазь-тисамазь, няйсамак, няйсамасть
- 2
- AUX: афолензе
- VERB: стардондярятанза
- 3
- AUX: тяк, ашезе
- AUX-Fin: ашезе
- VERB: валхтозе, кизефтезе, няезе, содасак, сявозе, сёрмадозе, Кельгсайне, Кончайне, Ладяйне, Лихтезь
- VERB-Fin: валхтозе, кизефтезе, содасак, Кельгсайне, азозь, аноклазень, вадердасыне, ванфнезь, вархцодезе, кадозе
- 1
- Person[psor]
- 1
- ADP: Инголенк, каршесонк, корязон, корязонк, эздон, эздонк
- NOUN: Алязе, брадозень, онцтон, сельмонень, Алязтиге, Казарманьконь, алязень, арьсеманень, атязе, баняня
- PROPN: Мишазе
- VERB-Vnoun: куломозон, саманьконь
- 2
- ADJ: Нильгемонце
- ADP: Мельгат, корязонт, пильгалот
- NOUN: Мотоциклантень, Ялгацень, алядот, ваксстот, кице, мяльце, пряцень, свадьбацень, сёрмаце, тевцень
- PRON: ськамот
- VERB-Inf: учендомот
- 3
- ADJ: моронц, оцюняснон
- ADP: мархтонза, корязост, Инголест, лангаст, перьфканза, эздост, эзонза, эсонза, эсост
- NOUN: цёранц, шамац, мялец, вазенц, лангозонза, мирденц, мялецоль, пацяняц, пингстонза, сельмосна
- PRON: кафонест
- VERB-Conv: Тумстост
- VERB-Inf: вятемонза, шнамонза
- VERB-Vnoun: морамаснон, покодемаснон, саманцты, самозост, сувамац, тиемацка, тумозонза, тушендомаснон
- 1
- Person[subj]
- 1
- ADJ: Валдонян, Муворуван, Тяконян
- AUX: ашень, Улень, улян
- AUX-Fin: ашень, Улень
- NOUN: Маконян, прясан
- PROPN: Алдуван
- VERB: касан, Арьсян, Касондярян, ванан, корхтан, мяляфтан, сявонь, тиень, тиян, тунь
- VERB-Fin: корхтан, тиян, туян, Аськолянь, Кельгсайне, Удан, Ушедоме, ардоме, ванан, виздеме
- VERB-Part: мяляфтан
- VERB-Vnoun: кельгомнян
- 2
- ADJ: Шумбрат
- ADV: ичкозят
- AUX: ашеть, тяк, Тят, афолеть, тята, улелеть
- NOUN: ават, алят
- VERB: архт, мярьгат, сать, содасак, ярхцада, ёрат, Варжалите, Видендярялеть, Молелексолеть, Няить
- VERB-Fin: мярьгат, сать, содасак, ёрат, азондат, арать, ащат, каят, кизефнят, корхтазеват
- VERB-Part: мяляфтат, сафат
- 3
- ADJ: маниель, акшель, лямболь, пароль, сятяволь, цебярель, эреколь, якстерель
- ADV: пяшксетольхть
- AUX: ульсь, ашезь, изь, ульсть, эрявсь, афоль, аш, ашесть, эряви, Улендяряль
- AUX-Fin: ульсть, ульсь, ашезе, савсь, сашендовсь, ули, эряви
- NOUN: мялецоль, порядкасоль
- VERB: марявсь, лиссь, сась, варжакстсь, кармась, моли, мольсь, рамась, тусь, улема
- VERB-Fin: кармась, арась, кармасть, марявсь, морасть, сась, сувась, тусь, утцесь, ушедсь
- VERB-Part: ацафоль, содафоль, таргозьфтольхть, тертьфоль
- 1
- PunctSide
- Fin
- PUNCT: »
- Ini
- PUNCT: «
- Fin
- Style
- Ped
- ADV: кържа, Мзярда
- DET: Мъзяра, кодама-бъди
- PART: въдь
- PRON: мезень-бъди
- SCONJ: къда, мъзярда
- Ped
- Typo
- Yes
- NOUN: карденя, велькска, карденяв
- Yes
- VerbType
- Aux
- ADV: аш
- AUX: аф, ашезь, ба, ашеть, изь, аш, ашесть, тяк, Афоль, Тят
- Aux
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: улемс, аш.
- This corpus uses 3 lemmas as auxiliaries (aux). Examples: улемс, савомс, сашендовомс.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (1)
- VERB--NOUN-Gen (1)
- VERB--NOUN-Nom (82)
- VERB--PRON (1)
- VERB--PRON-Nom (46)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Nom (113)
- VERB-Fin--NOUN-Nom-ADP(мархта) (1)
- VERB-Fin--PRON-Nom (31)
- VERB-Inf--NOUN-Nom (1)
- VERB-Part--NOUN-Nom (4)
- obj
- VERB--NOUN-Abl (1)
- VERB--NOUN-Ela (1)
- VERB--NOUN-Gen (37)
- VERB--NOUN-Gen-ADP(эшка) (1)
- VERB--NOUN-Ine (1)
- VERB--NOUN-Nom (34)
- VERB--PRON-Gen (3)
- VERB--PRON-Nom (2)
- VERB-Conv--NOUN-Gen (3)
- VERB-Fin--NOUN-Gen (31)
- VERB-Fin--NOUN-Nom (26)
- VERB-Fin--PRON-Gen (5)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--NOUN-Gen (13)
- VERB-Inf--NOUN-Nom (8)
- VERB-Inf--PRON-Gen (3)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--PRON-Nom (1)
Relations Overview
- This corpus uses 36 relation subtypes: acl:relcl, advcl:cau, advcl:eval, advcl:tcl, advmod:cau, advmod:cmp, advmod:deg, advmod:eval, advmod:foc, advmod:freq, advmod:lmod, advmod:mmod, advmod:tmod, aux:cnd, aux:nec, aux:neg, aux:opt, aux:q, cc:preconj, csubj:cop, flat:name, nmod:appos, nmod:bahuv, nmod:gobj, nmod:lmod, nmod:poss, nmod:tmod, nsubj:cop, nsubj:pass, obl:agent, obl:cau, obl:cmp, obl:freq, obl:inst, obl:lmod, obl:tmod
- The following 4 relation types are not used in this corpus at all: iobj, clf, goeswith, reparandum