UD Pomak Philotis
Language: Pomak (code: qpm
)
Family: Indo-European, Slavic
This treebank has been part of Universal Dependencies since the UD v2.10 release.
The following people have contributed to making this treebank part of UD: Ritván Karahóǧa, Vivian Stamou, Stella Markantonatou.
Repository: UD_Pomak-Philotis
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.13
License: CC BY-NC-SA 3.0
Genre: news, grammar-examples, poetry, fiction
Questions, comments? General annotation questions (either Pomak-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [marks (æt) athenarc • gr]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | assigned by a program, with some manual corrections, but not a full manual verification |
UPOS | assigned by a program, with some manual corrections, but not a full manual verification |
XPOS | not available |
Features | assigned by a program, with some manual corrections, but not a full manual verification |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
The Pomak UD treebank is derived from the Pomak Dependency Treebank, a resource developed and maintained by researchers at the Institute for Language and Speech Processing/Athena R.C. (http://www.ilsp.gr).
The Pomak UD treebank consists of 6351 sentences (86782 tokens). The data in the current release derive from primary texts that will be made available soon on the repositories of the Philotis project (https://www.ilsp.gr/en/projects/filotis-en/). The treebank is licensed under the terms of Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) .
The morphological annotation of the Pomak UD treebank was originally created by applying the morphological database Rodopsky to the texts and then by extensive manual correction by two annotators. The syntactic annotation of the 1.1 release was generated automatically using a Bulgarian model. A detailed revision of the automatic syntactic annotation is due at the end of 2022.
Acknowledgments
We wish to thank all contributors to the original annotation efforts. Morphological annotation was carried out by Ritvan Karahoǧa and Nicolaos Constantinides. Panagiotis Krimpas supported the annotation with expertise in Slavic languages and Stella Markantonatou with expertise in formal grammatical frameworks. Nicolaos Kokkas contributed to the collection of Pomak texts.
References
- Karahóǧa, R. Krimpas, P., Stamou, V., Arampatzakis, V., Karamatskos, D., Sevetlidis, V., Constantinides, N., Kokkas, N., Pavlidis, G., Markantonatou,S. (2022). Morphologically annotated corpora of Pomak. In Proceedings of the 5th Workshop on the Use of Computational Methods in the Study of Endangered Languages: The Use of Computational Methods in the Study of Endangered Languages. Association for Computational Linguistics. Dublin, May 26-27, 2022.
Statistics of UD Pomak Philotis
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Abbr – AdpType – Animacy – Aspect – Case – Definite – Degree – Deixis – DeixisRef – Foreign – Gender – Mood – Number – Number[psor] – NumType – PartTypeQpm – Person – Polarity – Poss – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – amod – aux – case – cc – ccomp – conj – cop – csubj – dep – det – discourse – expl – fixed – flat – iobj – mark – nmod – nsubj – nummod – obj – obl – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 6350 sentences and 86780 tokens.
- This corpus contains 11758 tokens (14%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 5 types of words that contain both letters and punctuation. Examples: i.d., nacýj-nasám, H., bóržo-bóržo, páta-kǘta
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 43 word types tagged as particles (PART): Alé, Aléj, E, Ho, Háir, Hájir, Háne, Namóte, Nel, bilé, dalí, danó, de, dá, ej, já, jéta, li, marí, my, móte, na, namój, namójte, ne, nemó, nemój, netǽ, ni, nimó, ná, néma, ní, nó, nǽ, se, sǽ, ta, te, u, áǧeba, éto, óti
- This corpus contains 9 lemmas tagged as pronouns (PRON): Ají, isazí, ja, kaná, kanása, moj, so, síčko, žýjes
- This corpus contains 35 lemmas tagged as determiners (DET): adín, ažýjes, badín, bir, bu, drug, déno, déso, esvá, her, isakvózen, isazí, isélkus, isézi, kakvóv, kakvóvsa, kač, koj, kutrí, kutrísa, kólko, kólkoso, mlózi, moj, néšto, nǽko, o, samýj, séki, sǽko, vrit, vrítsi, číjje, što, žýjes
- Out of the above, 3 lemmas occurred sometimes as PRON and sometimes as DET: isazí, moj, žýjes
- This corpus contains 6 lemmas tagged as auxiliaries (AUX): býdom, da, som, še, šom, štom
- There are 4 (de)verbal forms:
- Conv
- VERB: smǿva, glǿdava, gorǿva, daržóva, fýrkava, rǘkava, spóva, varvǿva, zaklǘčeva, čákava
- Fin
- AUX: je, so, si, som, sa, jo, sme, ste, be, béšo
- VERB: víka, íma, trǽbava, móža, hódi, právi, fáti, íde, stánava, íšte
- Inf
- AUX: by, bu
- VERB: je, pi, vidé, plaká, čúdi, kazá, bra, dumí, hadí, kazavá
- Part
- AUX: bul, byl, býla, búlo, býlo, búla, býly, bil, býli, búli
- VERB: reklól, reklála, zøl, atišlól, imǽlo, imǽl, papýtal, vídel, zǿla, dal
Nominal Features
- Fem
- ADJ: starána, cǽlo, gulǽma, gulǽmo, górnono, Pomácka, hubavá, čárckono, altóneny, húbavo
- AUX-Part: býla, búla, býly, bíla, búly, bylá, bulá
- DET: annó, anná, ennó, žýne, žána, isózi, kakvó, drúgono, drúgy, isázi
- NOUN: godíny, májka, kóštono, rábato, vódo, rábaty, žanána, rábata, momána, parý
- NUM: annó, anná, ennó, enná, annána, anníčka, annój, annóno, annóso
- PRON: jé, tja, ji, jí, týje, hi, jo, to, te, ja
- PROPN: Aminǽ, Galínka, Ǧemilǽ, Hilmijá, Kavála, Mára, Srǽdo, Jurké, Melihá, Máro
- VERB-Part: reklála, zǿla, atišlála, vídela, stánala, reklá, papýtala, dála, tórnala, ískala
- Masc
- ADJ: stáryjen, cǽla, mládyjen, gulǽma, míčkyjen, gulǽmyjen, húbava, móske, čárckyjen, gulǽm
- AUX-Part: bul, byl, bil, búli, býli, bíli, búly
- DET: annók, adín, kutrí, žýjen, vrítsi, žíne, žókne, ennók, badín, edín
- NOUN: déne, čulǽkon, čulǽk, čulǽka, bubájko, vakýt, pláden, bubájka, dǽdo, brat
- NUM: annók, dva, dvamínana, dvamína, dvomínana, trimínana, dvomína, ennók, trimína, adín
- PRON: go, mú, toj, mu, tóga, tíje, tæh, mo, to, tómu
- PROPN: Isén, Alí, Nasradín, Panedélnik, Ají, Asán, Jerím, Orhán, Asíp, Enés
- VERB-Part: reklól, zøl, atišlól, imǽl, papýtal, vídel, dal, advórnal, tórnal, stánal
- Neut
- ADJ: Pomácko, kámatno, parátiko, altónenono, húbavo, míčko, lóšo, cǽlo, právo, gulǽmo
- AUX-Part: búlo, býlo, býly, búly, buló, bílo, bílu
- DET: annó, inazí, drúgo, ennó, isazí, kakvó, itazí, žóno, žýne, drúgono
- NOUN: kópeløno, vréme, mómičeno, mǽsto, mómiče, sélo, sélono, vratána, píle, magáreno
- NUM: annó, annóno, annóto, dvémne, annómune, ennó, ennóto, jennó
- PRON: go, to, mu, mú, gu, mo, tómu, mó
- PROPN: Kélčeno, Nedéle, Kélčetune, Iskéče, Pašavík, Basájkovo, Lýǧeno, Siníkovo, Bratánkovo, Bunár
- VERB: imǽlo, stánalo, skrýto, reklólo, zǿlo, atišlólo, dašlólo, advórnalo, tórnalo, láhalo
- VERB-Part: imǽlo, stánalo, skrýto, reklólo, zǿlo, atišlólo, dašlólo, advórnalo, tórnalo, láhalo
- Hum
- ADJ: móske, stárine, stári, stárehne, jódrine, mládi, mládine, móski, húbavi, zdrávi
- AUX-Part: búli, býli, bíli
- DET: vrítsi, žíne, drúzine, kutróga, vritsǽh, mlózi, žǽhne, vritsǽm, annóga, kakví
- NUM: dvamínana, dvamína, dvomínana, trimínana, dvomína, trimína, dvomínehne, čétrimina, dvomínata, trimínasa
- PRON: tíje, tæh
- VERB-Part: zǿli, našlíli, imǽli, reklíli, tórnali, varvǽli, žyváli, vídeli, fátili, atišlíli
- Nhum
- ADJ: skópy, visóky, čúzdy, altóneny, gulǽmy, húbavy, kámatny, míčky, vóstryne, čórny
- AUX-Part: búly
- DET: drúgy, žýne, inéj, drúgyne, kakvý, inézi, samý, Inakvýne, ajnés, anný
- PRON: to, žýte
- VERB-Part: zǿly, izlǽly, vlǽly, zatvóreny, atfóreny, fprǽly, pasrǿšnaly, Brajényne, Fpúlily, Narýpily
- Coll
- NOUN: brátje, dečjána, lǘdje, kámeņe, ǧíņeno, cvetjé, dečjá, brátjeno, cvetjéno, kámeņeno
- Count
- ADJ: húbava, mláda
- NOUN: déne, hóreha, matóra, méseca, tumafíle, vríse, arkadáše, telifóna, véčera, avéna
- Plur
- ADJ: móske, húbavy, altóneny, míčky, stárine, čórny, gulǽmy, kámatny, stári, Pomáci
- AUX-Fin: so, sa, sme, ste, bého, šte, béhte
- AUX-Part: býly, býli, búli, búly, bíli
- DET: vrítsi, žýne, žíne, drúgy, inéj, inézi, drúzine, isézi, kakvý, vritsǽh
- NOUN: godíny, rábaty, parý, líry, vratána, insána, insán, déti, ačíne, insánon
- NUM: tri, dve, dva, dvamínana, dvéne, dvamína, kyrk, beš, dvomínana, on
- PART: Namóte, namójte, móte
- PRON: gi, mí, tíje, tæh, to, mi, nýje, nú, vú, výje
- PROPN: Kóšte, Nedéleta, Sápes
- VERB-Fin: víkot, právet, ídot, hódet, ímot, jedót, fátiho, umǿt, stóret, zavót
- VERB-Part: zǿli, našlíli, imǽli, reklíli, tórnali, varvǽli, žyváli, vídeli, fátili, zǿly
- Sing
- ADJ: stáryjen, cǽla, gulǽma, cǽlo, mládyjen, kámatno, gulǽmo, starána, húbavo, míčkyjen
- AUX-Fin: je, si, som, jo, be, béšo, še, ja, sa, sam
- AUX-Part: bul, byl, býla, búlo, býlo, búla, bil, bíla, bylá, bulá
- DET: annó, annók, adín, inazí, bir, kutrí, ennó, žýjen, anná, drúgo
- NOUN: déne, májka, kóštono, čulǽkon, rábato, kópeløno, vódo, vréme, mómičeno, čulǽk
- NUM: annó, annók, ennók, 1, adín, anná, ennó, annóno, adínyjen, annókne
- PART: namój, nemój, nimó, nemó
- PRON: go, mú, jé, toj, mu, mí, tja, ja, tí, ty
- PROPN: Ksánti, Elláda, Ǧumágün, Aminǽ, Komotiní, Isén, Nasradín, Galínka, Panedélnik, Ǧemilǽ
- VERB: víka, reklól, íma, trǽbava, móža, reklála, hódi, právi, zøl, atišlól
- VERB-Fin: víka, íma, trǽbava, móža, hódi, právi, fáti, íde, stánava, íšte
- VERB-Part: reklól, reklála, zøl, atišlól, imǽlo, imǽl, papýtal, vídel, zǿla, dal
- Acc
- ADJ: cǽla, cǽlo, gulǽma, gulǽmo, Pomácko, húbava, húbavo, kámatno, móske, górnono
- DET: annó, annók, ennó, inazí, drúgo, žýne, drúgy, žókne, ennók, kakvó
- NOUN: déne, godíny, kóštono, rábato, vódo, čulǽka, vréme, mǽsto, rábaty, vakýt
- NUM: annó, annók, dvamína, ennók, dvamínana, dvomínehne, trimína, ennó, annókne, annóno
- PRON: só, go, jé, gi, mó, sa, tó, tóga, to, móne
- PROPN: Ksánti, Elláda, Ǧumágün, Komotiní, Panedélnik, Kavála, Srǽdo, Siría, Tórnik, Nedéle
- VERB-Part: skrýto, platéno, umrǽta, atvóreny, nagadéno, spúšanokne, spúšanono, ukrádena, umrǽtokne, astávena
- Gen
- ADJ: stárumune, mládumune, míčkumune, stároj, stáru, čúdnune, žývumune, Evréjinu, Evréjinune, Karakačéninune
- DET: vritsǽm, annómu, drúgumune, kutrómu, žómune, inózimu, žǽmne, druzǽmne, annój, bannómu
- NOUN: bubájku, žanójne, kópeløtune, májci, čulǽkune, synúne, vasiļázune, brátu, momójne, čárüne
- NUM: dvémne, annój, annómune, dvamínem, dvomínemne, trimínemne, trímne
- PRON: sí, mú, mí, mu, tí, ji, jí, mi, ti, hi
- PROPN: Kélčetune, Melihí, Mári, Isénu, Nasradínu, Ajší, Asánu, Asíp, Azraílu, Galínki
- VERB-Part: davédenu, pǽtumune, skrýtumune, umrétune, zbrátem, šaštísanune
- Nom
- ADJ: stáryjen, mládyjen, starána, míčkyjen, gulǽmyjen, gulǽma, čárckyjen, gulǽm, star, Pomácka
- DET: adín, kutrí, žýjen, inazí, vrítsi, anná, žíne, badín, kotrí, annó
- NOUN: májka, čulǽkon, čulǽk, kópeløno, bubájko, žanána, mómičeno, momána, rábata, astinomíjena
- NUM: dvomínana, dvamínana, trimínana, dvomína, adín, anná, trimína, annó, adínyjen, dvomínata
- PRON: toj, tja, ja, ty, to, tíje, nýje, výje, teh, je
- PROPN: Aminǽ, Isén, Alí, Galínka, Nasradín, Hilmijá, Kélčeno, Ǧemilǽ, Ají, Mára
- VERB: naučéna, naučény, pǽtyjen, zarýtyjen, začúden, pǽti, zaglavény, zatvóren, začúdeni, kápnati
- VERB-Part: naučéna, naučény, pǽtyjen, zarýtyjen, začúden, pǽti, zaglavény, zatvóren, začúdeni, kápnati
- Voc
- ADJ: májčin, bábino, májčino, alláhovo, kámatny, mílu, míčko, stárku, červéno
- DET: móje, nášo
- NOUN: sýne, dǽdo, ma, bubá, bábo, pópe, báte, dóšterø, čárü, žóno
- PROPN: Kíme, Jaút, Aminǽ, Pétre, Ahmét, Hamdí, Hasán, Mustufá, BABU, Hóǧa
- Def
- ADJ: stáryjen, mládyjen, starána, míčkyjen, gulǽmyjen, čárckyjen, altónenono, górnono, stárine, üčünǧǘno
- DET: žýjen, žýne, žíne, žókne, drúgono, drúgokne, žóno, žána, drúgyjen, annóno
- NOUN: kóštono, čulǽkon, kópeløno, mómičeno, žanána, momána, astinomíjena, goróno, kópelon, mečkána
- NUM: dvamínana, dvéne, dvomínana, tríne, trimínana, dvána, dvomínehne, annóno, adínyjen, annókne
- PRON: síčkono, síčkoso, síčkona, síčkoto, žýte
- PROPN: Kélčeno, Kélčetune, Lýǧeno, Próniano, OGOno, Balkánase, Dólneno, Edrelézene, Epimelitírioso, Hóǧana
- VERB: pǽtyjen, zarýtyjen, davédenono, spúšanokne, spúšanono, umrǽtokne, šlévenata, mésenono, primázanono, skrýtono
- VERB-Part: pǽtyjen, zarýtyjen, davédenono, spúšanokne, spúšanono, umrǽtokne, šlévenata, mésenono, primázanono, skrýtono
- Ind
- ADJ: mlógo, razý, cǽla, gulǽma, málko, cǽlo, ájni, bajá, mlógu, mífko
- DET: annó, annók, adín, bir, ennó, anná, drúgo, drúgy, ennók, edín
- NOUN: déne, godíny, májka, rábato, vódo, vréme, čulǽk, čulǽka, bubájko, vakýt
- NUM: annó, tri, annók, dve, dva, dvamína, kyrk, beš, on, 6
- PRON: síčko, mu, hi, mo, ti
- PROPN: Ksánti, Elláda, Ǧumágün, Aminǽ, Komotiní, Isén, Nasradín, Galínka, Panedélnik, Hilmijá
- VERB-Part: skrýto, naučéna, umrǽta, naučény, začúden, platéno, pǽti, umaréno, zaglavény, zatvóren
Degree and Polarity
- Aug
- ADJ: kámatnišičky, nývvišičko, pýlniček
- NOUN: kupníšte, kámenište, račíštana, ustǽkyne
- PROPN: Sélište
- Cmp
- ADJ: húbavo
- ADV: pó
- Dim
- ADJ: mǿčko, zelénko, stárku, sámsamiček
- ADV: bórško, usulétanka, húbefce, Usúlanka, annínkuš, mífčinko
- DET: samíček, samíčko, anníčko, kólčko, samíčka
- NOUN: bábičkana, kópelčeno, kótenceno, kúčenceno, kámenkane, kópelče, kutújkono, avenčóno, žábinkana, barčínkono
- NUM: anníček, anníčka, trínky
- PROPN: Galínka, Pepelívka, Galínki, Métka, Pepelívkana, Pepelívkoj
- VERB-Part: navítky
- Sup
- ADV: naj
- Neg
- PART: ne, na, néma, namój, ni, nemój, Namóte, namójte, Háir, Hájir
- VERB-Fin: néma, némom, némot, némaš, razbudáj, ništé, némame, davájte, ništóm, neméša
- VERB-Part: nemǽlo
Verbal Features
- Imp
- AUX-Fin: je, so, si, som, sa, jo, sme, ste, be, bého
- VERB-Conv: smǿva, glǿdava, gorǿva, daržóva, fýrkava, rǘkava, spóva, varvǿva, zaklǘčeva, čákava
- VERB-Fin: víka, íma, trǽbava, móža, hódi, právi, stánava, íšte, néma, zíma
- VERB-Inf: je, pi, plaká, čúdi, bra, dumí, hadí, kazavá, praví, spa
- VERB-Part: imǽlo, imǽl, mógal, imǽli, ískal, varvǽli, čákal, žyváli, móčil, hódil
- Iter
- VERB-Fin: ídešo, apǿneho, dǽlneho, fsúneho, fáteho, nájdešo, rečášo, vídešo, zasmǽšo, Čújeho
- VERB-Inf: vórttiti
- Perf
- AUX-Inf: by, bu
- AUX-Part: bul, byl, býla, búlo, býlo, búla, býly, bil, býli, búli
- VERB-Fin: fáti, vídi, íde, dam, stóri, stáne, dójde, daj, ídot, nájde
- VERB-Inf: vidé, kazá, attí, izléz, kupí, mažý, na, naredí, ču
- VERB-Part: reklól, reklála, zøl, atišlól, papýtal, vídel, zǿla, dal, advórnal, tórnal
- Prog
- AUX-Fin: béšo
- VERB-Fin: trǽbavašo, imǽšo, ištǽh, móžašo, iméša, kázavašo, ištǽšo, nósešo, rábatæšo, válešo
- Imp
- VERB-Fin: daj, zǿmij, jála, hájde, vórvij, kážyj, ídij, viš, razbudáj, óstavij
- Ind
- AUX-Fin: je, so, si, som, sa, jo, sme, ste, be, béšo
- VERB-Fin: víka, íma, trǽbava, móža, hódi, právi, fáti, íde, stánava, íšte
- Past
- AUX-Fin: be, béšo, bého, béhte
- AUX-Part: bul, byl, býla, búlo, býlo, búla, býly, bil, býli, búli
- VERB-Fin: fáti, fátiho, réče, zø, velí, stóri, dójde, káza, nájdaho, trǽbavašo
- VERB-Part: reklól, reklála, zøl, atišlól, imǽlo, imǽl, papýtal, vídel, zǿla, dal
- Pres
- AUX-Fin: je, so, si, som, sa, jo, sme, ste, še, ja
- VERB-Fin: víka, íma, trǽbava, móža, hódi, právi, íde, stánava, íšte, néma
- Act
- AUX-Fin: je, so, si, som, sa, jo, sme, ste, be, béšo
- AUX-Inf: by, bu
- AUX-Part: bul, byl, býla, búlo, býlo, búla, býly, bil, býli, búli
- VERB-Conv: smǿva, glǿdava, gorǿva, daržóva, fýrkava, rǘkava, spóva, varvǿva, zaklǘčeva, čákava
- VERB-Fin: víka, íma, trǽbava, móža, hódi, právi, fáti, íde, stánava, íšte
- VERB-Inf: je, pi, vidé, plaká, čúdi, kazá, bra, dumí, hadí, kazavá
- VERB-Part: reklól, reklála, zøl, atišlól, imǽlo, imǽl, papýtal, vídel, zǿla, dal
- Pass
- VERB-Part: skrýto, naučéna, umrǽta, naučény, pǽtyjen, zarýtyjen, začúden, platéno, pǽti, umaréno
Pronouns, Determiners, Quantifiers
- Dem
- ADV: itám, inagáne, isǽ, inýj, itúzi, tam, sæ, itýj, isýj, itúj
- DET: inazí, inélkus, inéj, bu, isazí, inózek, isózek, isózi, inézi, isázi
- PRON: ajnéj
- Emp
- DET: samýj, samí, samý, samó, samíček
- Ind
- ADV: nǽjde, bannóš, kugá, annagý
- DET: annó, annók, nǽko, adín, bir, ennó, anná, drúgo, drúgy, ennók
- Int
- ADV: kadé, kak, kugá, kogý, kogá, Ke, kogáni
- DET: kutrí, kólko, kakvó, kakvá, kotrí, kakvý, kutróga, katrí, kakvóv, katró
- PRON: kaná, kakná, kaknani, Móne, aknáni, kaknáni
- Prs
- DET: tvóto, tójnono, tógavokne, ma, nášoso, tógavono, mójet, tváta, tǽhnokne, moj
- PRON: só, go, sí, mú, jé, mí, gi, toj, mu, tja
- Rel
- ADV: kugána, kákna, kadéna, kákta, kadéta, kugáta, káksa, kogána, kákno, kadénu
- DET: žýjen, žýne, žíne, žókne, žóno, žána, kólkono, žǽhne, kólkoto, žóto
- PRON: kanána, kaknána, kanáta, kaknása, Kanása, kaknáno, aknána, kaknáta, kaknátu, žýte
- Tot
- ADV: dájma
- DET: vrit, vrítsi, her, sǽko, vritsǽh, vritsǽm, sǽkva, sǽkvo, séko, Séki
- PRON: síčkono, síčko, síčkoso, síčkona, síčkoto
- Card
- NUM: annó, tri, annók, dve, dva, dvamínana, dvéne, dvamína, kyrk, beš
- Ord
- ADJ: üčünǧǘno, pórvokne, ikinǧíno, ikinǧí, pórvono, üčünǧǘ, birinǧíto, birinǧí, pórvajen, pórvyjen
- Yes
- ADJ: bubájkovono, májčin, bábino, májčino, Máminata, bubájkovyne, bábinana, májčinyne, mámin, Ajšínana
- DET: tvóto, tójnono, tógavokne, ma, nášoso, tógavono, mójet, tváta, tǽhnokne, moj
- PRON: mu, ji, mi, ti, hi, nu, vu, mo
- Yes
- PRON: só, sí, sa, se, su
- 1
- AUX-Fin: som, sme, be, béšo, sam, štom, so, šom
- DET: ma, nášoso, mójet, moj, móso, nášasek, mása, móse, móto, nášono
- PRON: mí, ja, mó, móne, mi, nýje, nú, námi, je, ma
- VERB-Fin: dam, íštom, znom, vídem, móžom, kážom, varvíme, ímom, stórem, ídeme
- 2
- AUX-Fin: si, ste, be, šte, béhte
- DET: tvóto, tváta, tvójet, tva, tvóso, vášono, tvo, tvoj, tvójen, tvókte
- PART: namój, nemój, Namóte, namójte, nimó, móte, nemó
- PRON: tí, ty, tó, ti, tébe, vú, výje, vámi, ta, u
- VERB-Fin: íšteš, vídiš, daj, zǿmij, jála, ímaš, hájde, znoš, ídeš, dadéš
- 3
- AUX-Fin: je, so, sa, jo, béšo, be, bého, še, ja, e
- DET: tójnono, tógavokne, tógavono, tǽhnokne, tójnyjen, tójnyne, tógavo, tógavoto, tǽhnyne, tógavine
- PRON: go, mú, jé, gi, toj, mu, tja, to, ji, jí
- VERB-Fin: víka, íma, trǽbava, móža, hódi, právi, íde, fáti, stánava, íšte
- Plur
- DET: nášoso, tǽhnokne, nášasek, nášono, nášise, nášokse, nášyse, tǽhnyne, naš, nášine
- PRON: mi, nu, vu
- Sing
- DET: tvóto, tójnono, tógavokne, ma, tógavono, mójet, tváta, moj, mása, móse
- PRON: mu, ji, ti, mi, hi, mo
Other Features
- Abbr
- Yes
- NOUN: i.d., DEIno, OEBEE, TV, WN, cm
- PROPN: H., KKE, OGOno, PAME, ogá, KEPKAno, KEPno, ogóno
- Yes
- AdpType
- Post
- ADP: ilén
- Post
- Deixis
- Prox
- ADJ: stáryjet, stáryte, birinǧíto, pomáckyse, staráta, čórnoso, gróznoto, jódroto, čorbaǧíckata, čárckyjet
- ADV: isǽ, itúzi, kákta, sæ, itýj, sabályjinto, isýj, kadéta, kugáta, itúj
- DET: isazí, isózek, isózi, isázi, itazí, isézi, isók, isélkus, kólkoto, žóto
- NOUN: mesecáte, mesecáse, düņóso, astinomíjeta, hükümétes, kóštoso, glavóto, mečkáta, momóso, májkata
- NUM: dvomínata, dvéte, trimínasa, trimínata, annóto, dvomínasa, dvomínehte, annógate, annóso, béšto
- PRON: kanáta, kaknása, síčkoso, Kanása, síčkoto, kaknáta, kaknátu, žýte
- PROPN: Balkánase, Epimelitírioso, Próniasa, Próniaso
- SCONJ: Agýta
- VERB-Part: šlévenata, abijískavanata, izmýslenyte, izpékanoso, izšlévenata, navǿzanite, navǿzanæhte, prekalnátasa, stánatoto, umarénite
- Remt
- ADJ: stáryjen, mládyjen, starána, míčkyjen, gulǽmyjen, čárckyjen, altónenono, górnono, stárine, üčünǧǘno
- ADV: itám, kugána, kákna, inagáne, kadéna, inýj, tam, akšámlajinno, tám, sabáhlajinno
- DET: inazí, žýjen, žýne, žíne, žókne, drúgono, inélkus, drúgokne, inéj, žóno
- NOUN: kóštono, čulǽkon, kópeløno, mómičeno, žanána, momána, astinomíjena, goróno, kópelon, mečkána
- NUM: dvamínana, dvéne, dvomínana, tríne, trimínana, dvána, dvomínehne, annóno, adínyjen, annókne
- PRON: kanána, síčkono, kaknána, kaknáno, síčkona, ajnéj, aknána
- PROPN: Kélčeno, Kélčetune, Lýǧeno, Próniano, OGOno, Dólneno, Edrelézene, Hóǧana, Hóǧena, KEPKAno
- SCONJ: agýna, agána
- VERB: pǽtyjen, zarýtyjen, davédenono, spúšanokne, spúšanono, umrǽtokne, mésenono, primázanono, skrýtono, sónenyne
- VERB-Part: pǽtyjen, zarýtyjen, davédenono, spúšanokne, spúšanono, umrǽtokne, mésenono, primázanono, skrýtono, sónenyne
- Prox
- DeixisRef
- 1
- ADJ: pomáckyse, čórnoso, altónenoso, bǽloso, górnese, ikinǧíso, mrávjeso, ponadólneso, Srébarnoso, Stároso
- ADV: isǽ, itúzi, sæ, isýj, itúj, káksa, isǽna, túzi, se, sǽ
- DET: isazí, isózek, isózi, isázi, isézi, isók, isélkus, izí, isój, isáj
- NOUN: mesecáse, düņóso, hükümétes, kóštoso, momóso, belidjóso, insánase, insános, Pomácese, hükümétese
- NUM: trimínasa, dvomínasa, annóso, dvése, tríse
- PRON: kaknása, síčkoso, Kanása
- PROPN: Balkánase, Epimelitírioso, Próniasa, Próniaso
- VERB-Part: izpékanoso, prekalnátasa, umrǽtoso, zgótvenyse
- 2
- ADJ: stáryjet, stáryte, birinǧíto, staráta, gróznoto, jódroto, čorbaǧíckata, čárckyjet, Máminata, altónenoto
- ADV: kákta, itýj, sabályjinto, kadéta, kugáta, tagás, akšálmyjinto, tugáva, itagáne, itúka
- DET: itazí, kólkoto, žóto, tvóto, itélkus, itózek, kakvóto, mójet, tváta, drúgoto
- NOUN: mesecáte, astinomíjeta, glavóto, mečkáta, májkata, pítoto, čulǽkot, drípyte, húbavoto, pótete
- NUM: dvomínata, dvéte, trimínata, annóto, dvomínehte, annógate, béšto, ennóto, tríte
- PRON: kanáta, síčkoto, kaknáta, kaknátu, žýte
- SCONJ: Agýta
- VERB-Part: šlévenata, abijískavanata, izmýslenyte, izšlévenata, navǿzanite, navǿzanæhte, stánatoto, umarénite
- 1
- Foreign
- Yes
- NOUN: ergatikó, kéntro, vulíno
- X: ejlé, Allahýn, ilé, izní, ješindá, spíti, sto, voítia, Læ, dejlé
- Yes
- PartTypeQpm
- Ind
- PART: nó, jéta, nǽ
- Neg
- PART: ní
- Tot
- PART: sǽ, se
- Ind
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: som.
- This corpus uses 6 lemmas as auxiliaries (aux). Examples: som, da, še, býdom, šom, štom.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Conv--NOUN-Acc (1)
- VERB-Fin--NOUN (4)
- VERB-Fin--NOUN-Acc (128)
- VERB-Fin--NOUN-Acc-ADP(agá) (1)
- VERB-Fin--NOUN-Acc-ADP(faf) (3)
- VERB-Fin--NOUN-Acc-ADP(pa) (1)
- VERB-Fin--NOUN-Acc-ADP(sas) (1)
- VERB-Fin--NOUN-Gen (11)
- VERB-Fin--NOUN-Nom (825)
- VERB-Fin--NOUN-Nom-ADP(faf) (1)
- VERB-Fin--NOUN-Nom-ADP(na) (1)
- VERB-Fin--NOUN-Nom-ADP(za) (1)
- VERB-Fin--NOUN-Voc (3)
- VERB-Fin--PRON (18)
- VERB-Fin--PRON-Acc (6)
- VERB-Fin--PRON-Gen (13)
- VERB-Fin--PRON-Nom (413)
- VERB-Inf--NOUN-Acc (1)
- VERB-Inf--PRON-Gen (1)
- VERB-Inf--PRON-Nom (5)
- VERB-Part--NOUN (2)
- VERB-Part--NOUN-Acc (101)
- VERB-Part--NOUN-Acc-ADP(faf) (1)
- VERB-Part--NOUN-Gen (15)
- VERB-Part--NOUN-Nom (1274)
- VERB-Part--NOUN-Nom-ADP(faf) (1)
- VERB-Part--NOUN-Nom-ADP(prez) (1)
- VERB-Part--PRON (16)
- VERB-Part--PRON-Acc (1)
- VERB-Part--PRON-Gen (13)
- VERB-Part--PRON-Nom (299)
- obj
- VERB-Conv--PRON-Acc (1)
- VERB-Fin--NOUN (6)
- VERB-Fin--NOUN-Acc (1798)
- VERB-Fin--NOUN-Acc-ADP(ad) (9)
- VERB-Fin--NOUN-Acc-ADP(at) (1)
- VERB-Fin--NOUN-Acc-ADP(faf) (3)
- VERB-Fin--NOUN-Acc-ADP(na) (11)
- VERB-Fin--NOUN-Acc-ADP(pa) (2)
- VERB-Fin--NOUN-Acc-ADP(pad) (2)
- VERB-Fin--NOUN-Acc-ADP(s) (1)
- VERB-Fin--NOUN-Acc-ADP(sas) (5)
- VERB-Fin--NOUN-Acc-ADP(vur) (1)
- VERB-Fin--NOUN-Acc-ADP(za) (2)
- VERB-Fin--NOUN-Gen (21)
- VERB-Fin--NOUN-Nom (127)
- VERB-Fin--NOUN-Voc (3)
- VERB-Fin--PRON (295)
- VERB-Fin--PRON-ADP(s) (1)
- VERB-Fin--PRON-Acc (1328)
- VERB-Fin--PRON-Gen (48)
- VERB-Fin--PRON-Nom (8)
- VERB-Inf--NOUN-Acc (9)
- VERB-Inf--NOUN-Nom (2)
- VERB-Inf--PRON (1)
- VERB-Inf--PRON-Acc (11)
- VERB-Part--NOUN (9)
- VERB-Part--NOUN-Acc (1193)
- VERB-Part--NOUN-Acc-ADP(at) (1)
- VERB-Part--NOUN-Acc-ADP(faf) (3)
- VERB-Part--NOUN-Acc-ADP(na) (6)
- VERB-Part--NOUN-Acc-ADP(sas) (1)
- VERB-Part--NOUN-Acc-ADP(za) (1)
- VERB-Part--NOUN-Acc-ADP(zaradí) (1)
- VERB-Part--NOUN-Gen (20)
- VERB-Part--NOUN-Nom (141)
- VERB-Part--NOUN-Voc (1)
- VERB-Part--PRON (117)
- VERB-Part--PRON-ADP(za) (3)
- VERB-Part--PRON-Acc (731)
- VERB-Part--PRON-Gen (5)
- VERB-Part--PRON-Nom (7)
- iobj
- VERB-Conv--NOUN-Gen (1)
- VERB-Fin--NOUN-ADP(faf) (1)
- VERB-Fin--NOUN-ADP(na) (2)
- VERB-Fin--NOUN-ADP(nah) (1)
- VERB-Fin--NOUN-ADP(u) (2)
- VERB-Fin--NOUN-ADP(za) (1)
- VERB-Fin--NOUN-Acc (3)
- VERB-Fin--NOUN-Acc-ADP(ad) (98)
- VERB-Fin--NOUN-Acc-ADP(ad)-ADP(prez) (1)
- VERB-Fin--NOUN-Acc-ADP(at) (45)
- VERB-Fin--NOUN-Acc-ADP(da) (9)
- VERB-Fin--NOUN-Acc-ADP(f) (4)
- VERB-Fin--NOUN-Acc-ADP(faf) (149)
- VERB-Fin--NOUN-Acc-ADP(izvón) (2)
- VERB-Fin--NOUN-Acc-ADP(méždu) (1)
- VERB-Fin--NOUN-Acc-ADP(na) (232)
- VERB-Fin--NOUN-Acc-ADP(na)-ADP(sredé) (1)
- VERB-Fin--NOUN-Acc-ADP(nah) (44)
- VERB-Fin--NOUN-Acc-ADP(niz) (6)
- VERB-Fin--NOUN-Acc-ADP(pa) (22)
- VERB-Fin--NOUN-Acc-ADP(pad) (7)
- VERB-Fin--NOUN-Acc-ADP(paslét) (1)
- VERB-Fin--NOUN-Acc-ADP(po) (1)
- VERB-Fin--NOUN-Acc-ADP(prez) (17)
- VERB-Fin--NOUN-Acc-ADP(pri) (8)
- VERB-Fin--NOUN-Acc-ADP(s) (1)
- VERB-Fin--NOUN-Acc-ADP(sas) (28)
- VERB-Fin--NOUN-Acc-ADP(srǿštu) (1)
- VERB-Fin--NOUN-Acc-ADP(u) (5)
- VERB-Fin--NOUN-Acc-ADP(varhú) (4)
- VERB-Fin--NOUN-Acc-ADP(vaz) (7)
- VERB-Fin--NOUN-Acc-ADP(za) (41)
- VERB-Fin--NOUN-Acc-ADP(zad) (1)
- VERB-Fin--NOUN-Gen (91)
- VERB-Fin--NOUN-Gen-ADP(faf) (1)
- VERB-Fin--NOUN-Gen-ADP(na) (2)
- VERB-Fin--NOUN-Gen-ADP(pat) (1)
- VERB-Fin--NOUN-Gen-ADP(prez) (1)
- VERB-Fin--NOUN-Nom (3)
- VERB-Fin--NOUN-Nom-ADP(atpréš) (1)
- VERB-Fin--NOUN-Nom-ADP(pa) (1)
- VERB-Fin--NOUN-Nom-ADP(prez) (1)
- VERB-Fin--NOUN-Nom-ADP(za) (1)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-ADP(sas) (1)
- VERB-Fin--PRON-ADP(za) (3)
- VERB-Fin--PRON-Acc (25)
- VERB-Fin--PRON-Acc-ADP(ad) (7)
- VERB-Fin--PRON-Acc-ADP(agá) (1)
- VERB-Fin--PRON-Acc-ADP(at) (8)
- VERB-Fin--PRON-Acc-ADP(at)-ADP(sas) (1)
- VERB-Fin--PRON-Acc-ADP(atpréš) (2)
- VERB-Fin--PRON-Acc-ADP(da) (2)
- VERB-Fin--PRON-Acc-ADP(faf) (5)
- VERB-Fin--PRON-Acc-ADP(na) (13)
- VERB-Fin--PRON-Acc-ADP(nah) (7)
- VERB-Fin--PRON-Acc-ADP(prez) (1)
- VERB-Fin--PRON-Acc-ADP(pri) (9)
- VERB-Fin--PRON-Acc-ADP(sas) (24)
- VERB-Fin--PRON-Acc-ADP(u) (21)
- VERB-Fin--PRON-Acc-ADP(varhú) (5)
- VERB-Fin--PRON-Acc-ADP(vaz) (2)
- VERB-Fin--PRON-Acc-ADP(za) (32)
- VERB-Fin--PRON-Acc-ADP(zaradí) (1)
- VERB-Fin--PRON-Acc-ADP(zat) (1)
- VERB-Fin--PRON-Gen (822)
- VERB-Fin--PRON-Gen-ADP(na)-ADP(mǽsto) (1)
- VERB-Fin--PRON-Nom (2)
- VERB-Inf--NOUN-Acc-ADP(at) (2)
- VERB-Inf--NOUN-Acc-ADP(na) (1)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Gen (18)
- VERB-Part--NOUN-Acc (1)
- VERB-Part--NOUN-Acc-ADP(ad) (70)
- VERB-Part--NOUN-Acc-ADP(at) (22)
- VERB-Part--NOUN-Acc-ADP(atpréš) (3)
- VERB-Part--NOUN-Acc-ADP(da) (13)
- VERB-Part--NOUN-Acc-ADP(f) (5)
- VERB-Part--NOUN-Acc-ADP(faf) (183)
- VERB-Part--NOUN-Acc-ADP(faf)-ADP(sredé) (1)
- VERB-Part--NOUN-Acc-ADP(izvón) (5)
- VERB-Part--NOUN-Acc-ADP(kazá) (2)
- VERB-Part--NOUN-Acc-ADP(méždu) (2)
- VERB-Part--NOUN-Acc-ADP(na) (196)
- VERB-Part--NOUN-Acc-ADP(nah) (59)
- VERB-Part--NOUN-Acc-ADP(napréš) (1)
- VERB-Part--NOUN-Acc-ADP(niz) (2)
- VERB-Part--NOUN-Acc-ADP(pa) (15)
- VERB-Part--NOUN-Acc-ADP(pa)-ADP(na) (1)
- VERB-Part--NOUN-Acc-ADP(pad) (10)
- VERB-Part--NOUN-Acc-ADP(paslét) (1)
- VERB-Part--NOUN-Acc-ADP(po)-ADP(sredé) (1)
- VERB-Part--NOUN-Acc-ADP(prez) (11)
- VERB-Part--NOUN-Acc-ADP(pri) (18)
- VERB-Part--NOUN-Acc-ADP(s) (2)
- VERB-Part--NOUN-Acc-ADP(sas) (17)
- VERB-Part--NOUN-Acc-ADP(u) (9)
- VERB-Part--NOUN-Acc-ADP(u)-ADP(vaz) (1)
- VERB-Part--NOUN-Acc-ADP(varhú) (10)
- VERB-Part--NOUN-Acc-ADP(vaz) (4)
- VERB-Part--NOUN-Acc-ADP(za) (15)
- VERB-Part--NOUN-Acc-ADP(za)-ADP(nah) (8)
- VERB-Part--NOUN-Acc-ADP(zad) (2)
- VERB-Part--NOUN-Gen (108)
- VERB-Part--NOUN-Gen-ADP(faf) (2)
- VERB-Part--NOUN-Gen-ADP(na) (3)
- VERB-Part--NOUN-Nom (2)
- VERB-Part--NOUN-Nom-ADP(ad) (1)
- VERB-Part--NOUN-Nom-ADP(atpréš) (1)
- VERB-Part--NOUN-Nom-ADP(na) (2)
- VERB-Part--PRON-Acc (5)
- VERB-Part--PRON-Acc-ADP(at) (7)
- VERB-Part--PRON-Acc-ADP(atpréš) (6)
- VERB-Part--PRON-Acc-ADP(da) (1)
- VERB-Part--PRON-Acc-ADP(faf) (12)
- VERB-Part--PRON-Acc-ADP(kazá) (2)
- VERB-Part--PRON-Acc-ADP(na) (3)
- VERB-Part--PRON-Acc-ADP(nah) (2)
- VERB-Part--PRON-Acc-ADP(paslét) (3)
- VERB-Part--PRON-Acc-ADP(prez) (1)
- VERB-Part--PRON-Acc-ADP(pri) (8)
- VERB-Part--PRON-Acc-ADP(sas) (6)
- VERB-Part--PRON-Acc-ADP(u) (15)
- VERB-Part--PRON-Acc-ADP(var) (1)
- VERB-Part--PRON-Acc-ADP(varhú) (3)
- VERB-Part--PRON-Acc-ADP(za) (10)
- VERB-Part--PRON-Acc-ADP(zad) (2)
- VERB-Part--PRON-Gen (423)
- VERB-Part--PRON-Gen-ADP(agá) (1)
- VERB-Part--PRON-Nom (2)
Verbs with Reflexive Core Objects
- This corpus contains 22 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: pribívom sa, ímom sa, ažónevom sa, dónesom sa, dúmem sa, ftapanǽvom sa, fátem sa, izkútevom sa, mólem sa, píjem sa, rádom sa, rázpusnom sa, skrývom sa, sóvnom sa, vráštom sa, zaglavǽvom sa, zbírom sa, záčudem sa, záčudem se, ízkukegom sa, úsramem sa, žónckyj sa
Relations Overview
- This corpus does not use relation subtypes.
- The following 8 relation types are not used in this corpus at all: dislocated, appos, clf, compound, list, orphan, goeswith, reparandum