UD Uzbek TueCL
Language: Uzbek (code: uz)
Family: Turkic
This treebank has been part of Universal Dependencies since the UD v2.16 release.
The following people have contributed to making this treebank part of UD: Arofat Akhundjanova, Çağrı Çöltekin.
Repository: UD_Uzbek-TueCL
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.17
License: CC BY-SA 4.0
Genre: grammar-examples
Questions, comments? General annotation questions (either Uzbek-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [arak00001 (æt) stud • uni-saarland • de]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually |
| UPOS | annotated manually, natively in UD style |
| XPOS | not available |
| Features | annotated manually, natively in UD style |
| Relations | annotated manually, natively in UD style |
Description
The Uzbek-TueCL treebank is part of a parallel Universal Dependencies corpus containing 148 sentences across four Turkic languages: Turkish, Azerbaijani, Kyrgyz, and Uzbek.
Uzbek-TueCL consists of 148 carefully selected sentences (940 tokens) compiled from multiple sources, including the Cairo corpus (20 sentences), the UDTW23 corpus (20 sentences), and 97 additional examples illustrating specific grammatical constructions of interest. Tokenization was carried out automatically. Lemmatization, POS tags, morphological features and dependency relations were annotated manually.
Acknowledgments
This work was supported by COST Action CA21167 - Universality, diversity and idiosyncrasy in language technology (UniDive). We thank the Turkic UD working group for fruitful discussions of linguistic issues and annotation approaches.
Statistics of UD Uzbek TueCL
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB
Features
Aspect – Case – Degree – Mood – Number – NumType – Person – Polarity – Poss – PronType – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – amod – aux – case – cc – ccomp – compound – compound:lvc – compound:redup – compound:svc – conj – cop – csubj – det – discourse – flat – mark – nmod – nmod:poss – nsubj – nsubj:pass – nummod – obj – obl – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 148 sentences and 939 tokens.
- This corpus contains 194 tokens (21%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 1 types of words that contain both letters and punctuation. Examples: bir-birlarini
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: SYM, X
- This corpus contains 4 word types tagged as particles (PART): apil, hal, tapil, voz
- This corpus contains 16 lemmas tagged as pronouns (PRON): bir-biri, biz, bu, hechqisi, kim, men, nima, oʻzi, qanday, qayer, qaysi, sen, shu, shunday, siz, u
- This corpus contains 5 lemmas tagged as determiners (DET): barcha, bu, hech, oʻsha, shunday
- Out of the above, 2 lemmas occurred sometimes as PRON and sometimes as DET: bu, shunday
- This corpus contains 8 lemmas tagged as auxiliaries (AUX): boʻl, edi, ekan, emas, emish, kerak, mumkin, yoʻq
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: boʻl
- There are 4 (de)verbal forms:
- Conv
- VERB: olib, bera, oʻqib, unutib, uxlay, bilib, chiqarib, erisha, gullab, kelib
- Fin
- AUX: boʻlgandi
- VERB: ketdi, qildi, uxladi, berdi, ketgan, oʻylaysan, bergan, boʻlgan, changlanadi, kelmagan
- Part
- VERB: Oʻqiganlarini, kelgan, koʻrgan, oʻqigan, qilgan, tayyorlagan, uxlagan, yozganini, Oʻqiganingizni, olmaydigan
- Vnoun
- VERB: kelishing, oʻqishi, oʻqishni, Yotgani, chekish, chizishni, ichishni, ketishni, oʻqish, rivojlanishi
Nominal Features
- Plur
- ADJ: yoshlarni
- NOUN: bolalarga, Natijalar, birodarini, bolalar, daraxtlari, dinlar, doʻstlaridan, ishlari, javondagilar, maktablarda
- PRON: biz, Ular, bir-birlarini, ularning
- VERB: Oʻqiganlarini, bilmaydi, Aytishlaricha, borganimizda, boʻlardik, chiqdilar, kechtirishimiz, quchoqladilar, tushundingizmi, uxlatishdi
- VERB-Fin: uxlatishdi
- VERB-Part: Oʻqiganlarini
- VERB-Vnoun: kechtirishimiz, uygʻotishimiz
- Sing
- AUX: boʻladi, boʻlgandi, ekanmi
- AUX-Fin: boʻlgandi
- NOUN: kitob, uyda, kitobni, maktabga, bola, onasini, Oʻqituvchi, mashina, non, shifokor
- PRON: u, Sen, menga, Buning, Mening, bu, kim, nimaga, nimani, oʻzi
- PROPN: Deniz, Oyxonga, Denizning, Oysha, Meri, Piter, Fransiya, Parijda, Braun, Denizni
- VERB: berdimi, ketdi, oldi, oʻqiyapti, qildi, uxladi, berdi, boʻladi, istaysanmi, ketgan
- VERB-Fin: ketdi, qildi, uxladi, berdi, ketgan, oʻylaysan, bergan, boʻlgan, changlanadi, kelmagan
- VERB-Part: uxlagan, oʻqiganini, tushungani, yugurgani
- VERB-Vnoun: turmaklashi, oʻqimoqchiligini
- Abl
- NOUN: Piterdan, doʻstlaridan, maqsadlardan, ovqatdan, restorandan, soatdan, xonadan
- PRON: senikidan, shundan
- Acc
- ADJ: koʻkni, yoshlarni
- AUX: ekanligini
- NOUN: kitobni, onasini, mashinani, sochini, Piyozni, birodarini, derazani, eshikni, koʻkini, kunni
- PRON: nimani, bir-birlarini, shuni, uni
- PROPN: Denizni
- VERB-Part: Oʻqiganlarini, yozganini, Oʻqiganingizni, oʻqiganini
- VERB-Vnoun: oʻqishni, chizishni, ichishni, ketishni, berishini, boʻlishni, oʻqimoqchiligini, uxlashini
- Dat
- NOUN: maktabga, uyga, bolalarga, doʻstiga, eriga, qizilga, dunyoga, havotirga, kitobga, qoʻlga
- PRON: menga, nimaga, Senga
- PROPN: Oyxonga, Xoqonga
- VERB-Vnoun: tashlashga, aylanguniga
- Gen
- NOUN: Onasining, Uyning, bolaning, otasining
- PRON: Buning, Mening, Uning, ularning
- PROPN: Denizning, Deniznikining, Piterning
- Loc
- NOUN: uyda, uydagi, maktabda, vaqtida, xonada, Bozorda, Stolda, chorbogʻdagi, idorada, javondagilar
- PRON: qayerda
- PROPN: Parijda
- VERB: bajarishda, borganimizda, gaplashayotganingda, qilinayotganda
- VERB-Vnoun: bajarishda
- Nom
- NOUN: kitob, bola, Oʻqituvchi, mashina, non, shifokor, eʼlon, harakat, kuni, poytaxti
- PRON: u, Sen, biz, Ular, bu, kim, oʻzi, Siz, men, qaysisi
- PROPN: Deniz, Oysha, Meri, Piter, Fransiya, Braun, Iguazu, Jeyn, Sem, Smit
- VERB-Vnoun: chekish
Degree and Polarity
- Cmp
- ADJ: chiroyliroq, zoʻrroq
- Neg
- AUX: emas, emasdi, yoʻq, emasmi, emasmidi
- VERB: bilmaydi, koʻrmay, olmaydi, qolmadi, turmaklamadi, tushunmaydi, gapirma, kelmagan, ketmasdan, olmadim
- VERB-Conv: koʻrmay, ketmasdan
- VERB-Fin: kelmagan, oʻqimagan
- VERB-Part: olmaydigan
- VERB-Vnoun: oʻqimasligi
Verbal Features
- Prog
- VERB: oʻqiyapti, qarayapsan, gaplashayotganingda, oʻqilyapti, qilinayotganda, solardi, uxlayapti, yogʻyapti
- VERB-Fin: yogʻyapti
- Cnd
- VERB: uxlasa, qolsa, uxlaganida
- Imp
- VERB: gapirma, och, qovuring, qoʻy, tugat
- VERB-Fin: och, qovuring
- Ind
- AUX: boʻladi, boʻlgandi
- AUX-Fin: boʻlgandi
- VERB: ketdi, oldi, oʻqiyapti, qildi, uxladi, berdi, bilmaydi, boʻladi, ketgan, olmaydi
- VERB-Fin: ketdi, qildi, uxladi, berdi, ketgan, oʻylaysan, bergan, boʻlgan, changlanadi, kelmagan
- VERB-Part: uxlagan
- Int
- AUX: edimi, ekanmi, emasmi, emasmidi
- VERB: berdimi, istaysanmi, boʻladimi, keldimi, kelganmidi, olasanmi, olasizmi, tushundingizmi
- VERB-Fin: olasanmi
- Irr
- VERB: boʻlardik
- Fut
- AUX: boʻladi
- VERB: boʻladi, boʻladimi, kechikadi, kelasiz, kutaman, olasizmi, oʻqimoqchi, oʻqimoqchiligini, qoladi, uxlaydi
- VERB-Vnoun: oʻqimoqchiligini
- Past
- AUX: edi, emasdi, boʻlgandi, edimi, ekanmi, emasmidi
- AUX-Fin: boʻlgandi
- VERB: berdimi, ketdi, oldi, qildi, uxladi, berdi, bilmaydi, ketgan, oʻsgan, qoldi
- VERB-Fin: ketdi, qildi, uxladi, berdi, ketgan, bergan, boʻlgan, kelmagan, oldi, oʻqimagan
- VERB-Part: uxlagan, tushungani
- Pres
- VERB: oʻqiyapti, istaysanmi, olmaydi, oʻylaysan, qarayapsan, tushunmaydi, aytaman, changlanadi, gapirma, koʻradi
- VERB-Fin: oʻylaysan, changlanadi, koʻradi, och, olasanmi, osonlashtiradi, oʻqiydi, xohlaydi, yogʻyapti
- Cau
- VERB: yuvdirdi
- Pass
- VERB: oʻqilyapti, oʻqitiladi, qilinayotganda, qilingan, topshirildi
- VERB-Fin: qilingan
Pronouns, Determiners, Quantifiers
- Dem
- DET: bu, oʻsha, shunday
- PRON: Buning, bu, shuki, shunday, shundan, shuni
- Int
- ADV: qachon
- PRON: kim, nimaga, qanday, qaysisi
- Neg
- DET: hech
- PRON: Hechqisi
- Prs
- PRON: u, Sen, biz, Mening, Ular, oʻzi, Senga, Siz, Uning, men
- Tot
- DET: barcha
- Card
- NUM: uch, beshta, ikki, uchta
- Yes
- NOUN: Onasining, onasini, poytaxti, ukasi, Erim, Kardiganim, akasi, birodarini, buvisi, dadam
- PRON: senikidan
- PROPN: Deniznikining
- 1
- PRON: biz, Mening, men
- VERB: aytaman, borganimizda, boʻlardik, kechtirishimiz, kutaman, olmadim, uygʻotishimiz
- VERB-Vnoun: kechtirishimiz, uygʻotishimiz
- 2
- PRON: Sen, Senga, Siz, senikidan
- VERB: istaysanmi, oʻylaysan, qarayapsan, gapirma, gaplashayotganingda, kelasiz, olasizmi, qovuring, qoʻy, tugat
- VERB-Fin: oʻylaysan, qovuring
- 3
- AUX: boʻladi, boʻlgandi, ekanmi
- AUX-Fin: boʻlgandi
- PRON: u, Ular, oʻzi, Uning, shundan, ularning
- VERB: berdimi, ketdi, oldi, oʻqiyapti, qildi, uxladi, berdi, bilmaydi, boʻladi, ketgan
- VERB-Fin: ketdi, qildi, uxladi, berdi, ketgan, bergan, boʻlgan, changlanadi, kelmagan, koʻradi
- VERB-Part: uxlagan, oʻqiganini, tushungani, yugurgani
- VERB-Vnoun: turmaklashi, oʻqimoqchiligini
Other Features
Syntax
Auxiliary Verbs and Copula
- This corpus uses 4 lemmas as copulas (cop). Examples: edi, emas, ekan, emish.
- This corpus uses 4 lemmas as auxiliaries (aux). Examples: boʻl, kerak, mumkin, yoʻq.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Loc (1)
- VERB--NOUN-Nom (10)
- VERB--PRON-Nom (10)
- VERB-Conv--NOUN-Nom (1)
- VERB-Fin--NOUN-Nom (6)
- VERB-Fin--PRON-Nom (4)
- VERB-Part--NOUN-Nom (1)
- VERB-Part--PRON-Nom (3)
- VERB-Vnoun--NOUN-Gen (2)
- VERB-Vnoun--NOUN-Nom (1)
- VERB-Vnoun--PRON-Nom (2)
- obj
- VERB--NOUN-Acc (18)
- VERB--NOUN-Nom (9)
- VERB--PRON-Acc (2)
- VERB-Conv--NOUN-Acc (2)
- VERB-Conv--NOUN-Nom (3)
- VERB-Fin--NOUN-Acc (7)
- VERB-Fin--NOUN-Nom (4)
- VERB-Part--NOUN-Nom (1)
- VERB-Part--PRON-Acc (2)
- VERB-Vnoun--NOUN-Acc (3)
- VERB-Vnoun--NOUN-Nom (6)
- VERB-Vnoun--PRON-Acc (1)
Relations Overview
- This corpus uses 5 relation subtypes: compound:lvc, compound:redup, compound:svc, nmod:poss, nsubj:pass
- The following 11 relation types are not used in this corpus at all: iobj, expl, dislocated, appos, clf, fixed, list, orphan, goeswith, reparandum, dep