UD Ottoman Turkish TueCL
Language: Ottoman Turkish (code: ota)
Family: Turkic
This treebank has been part of Universal Dependencies since the UD v2.18 release.
The following people have contributed to making this treebank part of UD: Enes Yılandiloğlu.
Repository: UD_Ottoman_Turkish-TueCL
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.18
License: CC BY-SA 4.0
Genre: grammar-examples
Questions, comments? General annotation questions (either Ottoman Turkish-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [enes • yilandiloglu (æt) helsinki • fi]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually |
| UPOS | annotated manually, natively in UD style |
| XPOS | not available |
| Features | annotated manually, natively in UD style |
| Relations | annotated manually, natively in UD style |
Description
The Ottoman Turkish-TueCL treebank is part of a parallel Universal Dependencies corpus containing 148 sentences across five Turkic languages (Turkish, Azerbaijani, Kyrgyz, Uzbek, and Ottoman Turkish), designed to facilitate cross-linguistic research on these related languages.
The Ottoman Turkish-TueCL treebank consists of 148 carefully selected sentences (929 tokens) compiled from multiple sources, including the Cairo corpus (20 sentences), the UDTW23 corpus (20 sentences), and 97 additional examples illustrating specific grammatical constructions of interest. It serves as the source treebank for a parallel corpus spanning four Turkic languages from distinct branches of the family: Turkish, Ottoman Turkish, and Azerbaijani (Oghuz), Kyrgyz (Kipchak), and Uzbek (Karluk).
The treebank includes various syntactic phenomena relevant to Turkic languages, such as pro-drop constructions, auxiliary chains, postverbal structures, and non-canonical word orders. Each sentence has been manually annotated following UD guidelines, with particular attention to morphosyntactic features that highlight both shared typological characteristics and language-specific traits. English translations are provided as metadata to support comparative research.
This resource is significant as it represents the first fully aligned parallel UD treebanks for these Turkic languages, enabling systematic cross-linguistic comparisons previously hindered by the lack of parallel resources. The treebank supports research in comparative Turkic syntax, cross-lingual parsing, and language education.
Acknowledgments
Statistics of UD Ottoman Turkish TueCL
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – VERB
Features
Aspect – Case – Definite – Evident – Gender – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – aux – aux:q – case – cc – ccomp – compound – compound:lvc – compound:redup – conj – cop – csubj – det – discourse – fixed – flat – mark – nmod – nmod:poss – nsubj – nsubj:outer – nsubj:pass – nummod – obj – obl – obl:agent – obl:tmod – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 148 sentences, 908 tokens and 929 syntactic words.
- This corpus contains 169 tokens (19%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 5 types of words that contain both letters and punctuation. Examples: pāy-ı, hem-sāyesi, vaḳt-i, Ḫayāl-i, ‘Umūmiyeten
- This corpus contains 20 multi-word tokens. On average, one multi-word token consists of 2.05 syntactic words.
- There are 18 types of multi-word tokens. Examples: degildi, nedense, Deñiziñkiniñ, degilmiş, evdeki, evdekininki, evdeydi, filmdi, hemşīreyidi, içündi, kütübḫānedekiler, maṭbaḫınkini, oḳumasıydı, seniñkinden, sāʿāttir, yoḳdu, yoḳmuş, ṭālebedür.
Morphology
Tags
- This corpus uses 14 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: PART, SYM, X
- This corpus contains 14 lemmas tagged as pronouns (PRON): ben, birbiri, biz, bu, bura, kendi, kendü, ki, kim, ne, nere, o, ol, sen
- This corpus contains 5 lemmas tagged as determiners (DET): bir, bu, bütün, ne, o
- Out of the above, 3 lemmas occurred sometimes as PRON and sometimes as DET: bu, ne, o
- This corpus contains 5 lemmas tagged as auxiliaries (AUX): degil, dur, i, mi, ol
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: ol
- There are 4 (de)verbal forms:
- Conv
- AUX: olaraḳ
- VERB: alub, açıp, baḳub, eyleyüb, oḳuyarak, unutub, gitmeden, olınırken, pembeleşinceye, ḳonuşurken
- Fin
- AUX: durdı, idi
- VERB: eyledi, eyler, anlatıyor, açıḳlanmış, ediyorum, etmemiş, gelecekdi, gitti, götürdi, itme
- Part
- AUX: olduġını, olmayan
- VERB: Oḳudıḳlarını, eyledigini, Oḳuduġunuzu, bilmiş, erişilebilir, itdügi, itmiş, oḳuyacaḳlarını, oḳuyan, uyumuş
- Vnoun
- AUX: olmayı
- VERB: oḳumayı, etmege, gitmegi, içmegi, oḳumak, oḳuması, yapmayı, olmaması, oḳumaması, oḳumasını
Nominal Features
- Fem
- NOUN: Eṭfāle, Netaʾic, Refīḳasına, ahdāfı, eşcārı, vālidesi, vālidesini, ṭabіbe
- Plur
- ADJ: ḫālīlerinde
- AUX: muydunuz
- NOUN: Eṭfāle, Gençlere, Netaʾic, Soġanları, ahdāfı, aylarında, dīnler, dōstlarundan, eşcārı, kiler
- PRON: Anlar, birbirlerini, bizimle, buralara
- VERB: Oḳudıḳlarını, bilmiyorlar, ederiz, etdiler, ettirmeliyiz, eyleyecektik, oḳuyacaḳlarını, ḳavurun, ḳucaḳladılar
- VERB-Part: Oḳudıḳlarını, oḳuyacaḳlarını
- Sing
- ADJ: maʾīsi, maʾīyi
- AUX: mi, idi, di, misin, mı, olacaḳ, miydi, olduġını, olmadı, olmalıydı
- AUX-Fin: durdı, idi
- AUX-Part: olduġını
- AUX-Vnoun: olmayı
- NOUN: evde, kitāb, kitābı, mektebe, ṣabāḥ, eve, çocuḳ, Muʿallim, ekmek, taḥrīr
- PRON: O, Sen, baña, Bunuñ, kimin, neye, Benim, Benüm, Ol, Saña
- PROPN: Deñiz, Ayḥana, Deñizin, ʿAyşe, Mary, Peter, Fransanıñ, Parisde, Brown, Deñiziñ
- VERB: verdi, eyledi, aldı, istiyor, oḳumayı, oḳuyor, seviyor, uyursa, ediyorsun, ediyorum
- VERB-Fin: eyledi, eyler, anlatıyor, açıḳlanmış, ediyorum, etmemiş, gelecekdi, gitti, götürdi, itme
- VERB-Part: eyledigini, Oḳuduġunuzu, oḳuyan, vardıġımızda, yaġdıġını
- VERB-Vnoun: oḳumayı, etmege, gitmegi, içmegi, oḳumak, oḳuması, yapmayı, oḳumaması, oḳumasını, uyandırmamız
- Abl
- NOUN: dōstlarundan, odadan, restorandan, yemekden, ḳardeşinden
- PRON: andan, benden, seniñ
- PROPN: Peterden
- Acc
- ADJ: maʾīyi
- AUX-Part: olduġını
- AUX-Vnoun: olmayı
- NOUN: kitābı, annesini, zülfünü, ʿarabayı, Soġanları, Yarıñı, ahdāfı, anasını, aḫşamları, penceresini
- PRON: birbirlerini, bunı, kini
- VERB: Oḳudıḳlarını, oḳumayı, eyledigini, gelebilecegini, içmegi, yapmayı, Oḳuduġunuzu, oḳumasını, oḳuyacaḳlarını, uyumasını
- VERB-Part: Oḳudıḳlarını, eyledigini, Oḳuduġunuzu, oḳuyacaḳlarını, yaġdıġını
- VERB-Vnoun: oḳumayı, içmegi, yapmayı, oḳumasını, uyumasını, uyuyacaġını
- Dat
- NOUN: mektebe, eve, zevcine, Eṭfāle, Gençlere, Refīḳasına, birāderine, dünyāya, dōstına, çocuḳlara
- PRON: baña, neye, Saña, buralara, kendine, kendüsine
- PROPN: Ayḥana
- VERB-Conv: pembeleşinceye
- VERB-Vnoun: etmege, gitmegi, yapmasına, Çözmeye
- Gen
- NOUN: Annesiniñ, Evin, arḳadaşınıñ, kinin, maṭbaḫın, odasının, pederiniñ, vālidesi, çocuġun, ḫalḳıñ
- PRON: Bunuñ, kimin, Benim, Benüm, kiniñ
- PROPN: Deñizin, Fransanıñ, Deñiziñ, Peterin, Ḫāḳanın
- Ins
- NOUN: dōstınıla, gözle, iple, ḳardeşiyle
- PRON: bizimle
- Loc
- ADJ: ḫālīlerinde
- NOUN: evde, evdeki, kütübḫānede, mektebde, vaḳtinde, Marketde, Masada, aylarında, dāʾirede, kütübhānede
- PROPN: Parisde
- VERB-Part: vardıġımızda
- Nom
- ADJ: maʾīsi
- AUX: degil
- NOUN: kitāb, ṣabāḥ, çocuḳ, Muʿallim, ekmek, taḥrīr, terk, zann, alḳol, birāderi
- PRON: O, Sen, Anlar, Ol, kendi
- PROPN: Deñiz, ʿAyşe, Mary, Peter, Brown, Jane, Mayıs, Nīsān, Sam, Smith
- VERB-Part: oḳuyan
- VERB-Vnoun: oḳumak, oḳuması, oḳumaması, uyandırmamız
- Def
- DET: o, Bu
- Ind
- DET: bir
Degree and Polarity
- Neg
- ADJ: yoḳ, nāmevcūd
- AUX: degil, degül, olmadı, olmayan
- AUX-Part: olmayan
- NOUN: kitābsız
- VERB: anlamıyor, bilmiyorlar, görmemiş, yapmadı, baḳamaz, etmemiş, gitmeden, itme, olmaması, oḳumaması
- VERB-Conv: gitmeden
- VERB-Fin: etmemiş, itme, temizlememişdi
- VERB-Vnoun: olmaması, oḳumaması
- Pos
- NOUN: evde, ṭālebe
- VERB-Fin: eyler, eyledi
Verbal Features
- Hab
- VERB: eyler, oḳur, baḳamaz, ederiz, erişilebilir, eyledi, gelir, tozlaşır, uyuyamayabilir, virir
- VERB-Fin: eyler, eyledi, virir
- VERB-Part: erişilebilir
- Imp
- AUX: se, olsaydı
- VERB: uyursa, ettirmeliyiz, olunabilir, olınırken, ḳonuşurken
- VERB-Conv: olınırken, ḳonuşurken
- Perf
- AUX: idi, di, olacaḳ, miydi, olmadı, olmalıydı, du, durdı, miymiş, miş
- AUX-Fin: durdı, idi
- VERB: verdi, aldı, eyledi, uyumuş, gelebilecegini, gitdi, gitmiş, görmemiş, götürdi, uyudu
- VERB-Fin: eyledi, açıḳlanmış, etmemiş, gitti, götürdi, temizlememişdi, temizlemiş, uyumış, çalmışdı
- VERB-Part: bilmiş, itdügi, itmiş, uyumuş, yapdıġı, çaluşduġımız, ḳalacaḳ
- VERB-Vnoun: olmaması, uyuyacaġını
- Prog
- VERB: istiyor, oḳuyor, seviyor, anlamıyor, anlıyor, bilmiyorlar, ediyorsun, ediyorum, eyliyorsun, yapıyor
- VERB-Fin: anlatıyor, ediyorum, seviyor, söylüyorum, yapıyordı
- Prosp
- VERB: eyleyecektik, gelecekdi
- VERB-Fin: gelecekdi
- Cnd
- AUX: se, olsaydı
- VERB: uyursa
- Gen
- AUX: dür, midir, tir
- VERB: oḳur, ederiz, gelir, tozlaşır, virir, virür, ḳalur
- VERB-Fin: virir
- GenPot
- VERB: baḳamaz, erişilebilir
- VERB-Part: erişilebilir
- Imp
- AUX: ol
- VERB: Boşvir, aç, bitir, itme, vir, ḳavurun
- VERB-Fin: itme
- Ind
- AUX: idi, di, olacaḳ, miydi, olmadı, du, durdı, miş, muydunuz, muş
- AUX-Fin: durdı, idi
- VERB: verdi, eyledi, aldı, istiyor, oḳuyor, seviyor, uyumuş, anlamıyor, anlıyor, bilmiyorlar
- VERB-Conv: alub, olınırken, ḳonuşurken
- VERB-Fin: eyledi, eyler, anlatıyor, açıḳlanmış, ediyorum, etmemiş, gelecekdi, gitti, götürdi, seviyor
- VERB-Part: bilmiş, itdügi, itmiş, uyumuş, yapdıġı, çaluşduġımız
- VERB-Vnoun: olmaması, uyuyacaġını
- Nec
- AUX: olmalıydı
- VERB: ettirmeliyiz
- Pot
- VERB: gelebilecegini, olunabilir, uyduramadım, uyuyamayabilir, uyuyamıyor
- Fut
- AUX: olacaḳ
- VERB: gelebilecegini, ḳalacaḳ, gerekecek, oḳutdurulacak, oḳuyacaḳlarını, uyuyacaġını, yapılacaḳ
- VERB-Part: oḳuyacaḳlarını, ḳalacaḳ
- VERB-Vnoun: uyuyacaġını
- Fut,Past
- VERB: eyleyecektik, gelecekdi
- VERB-Fin: gelecekdi
- Past
- AUX: idi, di, miydi, olduġını, olmadı, olmalıydı, du, durdı, miymiş, miş
- AUX-Fin: durdı, idi
- AUX-Part: olduġını
- VERB: verdi, Oḳudıḳlarını, aldı, eyledi, uyumuş, eyledigini, gitdi, gitmiş, görmemiş, götürdi
- VERB-Fin: eyledi, açıḳlanmış, etmemiş, gitti, götürdi, temizlemiş, uyumış, yapıyordı
- VERB-Part: Oḳudıḳlarını, eyledigini, Oḳuduġunuzu, bilmiş, itdügi, itmiş, uyumuş, vardıġımızda, yapdıġı, yaġdıġını
- Pqp
- VERB: etmişmiş, temizlememişdi, uyumuştu, çalmışdı
- VERB-Fin: temizlememişdi, çalmışdı
- Pres
- AUX: se, mi, misin, mü, olmayan
- AUX-Part: olmayan
- VERB: istiyor, oḳuyor, seviyor, uyursa, anlamıyor, anlıyor, bilmiyorlar, ediyorsun, ediyorum, eyler
- VERB-Conv: olınırken
- VERB-Fin: eyler, anlatıyor, ediyorum, eyledi, seviyor, söylüyorum, virir
- VERB-Part: oḳuyan
- VERB-Vnoun: olmaması
- Cau
- VERB: bitir, ettiriyordu, ettirmeliyiz, uyandırmamız, uyduramadım, ḳolaylaştırıyor
- VERB-Vnoun: uyandırmamız
- CauCau
- VERB: yıḳattırdı
- CauPass
- VERB: oḳutdurulacak, uyutıldı
- Pass
- VERB: açıḳlanmış, erişilebilir, iletüldi, olunabilir, olınırken, oḳunuyor, yapılacaḳ, ṣunuldu
- VERB-Conv: olınırken
- VERB-Fin: açıḳlanmış
- VERB-Part: erişilebilir
- Fh
- AUX: idi, di, olacaḳ, miydi, olmadı, olmalıydı, du, durdı, muydunuz, oldu
- AUX-Fin: durdı, idi
- VERB: verdi, aldı, eyledi, istiyor, oḳuyor, seviyor, uyursa, anlamıyor, anlıyor, bilmiyorlar
- VERB-Conv: olınırken
- VERB-Fin: eyledi, anlatıyor, ediyorum, gelecekdi, seviyor, söylüyorum, virir, yapıyordı
- VERB-Part: erişilebilir
- VERB-Vnoun: uyuyacaġını
- Nfh
- AUX: se, miymiş, miş, muş
- VERB: uyumuş, gitmiş, görmemiş, açıḳlanmış, bilmiş, etmemiş, etmişmiş, gelmiş, görmüş, itmiş
- VERB-Fin: açıḳlanmış, etmemiş, temizlememişdi, temizlemiş, uyumış, çalmışdı
- VERB-Part: bilmiş, itmiş, uyumuş
Pronouns, Determiners, Quantifiers
- Art
- DET: bir
- Dem
- DET: bu, o
- PRON: Bunuñ, Ol, andan, bunı, kini
- Int
- AUX: mi, mı, misin, miydi, midir, miymiş, mu, muydunuz
- DET: ne
- PRON: kimin, nerede, neye
- Prs
- PRON: O, Sen, baña, Anlar, Benim, Benüm, Saña, benden, bizimle, seniñ
- Rcp
- PRON: birbirlerini
- Card
- NUM: üç, beş, bir, iki
- Yes
- PRON: kendi, kendine, kendüsine
- 1
- PRON: baña, Benim, Benüm, benden, bizimle
- VERB: ediyorum, ederiz, ettirmeliyiz, eyleyecektik, söylüyorum, uyduramadım, çekiyorum
- VERB-Fin: ediyorum, söylüyorum
- 2
- AUX: misin, muydunuz, ol
- PRON: Sen, Saña, seniñ
- VERB: ediyorsun, eyliyorsun, Boşvir, aç, bitir, geliyorsun, itme, vir, ḳavurun
- VERB-Fin: itme
- 3
- AUX: mi, idi, di, mı, olacaḳ, miydi, olmadı, olmalıydı, se, du
- AUX-Fin: durdı, idi
- NOUN: Refīḳasına, ẓann
- PRON: O, Anlar, Bunuñ, Ol, andan, bunı, kendi, kendine, kinden
- VERB: verdi, eyledi, aldı, istiyor, oḳuyor, seviyor, uyursa, bilmiyorlar, eyler, gitdi
- VERB-Fin: eyledi, eyler, anlatıyor, açıḳlanmış, etmemiş, gelecekdi, gitti, götürdi, seviyor, temizlememişdi
- Plur
- NOUN: tekāmülleri
- PRON: birbirlerini
- VERB-Part: Oḳuduġunuzu, vardıġımızda, çaluşduġımız
- VERB-Vnoun: uyandırmamız
- Sing
- ADJ: maʾīsi, ḫālīlerinde
- AUX-Part: olduġını
- NOUN: annesini, birāderi, taḫtı, zevcine, zülfünü, Anneannesi, Annesiniñ, Refīḳasına, Zevcim, anasını
- PRON: kendüsine, kinden, kiniñ
- VERB: Oḳudıḳlarını, eyledigini, gelebilecegini, oḳuması, itdügi, olmaması, oḳumaması, oḳumasını, oḳuyacaḳlarını, uyumasını
- VERB-Part: Oḳudıḳlarını, eyledigini, itdügi, oḳuyacaḳlarını, yapdıġı, yaġdıġını
- VERB-Vnoun: oḳuması, olmaması, oḳumaması, oḳumasını, uyumasını, uyuyacaġını, yapmasına
Other Features
- Person[psor]
- 1
- NOUN: Zevcim, babam, ʿarabam, Ḥırḳam
- VERB-Part: vardıġımızda, çaluşduġımız
- VERB-Vnoun: uyandırmamız
- 2
- NOUN: dōstınıla, Çocuġun
- PRON: kinden
- VERB: gelebilecegini, Oḳuduġunuzu
- VERB-Part: Oḳuduġunuzu
- 3
- ADJ: maʾīsi, ḫālīlerinde
- AUX-Part: olduġını
- NOUN: annesini, birāderi, taḫtı, vaḳtinde, zevcine, zülfünü, Anneannesi, Annesiniñ, Refīḳasına, anasını
- PRON: birbirlerini, kendüsine, kiniñ
- VERB-Part: Oḳudıḳlarını, eyledigini, itdügi, oḳuyacaḳlarını, yapdıġı, yaġdıġını
- VERB-Vnoun: oḳuması, olmaması, oḳumaması, oḳumasını, uyumasını, uyuyacaġını, yapmasına
- 1
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: i.
- This corpus uses 4 lemmas as auxiliaries (aux). Examples: degil, ol, dur, i.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Nom (10)
- VERB--PRON-Nom (11)
- VERB-Conv--NOUN-Nom (1)
- VERB-Fin--NOUN-Nom (6)
- VERB-Fin--PRON-Nom (2)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--NOUN-Nom (1)
- VERB-Vnoun--NOUN-Gen (2)
- VERB-Vnoun--NOUN-Nom (2)
- obj
- VERB--NOUN-Acc (22)
- VERB--NOUN-Nom (11)
- VERB--PRON-Acc (1)
- VERB-Conv--NOUN-Acc (2)
- VERB-Conv--NOUN-Nom (2)
- VERB-Fin--NOUN-Acc (4)
- VERB-Fin--NOUN-Nom (3)
- VERB-Fin--PRON-Acc (2)
- VERB-Vnoun--NOUN-Acc (1)
- VERB-Vnoun--NOUN-Nom (9)
Relations Overview
- This corpus uses 9 relation subtypes: advmod:emph, aux:q, compound:lvc, compound:redup, nmod:poss, nsubj:outer, nsubj:pass, obl:agent, obl:tmod
- The following 9 relation types are not used in this corpus at all: iobj, expl, dislocated, appos, clf, list, goeswith, reparandum, dep