UD Turkish TueCL
Language: Turkish (code: tr)
Family: Turkic
This treebank has been part of Universal Dependencies since the UD v2.16 release.
The following people have contributed to making this treebank part of UD: Furkan Akkurt, Çağrı Çöltekin.
Repository: UD_Turkish-TueCL
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.17
License: CC BY-SA 4.0
Genre: grammar-examples
Questions, comments? General annotation questions (either Turkish-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [furkanakkurt7242 (æt) icloud • com]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually |
| UPOS | annotated manually, natively in UD style |
| XPOS | not available |
| Features | annotated manually, natively in UD style |
| Relations | annotated manually, natively in UD style |
Description
The Turkish-TueCL treebank is part of a parallel Universal Dependencies corpus containing 148 sentences across four Turkic languages (Turkish, Azerbaijani, Kyrgyz, and Uzbek), designed to facilitate cross-linguistic research on these related languages.
The Turkish-TueCL treebank consists of 148 carefully selected sentences (904 tokens) compiled from multiple sources, including the Cairo corpus (20 sentences), the UDTW23 corpus (20 sentences), and 97 additional examples illustrating specific grammatical constructions of interest. It serves as the source treebank for a parallel corpus spanning four Turkic languages from distinct branches of the family: Turkish and Azerbaijani (Oghuz), Kyrgyz (Kipchak), and Uzbek (Karluk).
The treebank includes various syntactic phenomena relevant to Turkic languages, such as pro-drop constructions, auxiliary chains, postverbal structures, and non-canonical word orders. Each sentence has been manually annotated following UD guidelines, with particular attention to morphosyntactic features that highlight both shared typological characteristics and language-specific traits. English translations are provided as metadata to support comparative research.
This resource is significant as it represents the first fully aligned parallel UD treebanks for these Turkic languages, enabling systematic cross-linguistic comparisons previously hindered by the lack of parallel resources. The treebank supports research in comparative Turkic syntax, cross-lingual parsing, and language education.
References
Please, cite the following paper if you use Turkish-TueCL UD treebank:
@inproceedings{akhundjanova-etal-2025-parallel,
title = "Parallel {U}niversal {D}ependencies Treebanks for {T}urkic Languages",
author = "Akhundjanova, Arofat and
Akkurt, Furkan and
Chontaeva, Bermet and
Eslami, Soudabeh and
Coltekin, Cagri",
editor = {Bouma, Gosse and
{\c{C}}{\"o}ltekin, {\c{C}}a{\u{g}}r{\i}},
booktitle = "Proceedings of the Eighth Workshop on Universal Dependencies (UDW, SyntaxFest 2025)",
month = aug,
year = "2025",
address = "Ljubljana, Slovenia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2025.udw-1.14/",
pages = "129--136",
ISBN = "979-8-89176-292-3",
abstract = "We introduce the first fully aligned and manually annotated parallel Universal Dependencies (UD) treebanks for four Turkic languages: Azerbaijani, Kyrgyz, Turkish, and Uzbek. These resources currently consist of 148 strategically selected sentences that illustrate typologically significant morphosyntactic phenomena across these related yet distinct languages. These parallel treebanks enable systematic comparative studies of Turkic syntax and may be instrumental in cross-lingual NLP applications. All treebanks are available as part of UD v2.16."
}
Acknowledgments
This work was supported by COST Action CA21167 - Universality, diversity and idiosyncrasy in language technology (UniDive). We thank the Turkic UD working group for fruitful discussions of linguistic issues and annotation approaches.
Statistics of UD Turkish TueCL
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – VERB
Features
Aspect – Case – Definite – Evident – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – aux – aux:q – case – cc – ccomp – compound – compound:lvc – compound:redup – conj – cop – csubj – det – discourse – fixed – flat – mark – nmod – nmod:poss – nsubj – nsubj:outer – nsubj:pass – nummod – obj – obl – obl:agent – obl:tmod – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 148 sentences, 883 tokens and 904 syntactic words.
- This corpus contains 169 tokens (19%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 6 types of words that contain both letters and punctuation. Examples: Ayhan'a, Deniz'in, Paris'te, Hakan'ın, Peter'den, Peter'in
- This corpus contains 20 multi-word tokens. On average, one multi-word token consists of 2.05 syntactic words.
- There are 18 types of multi-word tokens. Examples: değildi, nedense, Deniz'inkinin, değilmiş, evdeki, evdekininki, evdeydi, filmdi, hemşireydi, içindi, kitaplıktakiler, mutfağınkini, okumasıydı, saattir, seninkinden, yokmuş, yoktu, öğrencidir.
Morphology
Tags
- This corpus uses 14 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: PART, SYM, X
- This corpus contains 12 lemmas tagged as pronouns (PRON): ben, birbiri, biz, bu, bura, kendi, ki, kim, ne, nere, o, sen
- This corpus contains 5 lemmas tagged as determiners (DET): bir, bu, bütün, ne, o
- Out of the above, 3 lemmas occurred sometimes as PRON and sometimes as DET: bu, ne, o
- This corpus contains 5 lemmas tagged as auxiliaries (AUX): değil, dur, i, mi, ol
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: ol
- There are 4 (de)verbal forms:
- Conv
- AUX: olarak
- VERB: unutup, alıp, açıp, bakıp, okuyarak, duyurulurken, gitmeden, konuşurken, pembeleşinceye
- Fin
- AUX: durdu, idi
- VERB: anlatıyor, açıklanmış, bahsetme, gelecekti, gitti, götürdü, okumamış, seviyor, söylüyorum, temizlememişti
- Part
- AUX: olduğunu, olmayan
- VERB: Okuduklarını, yazdığını, Okuduğunuzu, bilmiş, erişilebilir, ettiği, kalacak, okuyacaklarını, okuyan, uyumuş
- Vnoun
- AUX: olmayı
- VERB: okumayı, bırakmayı, gitmek, içmeyi, okumak, okuması, yapmayı, okumaması, okumasını, olmaması
Nominal Features
- Plur
- AUX: muydunuz
- NOUN: çocuklara, Gençlere, Sonuçlar, Soğanları, arkadaşlarından, aylarında, ağaçları, dinler, gelişimleri, hedefleri
- PRON: Onlar, birbirlerini, bizimle, buralara
- VERB: Okuduklarını, bilmiyorlar, ettirmeliyiz, hallederiz, izleyecektik, kavurun, kucakladılar, okuyacaklarını, çıktılar
- VERB-Part: Okuduklarını, okuyacaklarını
- Sing
- ADJ: mavisi, maviyi
- AUX: mi, idi, di, mı, olacak, miydi, misin, musun, mü, olduğunu
- AUX-Fin: durdu, idi
- AUX-Part: olduğunu
- AUX-Vnoun: olmayı
- NOUN: evde, kitap, kitabı, okula, sabah, annesini, eve, çocuk, doktor, ekmek
- PRON: O, Sen, bana, Benim, Bunun, kimin, neye, Sana, benden, bunu
- PROPN: Deniz, Ayhan'a, Deniz'in, Ayşe, Mary, Peter, Fransanın, Paris'te, Brown, Hakan'ın
- VERB: verdi, istiyor, aldı, gitti, okumayı, okuyor, seviyor, uyudu, uyursa, bakıyorsun
- VERB-Fin: anlatıyor, açıklanmış, bahsetme, gelecekti, gitti, götürdü, okumamış, seviyor, söylüyorum, temizlememişti
- VERB-Part: yazdığını, Okuduğunuzu, okuyan, vardığımızda, yağdığını
- VERB-Vnoun: okumayı, bırakmayı, gitmek, içmeyi, okumak, okuması, yapmayı, okumaması, okumasını, uyandırmamız
- Abl
- NOUN: arkadaşlarından, kardeşinden, odadan, restorandan, yemekten
- PRON: benden, ondan, senin
- PROPN: Peter'den
- Acc
- ADJ: maviyi
- AUX-Part: olduğunu
- AUX-Vnoun: olmayı
- NOUN: kitabı, annesini, arabayı, saçını, Soğanları, Yarını, akşamları, hedefleri, kapıyı, penceresini
- PRON: birbirlerini, bunu, kini
- VERB: Okuduklarını, okumayı, bırakmayı, gelebileceğini, içmeyi, yapmayı, yazdığını, Okuduğunuzu, okumasını, okuyacaklarını
- VERB-Part: Okuduklarını, yazdığını, Okuduğunuzu, okuyacaklarını, yağdığını
- VERB-Vnoun: okumayı, bırakmayı, içmeyi, yapmayı, okumasını, uyumasını, uyuyacağını
- Dat
- NOUN: okula, eve, arkadaşına, kocasına, çocuklara, Gençlere, dünyaya, hizmetine, kardeşine
- PRON: bana, neye, Sana, buralara, kendine, kendisine
- PROPN: Ayhan'a
- VERB-Conv: pembeleşinceye
- VERB-Vnoun: yapmasına, Çözmeye
- Gen
- NOUN: Annesinin, Evin, arkadaşının, babasının, halkın, kinin, mutfağın, odasının, çocuğun
- PRON: Benim, Bunun, kimin, kinin
- PROPN: Deniz'in, Fransanın, Hakan'ın, Peter'in
- Ins
- NOUN: arkadaşınla, gözle, iple, kardeşiyle
- PRON: bizimle
- Loc
- NOUN: evde, kitaplıkta, evdeki, odada, okulda, zamanında, Markette, Masada, aylarında, ofiste
- PROPN: Paris'te
- VERB-Part: vardığımızda
- Nom
- ADJ: mavisi
- ADV: Bugün, saat
- AUX: değil
- NOUN: kitap, sabah, çocuk, doktor, ekmek, Öğretmen, alkol, araba, başkenti, bisiklet
- PRON: O, Sen, Onlar, kendi
- PROPN: Deniz, Ayşe, Mary, Peter, Brown, Jane, Mayıs, Nisan, Sam, Smith
- VERB-Part: okuyan
- VERB-Vnoun: gitmek, okumak, okuması, okumaması, uyandırmamız
- Def
- DET: o, Bu
- Ind
- DET: bir
Degree and Polarity
- Neg
- ADJ: yok
- AUX: değil, olmadı, olmayan
- AUX-Part: olmayan
- NOUN: kitapsız
- VERB: anlamıyor, bilmiyorlar, görmemiş, yapmadı, bahsetme, bakamaz, gitmeden, okumaması, okumamış, olmaması
- VERB-Conv: gitmeden
- VERB-Fin: bahsetme, okumamış, temizlememişti
- VERB-Vnoun: okumaması, olmaması
- Pos
- NOUN: evde, öğrenci
Verbal Features
- Hab
- VERB: okur, verir, bakamaz, erişilebilir, gelir, hallederiz, kalır, tozlaşır, uyuyamayabilir
- VERB-Fin: verir
- VERB-Part: erişilebilir
- Imp
- AUX: se, olsaydı
- VERB: uyursa, duyurulurken, ettirmeliyiz, konuşurken, seçilebilir
- VERB-Conv: duyurulurken, konuşurken
- Perf
- AUX: idi, di, olacak, miydi, olmadı, olmalıydı, ydi, durdu, miymiş, miş
- AUX-Fin: durdu, idi
- VERB: verdi, uyumuş, aldı, gitti, uyudu, büyüdü, denedi, gelebileceğini, gitmiş, görmemiş
- VERB-Fin: açıklanmış, gitti, götürdü, okumamış, temizlememişti, temizlemiş, uyumuş, çalmıştı
- VERB-Part: bilmiş, ettiği, kalacak, uyumuş, yaptığı, çalıştığımız, şaşırmış
- VERB-Vnoun: olmaması, uyuyacağını
- Prog
- VERB: istiyor, okuyor, seviyor, anlamıyor, anlıyor, bakıyorsun, bilmiyorlar, yapıyor, zannediyorsun, zannediyorum
- VERB-Fin: anlatıyor, seviyor, söylüyorum, yapıyordu
- Prosp
- VERB: gelecekti, izleyecektik
- VERB-Fin: gelecekti
- Cnd
- AUX: se, olsaydı
- VERB: uyursa
- Gen
- AUX: dir, midir, tir
- VERB: okur, verir, gelir, hallederiz, kalır, tozlaşır
- VERB-Fin: verir
- GenPot
- VERB: bakamaz, erişilebilir
- VERB-Part: erişilebilir
- Imp
- AUX: ol
- VERB: Boşver, aç, bahsetme, bitir, kavurun, ver
- VERB-Fin: bahsetme
- Ind
- AUX: idi, di, olacak, miydi, olmadı, ydi, durdu, miş, muydunuz, muş
- AUX-Fin: durdu, idi
- VERB: verdi, istiyor, uyumuş, aldı, gitti, okuyor, seviyor, uyudu, anlamıyor, anlıyor
- VERB-Conv: alıp, duyurulurken, konuşurken
- VERB-Fin: anlatıyor, açıklanmış, gelecekti, gitti, götürdü, okumamış, seviyor, söylüyorum, temizlememişti, temizlemiş
- VERB-Part: bilmiş, ettiği, uyumuş, yaptığı, çalıştığımız, şaşırmış
- VERB-Vnoun: olmaması, uyuyacağını
- Nec
- AUX: olmalıydı
- VERB: ettirmeliyiz
- Pot
- VERB: gelebileceğini, seçilebilir, uyduramadım, uyuyamayabilir, uyuyamıyor
- Fut
- AUX: olacak
- VERB: gelebileceğini, kalacak, gerekecek, okutturulacak, okuyacaklarını, uyuyacağını, yapılacak
- VERB-Part: kalacak, okuyacaklarını
- VERB-Vnoun: uyuyacağını
- Fut,Past
- VERB: gelecekti, izleyecektik
- VERB-Fin: gelecekti
- Past
- AUX: idi, di, miydi, olduğunu, olmadı, olmalıydı, ydi, durdu, miymiş, miş
- AUX-Fin: durdu, idi
- AUX-Part: olduğunu
- VERB: verdi, Okuduklarını, uyumuş, aldı, gitti, uyudu, büyüdü, denedi, gitmiş, görmemiş
- VERB-Fin: açıklanmış, gitti, götürdü, okumamış, temizlemiş, uyumuş, yapıyordu
- VERB-Part: Okuduklarını, yazdığını, Okuduğunuzu, bilmiş, ettiği, uyumuş, vardığımızda, yaptığı, yağdığını, çalıştığımız
- Pqp
- VERB: etmişmiş, temizlememişti, uyumuştu, çalmıştı
- VERB-Fin: temizlememişti, çalmıştı
- Pres
- AUX: se, mi, misin, mü, olmayan
- AUX-Part: olmayan
- VERB: istiyor, okuyor, seviyor, uyursa, anlamıyor, anlıyor, bakıyorsun, bilmiyorlar, okur, verir
- VERB-Conv: duyurulurken
- VERB-Fin: anlatıyor, seviyor, söylüyorum, verir
- VERB-Part: okuyan
- VERB-Vnoun: olmaması
- Cau
- VERB: bitir, ettirmeliyiz, kaygılandırıyordu, kolaylaştırıyor, uyandırmamız, uyduramadım
- VERB-Vnoun: uyandırmamız
- CauCau
- VERB: yıkattırdı
- CauPass
- VERB: okutturulacak, uyutuldu
- Pass
- VERB: açıklanmış, duyurulurken, erişilebilir, iletildi, okunuyor, seçilebilir, sunuldu, yapılacak
- VERB-Conv: duyurulurken
- VERB-Fin: açıklanmış
- VERB-Part: erişilebilir
- Fh
- AUX: idi, di, olacak, miydi, olmadı, olmalıydı, ydi, durdu, muydunuz, oldu
- AUX-Fin: durdu, idi
- VERB: verdi, istiyor, aldı, okuyor, seviyor, uyudu, uyursa, anlamıyor, anlıyor, bakıyorsun
- VERB-Conv: duyurulurken
- VERB-Fin: anlatıyor, gelecekti, seviyor, söylüyorum, verir, yapıyordu
- VERB-Part: erişilebilir
- VERB-Vnoun: uyuyacağını
- Nfh
- AUX: se, miymiş, miş, muş
- VERB: uyumuş, gitmiş, görmemiş, açıklanmış, bilmiş, etmişmiş, gelmiş, görmüş, okumamış, temizlememişti
- VERB-Fin: açıklanmış, okumamış, temizlememişti, temizlemiş, uyumuş, çalmıştı
- VERB-Part: bilmiş, uyumuş, şaşırmış
Pronouns, Determiners, Quantifiers
- Art
- DET: bir
- Dem
- DET: bu, o
- PRON: Bunun, O, bunu, kini, ondan
- Int
- AUX: mi, mı, miydi, musun, midir, misin, miymiş, mu, muydunuz, mü
- DET: ne
- PRON: kimin, nerede, neye
- Prs
- PRON: O, Sen, bana, Benim, Onlar, Sana, benden, bizimle, senin
- Rcp
- PRON: birbirlerini
- Card
- NUM: üç, beş, bir, iki
- Yes
- PRON: kendi, kendine, kendisine
- 1
- PRON: bana, Benim, benden, bizimle
- VERB: zannediyorum, ettirmeliyiz, hallederiz, izleyecektik, söylüyorum, uyduramadım, çekiyorum
- VERB-Fin: söylüyorum
- 2
- AUX: misin, musun, muydunuz, ol
- PRON: Sen, Sana, senin
- VERB: bakıyorsun, zannediyorsun, Boşver, aç, bahsetme, bitir, geliyorsun, kavurun, ver
- VERB-Fin: bahsetme
- 3
- AUX: mi, idi, di, mı, olacak, miydi, mü, olmadı, olmalıydı, se
- AUX-Fin: durdu, idi
- PRON: O, Bunun, Onlar, bunu, kendi, kendine, kinden, ondan
- VERB: verdi, istiyor, aldı, gitti, okuyor, seviyor, uyudu, uyursa, bilmiyorlar, büyüdü
- VERB-Fin: anlatıyor, açıklanmış, gelecekti, gitti, götürdü, okumamış, seviyor, temizlememişti, temizlemiş, yapıyordu
- Plur
- NOUN: gelişimleri
- PRON: birbirlerini
- VERB-Part: Okuduğunuzu, vardığımızda, çalıştığımız
- VERB-Vnoun: uyandırmamız
- Sing
- ADJ: mavisi
- AUX-Part: olduğunu
- NOUN: annesini, Annesinin, arkadaşına, başkenti, kardeşi, kocasına, saçını, Anneannesi, Eşim, Hırkam
- PRON: kendisine, kinden, kinin
- VERB: Okuduklarını, gelebileceğini, okuması, yazdığını, ettiği, okumaması, okumasını, okuyacaklarını, olmaması, uyumasını
- VERB-Part: Okuduklarını, yazdığını, ettiği, okuyacaklarını, yaptığı, yağdığını
- VERB-Vnoun: okuması, okumaması, okumasını, olmaması, uyumasını, uyuyacağını, yapmasına
Other Features
- Person[psor]
- 1
- NOUN: Eşim, Hırkam, arabam, babam
- VERB-Part: vardığımızda, çalıştığımız
- VERB-Vnoun: uyandırmamız
- 2
- NOUN: arkadaşınla, Çocuğun
- PRON: kinden
- VERB: gelebileceğini, Okuduğunuzu
- VERB-Part: Okuduğunuzu
- 3
- ADJ: mavisi
- AUX-Part: olduğunu
- NOUN: annesini, Annesinin, arkadaşına, başkenti, kardeşi, kocasına, saçını, zamanında, Anneannesi, akşamları
- PRON: birbirlerini, kendisine, kinin
- VERB-Part: Okuduklarını, yazdığını, ettiği, okuyacaklarını, yaptığı, yağdığını
- VERB-Vnoun: okuması, okumaması, okumasını, olmaması, uyumasını, uyuyacağını, yapmasına
- 1
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: i.
- This corpus uses 4 lemmas as auxiliaries (aux). Examples: ol, değil, dur, i.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Nom (11)
- VERB--PRON-Nom (13)
- VERB-Conv--NOUN-Nom (1)
- VERB-Fin--NOUN-Nom (6)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--NOUN-Nom (1)
- VERB-Part--PRON-Gen (2)
- VERB-Vnoun--NOUN-Gen (2)
- VERB-Vnoun--NOUN-Nom (2)
- obj
- VERB--NOUN-Acc (22)
- VERB--NOUN-Nom (13)
- VERB--PRON-Acc (1)
- VERB-Conv--NOUN-Acc (2)
- VERB-Conv--NOUN-Nom (2)
- VERB-Fin--NOUN-Acc (4)
- VERB-Fin--NOUN-Nom (1)
- VERB-Fin--PRON-Acc (2)
- VERB-Vnoun--NOUN-Acc (1)
- VERB-Vnoun--NOUN-Nom (9)
Relations Overview
- This corpus uses 9 relation subtypes: advmod:emph, aux:q, compound:lvc, compound:redup, nmod:poss, nsubj:outer, nsubj:pass, obl:agent, obl:tmod
- The following 9 relation types are not used in this corpus at all: iobj, expl, dislocated, appos, clf, list, goeswith, reparandum, dep