UD Azerbaijani TueCL
Language: Azerbaijani (code: az)
Family: Turkic
This treebank has been part of Universal Dependencies since the UD v2.14 release.
The following people have contributed to making this treebank part of UD: Soudabeh Eslami, Çağrı Çöltekin.
Repository: UD_Azerbaijani-TueCL
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.17
License: CC BY-SA 4.0
Genre: grammar-examples
Questions, comments? General annotation questions (either Azerbaijani-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [soudabeh • eslami (æt) student • uni-tuebingen • de, cagri • coeltekin (æt) uni-tuebingen • de]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually |
| UPOS | annotated manually, natively in UD style |
| XPOS | not available |
| Features | not available |
| Relations | annotated manually, natively in UD style |
Description
This is a small treebank of grammatical examples for Azerbaijani. The
treebank tries to be neutral about the particular variety (North or
South Azerbaijani, hence, uses the ISO code for the macrolanguage
(az).
The Azerbaijani-TueCL treebank consists of 148 sentences, which include 20 sentences from Cairo and 119 sentences provided by the UD Turkic Group. This treebank is a part of the UD Turkic Treebank. To account for instances of pronominal subject omission, we have added 9 additional sentences (versions) to the Cairo corpus. It’s important to note that the original grammatical sentences are in Turkish, and some constructions and translations do not exist in Azerbaijani. As a result, we have included duplicate sentences, which are as follows:
- Sentence IDs 14 and 15
- Sentence IDs 35, 36, and 37
- Sentence IDs 54 and 55
- Sentence IDs 74 and 75
- Sentence IDs 78 and 79
- Sentence IDs 80 and 81 Currently, Azerbaijani is written using three different alphabets: the Persian alphabet in the South, and the Cyrillic and Latin alphabets in the North. The current treebank only includes sentences written in the Latin script, with plans to include sentences in the Perso-Arabic alphabet in the future. Translations of all sentences into English are also available.
Acknowledgments
We are deeply thankful to the UD Turkic Group for their weekly informative meetings and discussions and for all the support we have received.
References
- (citation)
Statistics of UD Azerbaijani TueCL
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB
Features
Aspect – Case – Definite – Degree – Evident – ExtPos – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – PronType – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – appos – aux – case – cc – ccomp – compound – compound:lvc – compound:redup – conj – cop – csubj – det – discourse – fixed – flat – mark – nmod – nmod:poss – nsubj – nsubj:outer – nummod – obj – obl – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 148 sentences, 902 tokens and 912 syntactic words.
- This corpus contains 186 tokens (21%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus does not contain words that contain both letters and punctuation.
- This corpus contains 9 multi-word tokens. On average, one multi-word token consists of 2.11 syntactic words.
- There are 8 types of multi-word tokens. Examples: evdəki, Denizinkinin, aşpazxananınkını, bağdakı, evdəkininki, kitabxanadakılar, pərəstarıdı, səninkindən.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: SYM, X
- This corpus contains 1 word types tagged as particles (PART): də
- This corpus contains 15 lemmas tagged as pronouns (PRON): -ki, Nəmə, belə, biz, bu, bura, harda, kim, mən, nə, o, olar, siz, sən, öz
- This corpus contains 5 lemmas tagged as determiners (DET): bir, bu, heç, o, tamam
- Out of the above, 2 lemmas occurred sometimes as PRON and sometimes as DET: bu, o
- This corpus contains 4 lemmas tagged as auxiliaries (AUX): bil, dəyil, i, ol
- Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: bil, ol
- There are 4 (de)verbal forms:
- Conv
- VERB: alıp, açır, cıxardıp, götürüb, gələ, oxuyarakən, yetişincə, çata, getməmış, ola
- Fin
- VERB: gəlirən
- Part
- AUX: olanda
- VERB: Oxuduxlarını, yatmış, oxuyan, yazdığını, Oxuduğuzu, bilmiş, danışanda, elədigimiz, görməmiş, olmuyan
- Vnoun
- AUX: olduğunu
- VERB: oxumaq, çekmə, getmək, içməni, oxumağı, çekmağı, eləməyə, olduğunu, olmamasıdır, olmağı
Nominal Features
- Plur
- ADJ: Cəvanlara
- AUX: bilərsiz
- NOUN: uşaqlara, Nəticələr, Soğanları, Tüklərin, axşamlar, aylarında, ağaclar, dinlər, evlərdə, hədəflərini
- PRON: Olar, Siz, biz, bizinən, buralara
- VERB: Oxuduxlarını, bilmirlər, eliriz, istəyirsiniz, Oxuduğuzu, baxacaqıdıx, düsünürdüz, etdirməliyik, oxuyacaxlarını, oyandırax
- VERB-Part: Oxuduxlarını, Oxuduğuzu, oxuyacaxlarını
- Sing
- ADJ: var, yox, yoxdur, abini, abisi, abisini, bətərdi, gözəldir, tezdən, yaxçıdı
- AUX: iydi, dəyil, dəyildi, bildi, bilir, bilmir, bilmədim, dəyilmiş, iydı, iymiş
- NOUN: evdə, kitab, kitabı, mədrəsəyə, söbh, Fikr, evə, gün, uşaq, Moəllim
- PRON: O, Sən, mənə, Bunun, Kimin, mənim, ona, onu, Mənin, Nəməyə
- PROPN: Deniz, Ayhana, Denizin, Ayşə, Mary, Fəransənin, Parisdə, Peter, Brown, Fərvərdin
- VERB: verdi, aldı, oxur, düşünmürü, getdi, istəyir, olacax, oxumaq, söyür, yatsa
- VERB-Fin: gəlirən
- VERB-Part: yazdığını, qaçdığı
- VERB-Vnoun: oxumaq, getmək, içməni, olmamasıdır, olmağı, oxuması, oxumasını, oxumasıydı, tərkitməyə, yazmasına
- Abl
- ADJ: tezdən
- NOUN: yadınnan, otaqdan, qardaşınnan, qəzadan, resturandan, yoldaşlarınnan
- PRON: sənin
- Acc
- ADJ: abini, abisini
- AUX-Vnoun: olduğunu
- NOUN: kitabı, anasın, Tüklərin, maşını, Gecəni, Soğanları, anasını, aşpazxananın, hasarı, hədəflərini
- PRON: onu, bunu
- VERB-Part: Oxuduxlarını, yazdığını, Oxuduğuzu, oxuyacaxlarını
- VERB-Vnoun: içməni, oxumağı, çekmağı, olduğunu, olmağı, oxumaq, oxumasını, yuxlamasını, çekmə
- Com
- NOUN: qardaşıynan, yoldaşıynan
- PROPN: Peterinən
- Dat
- ADJ: Cəvanlara
- NOUN: mədrəsəyə, evə, dəlilə, uşaqlara, yoldaşına, ərinə, dünyaya, filmə, kitaba, qardaşına
- PRON: mənə, Nəməyə, ona, Sənə, buralara
- PROPN: Ayhana
- VERB-Part: qərələnə
- VERB-Vnoun: eləməyə, tərkitməyə, yazmasına
- Gen
- NOUN: Anasının, Evin, Mizin, babasının, kinin, otağının, uşağın, xalqın, yoldaşının
- PRON: Bunun, Kimin, mənim, Mənin
- PROPN: Denizin, Fəransənin, Hakanın, Peterin
- VERB-Part: qaçdığı
- Ins
- NOUN: gözünən
- PRON: bizinən
- Loc
- AUX-Part: olanda
- NOUN: evdə, kitabxanada, otaqda, Bazarda, afisdə, aylarında, bağda, evdədir, evdəki, evdəyidi
- PRON: harda
- PROPN: Parisdə
- VERB-Part: danışanda
- Nom
- NOUN: kitab, söbh, Fikr, uşaq, Moəllim, dərs, çörək, Deniz, abisi, düktür
- PRON: O, Sən, Olar, Siz, özünə
- PROPN: Deniz, Ayşə, Mary, Peter, Brown, Fərvərdin, Jane, Ordibeheşt, Sam, Smith
- VERB: getmək, oxumaq, oxumaması, oxuması, oxumasıydı, süpür
- VERB-Vnoun: getmək, oxumaq, oxumaması, oxuması, oxumasıydı
- Ind
- DET: bir
Degree and Polarity
- Cmp
- ADV: çoxtər
- Neg
- ADJ: yox, yoxdur
- AUX: dəyil, dəyildi, bilmir, bilmədim, dəyilmiş, olmadı
- VERB: düşünmürü, bilmirlər, eləmədi, baxmaz, danışma, getməmış, görmədi, görməmiş, görməyib, olmamasıdır
- VERB-Conv: getməmış, yatmıya
- VERB-Part: görməmiş, olmuyan, oxumamış, əlçatmaz
- VERB-Vnoun: olmamasıdır, oxumaması
Verbal Features
- Hab
- VERB: verərsən, baxmaz, gəlip, oxuyar, qalar, tozlanır
- Perf
- AUX: iydi, bildi, dəyilmiş, iydı, iymiş, olmadı
- VERB: Oxuduxlarını, alıp, apardı, böyüdü, cıxardıp, eləmədi, getdi, getmişdi, verdi, yatmış
- VERB-Conv: alıp, cıxardıp, getməmış
- VERB-Part: Oxuduxlarını, yatmış, elədigimiz, görməmiş, pişirdigi
- Prog
- AUX: bilərsiz, bilir, bilmir, ol
- VERB: düşünmürü, istəyir, oxur, Boşla, baxıran, bilmirlər, elirdi, elirəm, istəyirsiniz, annadır
- Prosp
- AUX: olacax
- VERB: baxacaqıdıx, oxuyacaxlarını, qalacax, yatacax
- VERB-Part: oxuyacaxlarını
- Cnd
- VERB: yatsa, yatsaydı
- Imp
- VERB: aç
- Ind
- ADJ: var, yox, yoxdur, bətərdi, gözəldir, yaxçıdı, yeyindir
- AUX: dəyil, dəyildi, iydi, bilərsiz, bildi, bilir, bilmir, bilmədim, dəyilmiş, iydı
- NOUN: mohəssildir, evdəyidi
- VERB: verdi, aldı, düşünmürü, getdi, istəyir, olacax, oxur, söyür, apardı, baxıran
- VERB-Fin: gəlirən
- VERB-Part: elədigimiz, pişirdigi
- VERB-Vnoun: olmamasıdır, oxumasıydı
- Nec
- VERB: cürləməliydi, etdirməliyik
- Sub
- VERB: gələ, ola, tərkidə, yata, yatmıya
- VERB-Conv: gələ, ola, yata, yatmıya
- Fut
- AUX: olacax
- VERB: olacax, gələcəgidi, oxutdurulacax, oxuyacaxlarını, qalacax, yatacax
- VERB-Part: oxuyacaxlarını
- Past
- AUX: iydi, dəyildi, bildi, bilmədim, dəyilmiş, iydı, iymiş, olmadı, ıdı
- NOUN: evdəyidi
- VERB: verdi, aldı, Oxuduxlarını, getdi, yatmış, apardı, böyüdü, cürləməliydi, elirdi, eləmədi
- VERB-Conv: getməmış
- VERB-Part: Oxuduxlarını, yatmış, yazdığını, Oxuduğuzu, bilmiş, elədigimiz, görməmiş, oxumamış, pişirdigi, qaçdığı
- VERB-Vnoun: oxumasıydı
- Pqp
- VERB: eləmişimiş
- Pres
- ADJ: var, yox, yoxdur, bətərdi, gözəldir, yaxçıdı, yeyindir
- AUX: dəyil, bilərsiz, bilir, bilmir
- NOUN: mohəssildir, düktürdür, evdədir, saatdır
- VERB: oxur, düşünmürü, istəyir, söyür, baxıran, bilmirlər, eliriz, elirəm, istəyirsiniz, verərsən
- VERB-Fin: gəlirən
- VERB-Part: qalan, verən
- VERB-Vnoun: olmamasıdır
- Cau
- VERB: annadır, etdirməliyik, oyandırax, qutar, rahatlaşdırır
- CauCau
- VERB: yudurtdu, rənglədi
- CauCauPass
- VERB: oxutdurulacax
- CauPass
- VERB: yoxladıldı
- Pass
- VERB: oxunur, verildi
- Rcp
- VERB: qucaxlaşdılar
- Fh
- VERB: böyüdü, baxmaz, gəlip, qalar, rahatlaşdırır, söyür, yuxlur, çalışdı
- Nfh
- VERB: getmişdi, yatmış, eləmişimiş, etdirməliyik, getməmış, görməmiş, yatmışdı
- VERB-Conv: getməmış
- VERB-Part: yatmış, görməmiş
Pronouns, Determiners, Quantifiers
- Dem
- DET: o, bu
- PRON: o, Bunun, bunu
- Int
- NUM: neçə
- PRON: nə, Kimin, Nəməyə, harda
- Neg
- DET: heç
- Prs
- PRON: O, Sən, mənə, Olar, Siz, mənim, onu, Mənin, Sənə, biz
- Card
- NUM: beş, bir, ikki, üç
- 1
- AUX: bilmədim
- PRON: mənə, mənim, Mənin, biz, bizinən
- VERB: elirəm, baxacaqıdıx, diyirəm, etdirməliyik, oyandırax
- 2
- AUX: bilərsiz, ol
- PRON: Sən, Siz, Sənə, sənin
- VERB: Boşla, baxıran, eliriz, istəyirsiniz, verərsən, Oxuduğuzu, aç, danışma, düsünürdüz, gəlirən
- VERB-Fin: gəlirən
- VERB-Part: Oxuduğuzu
- 3
- ADJ: var, yox, yoxdur, bətərdi, gözəldir, yaxçıdı, yeyindir
- AUX: iydi, dəyil, dəyildi, bildi, bilir, bilmir, dəyilmiş, iydı, iymiş, olacax
- NOUN: mohəssildir, düktürdür, evdədir, evdəyidi, kitabdır, kişvərdir, pərəstar, saatdır, Ərim
- PRON: O, Olar, onu, Bunun, kindən, ona, özünə
- VERB: verdi, aldı, oxur, düşünmürü, getdi, istəyir, olacax, söyür, yatsa, apardı
- VERB-Part: qaçdığı
- VERB-Vnoun: olmamasıdır, oxumasıydı
- Plur
- NOUN: Tüklərin, hədəflərini, təkamulları
- VERB-Part: elədigimiz
- Sing
- ADJ: abisi, abisini
- AUX-Vnoun: olduğunu
- NOUN: anasın, Anasının, abisi, evdə, kitabı, paytəxti, qardaşı, yadınnan, yoldaşına, ərinə
- PRON: kindən, ona
- PROPN: Denizin
- VERB-Part: Oxuduxlarını, yazdığını, oxuyacaxlarını, pişirdigi
- VERB-Vnoun: olduğunu, oxumaması, oxuması, oxumasını, oxumasıydı, yazmasına, yuxlamasını
Other Features
- ExtPos
- CCONJ
- CCONJ: nə
- CCONJ
- Person[psor]
- 1
- NOUN: babam, maşınım, Ərim
- VERB-Part: elədigimiz
- 2
- PRON: kindən
- 3
- ADJ: abisi, abisini
- AUX-Vnoun: olduğunu
- NOUN: anasın, Anasının, Tüklərin, abisi, kitabı, paytəxti, qardaşı, yadınnan, yoldaşına, ərinə
- PROPN: Denizin
- VERB-Part: Oxuduxlarını, yazdığını, oxuyacaxlarını, pişirdigi
- VERB-Vnoun: olduğunu, oxumaması, oxuması, oxumasını, oxumasıydı, yazmasına, yuxlamasını
- 1
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: i.
- This corpus uses 3 lemmas as auxiliaries (aux). Examples: dəyil, bil, ol.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (1)
- VERB--NOUN-Nom (21)
- VERB--PRON-Nom (11)
- VERB-Conv--NOUN-Nom (2)
- VERB-Conv--PRON (1)
- VERB-Conv--PRON-Nom (1)
- VERB-Fin--PRON-Nom (1)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--PRON-Gen (2)
- VERB-Vnoun--NOUN (1)
- VERB-Vnoun--NOUN-Gen (2)
- VERB-Vnoun--NOUN-Nom (1)
- obj
- VERB--NOUN (1)
- VERB--NOUN-Acc (22)
- VERB--NOUN-Nom (14)
- VERB--PRON (1)
- VERB--PRON-Acc (2)
- VERB-Conv--NOUN-Acc (1)
- VERB-Conv--NOUN-Nom (2)
- VERB-Part--NOUN-Acc (3)
- VERB-Part--NOUN-Nom (2)
- VERB-Part--PRON-Acc (1)
- VERB-Vnoun--NOUN-Acc (1)
- VERB-Vnoun--NOUN-Nom (7)
Relations Overview
- This corpus uses 5 relation subtypes: advmod:emph, compound:lvc, compound:redup, nmod:poss, nsubj:outer
- The following 8 relation types are not used in this corpus at all: iobj, expl, dislocated, clf, list, goeswith, reparandum, dep