UD Kazakh KTB
Language: Kazakh (code: kk
)
Family: Turkic
This treebank has been part of Universal Dependencies since the UD v1.3 release.
The following people have contributed to making this treebank part of UD: Aibek Makazhanov, Jonathan North Washington, Francis Tyers.
Repository: UD_Kazakh-KTB
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: wiki, fiction, news
Questions, comments? General annotation questions (either Kazakh-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [aibek • makazhanov (æt) nu • edu • kz, jonathan • north • washington (æt) gmail • com, ftyers (æt) prompsit • com]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually, natively in UD style |
Description
The UD Kazakh treebank is a combination of text from various sources including Wikipedia, some folk tales, sentences from the UDHR, news and phrasebook sentences. Sentences IDs include partial document identifiers.
The tokenisation in the Kazakh UD treebank follows the principles of Turkic lexica in Apertium. Morphological processing in the Kazakh UD treebank follows the principles of Turkic lexica in Apertium. The file designated as “train” is just a small sample to show how the data looks like to shared task participants. The treebank is too small to provide for a standard training-development-test split. Instead, users are advised to merge both files, then jack-knife and report results of ten-fold cross-validation.
Acknowledgments
Please, cite the following papers if you use Kazakh UD treebank:
@inproceedings{tyers_tl2015, author = {Tyers, Francis M. and Washington, Jonathan N.}, title = {Towards a Free/Open-source Universal-dependency Treebank for Kazakh}, booktitle = {3rd International Conference on Turkic Languages Processing, (TurkLang 2015)}, pages = {276--289}, year = {2015}, } @inproceedings{makazhan_tl2015, author = {Makazhanov, Aibek and Sultangazina, Aitolkyn and Makhambetov, Olzhas and Yessenbayev, Zhandos}, title = {Syntactic Annotation of Kazakh: Following the Universal Dependencies Guidelines. A report}, booktitle = {3rd International Conference on Turkic Languages Processing, (TurkLang 2015)}, pages = {338--350}, year = {2015}, }
Statistics of UD Kazakh KTB
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Aspect – Case – Degree – Evident – Gender – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – Polite – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – ccomp – clf – compound – compound:lvc – conj – cop – csubj – dep – det – discourse – fixed – flat:name – iobj – mark – nmod – nmod:poss – nsubj – nummod – obj – obl – obl:own – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 1078 sentences, 10495 tokens and 10536 syntactic words.
- This corpus contains 1946 tokens (19%) that are not followed by a space.
- This corpus contains 15 types of words with spaces. Examples: алсам екен, араласқан жоқ, аңдысам екен, болған емес, болған жоқ, деген екен, естіген жоқ екен, еш нәрсені, келген жоқ, көрген емеспін, оқыған жоқ, сыйлайды екенсің, сыйламайды екенсің, тұрған жоқ, ұшырасқан жоқ
- This corpus contains 96 types of words that contain both letters and punctuation. Examples: ж., М., сондай-ақ, б.з.б., млн., млрд., т.б., -ақ, А., АҚШ-пен, Р., қарым-қатынастарды, 100-ге, 19,4°С-қа, 20-шы, 22%-ы, 2°С-тан, 3-ші, 30-шы, 35-те, 36%-ы, 400-ге, 55-ші, 70%-ін, 80-ге, 90%-ына, 90%-ға, Азық-түлікке, Ата-аналардың, Брютон-стриттегі, Г., Дар-әл-Харб, Деште-Кевир, Деште-Лух, Ел-жұрттарыңыздың, Жауын-шашынның, И., КСРО-дағы, Келе-келе, Кура-Аракс, Көші-қон, Премьер-Министрге, Рио-де-Жанейродағы, С., Сан-Паулуда, Санкт-Петербург, Солтүстік-батысын, Т., Тап-таза, ФИФА-ның
- This corpus contains 41 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 34 types of multi-word tokens. Examples: қуаныштымын, Жасаған-ау, балалы, кімдікі, көрсетер, Баласыз, Елсіз, айтшы, білмейміз-ау, бітімді, бұзылады-ау, дайынбыз, екпінді, емсіз, ертең-ақ, жалынды, жаралымын, жылғы, заманнан-ақ, кедергісіз, келбетті, лажсыз, майлы, мемлекеттерміз, мүдделіміз, негізсіз, палаталы, ретті, сулы, т.б., текті, тиіспіз, хабарсыз, құйшы.
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 10 word types tagged as particles (PART): ау, ба, бе, ер, ма, ме, ше, шы, шығар, қой
- This corpus contains 36 lemmas tagged as pronouns (PRON): барлық, барша, біз, бір, бір-бір, бірдеме, біреу, бірқатар, бұл, бәрі, ешкім, ешнәрсе, ештеңе, ешқандай, кім, күллі, манағы, мен, мына, мынау, не, нелік, немене, нәрсе, ол, олар, осы, сен, содан, сол, сіз, сіздер, қандай, қанша, әрбіреу, өз
- This corpus contains 35 lemmas tagged as determiners (DET): ана, анау, барлық, басқа, бір, бірнеше, бірсыпыра, бірталай, бірқатар, бүкіл, бұл, ешбір, ешқандай, кей, кейбір, көп, көптеген, манағы, мына, мұндай, не, ол, осы, осындай, сол, сондай, түрлі, қай, қандай, қанша, әлгі, әлдебір, әр, әртүрлі, өз
- Out of the above, 14 lemmas occurred sometimes as PRON and sometimes as DET: барлық, бір, бірқатар, бұл, ешқандай, манағы, мына, не, ол, осы, сол, қандай, қанша, өз
- This corpus contains 10 lemmas tagged as auxiliaries (AUX): ал, бер, бол, е, жат, жүр, кел, отыр, тұр, қал
- Out of the above, 9 lemmas occurred sometimes as AUX and sometimes as VERB: ал, бер, бол, жат, жүр, кел, отыр, тұр, қал
- There are 5 (de)verbal forms:
- Conv
- AUX: болып, болса, болмаса, алып, берсек, бола, болсам, болсаң, жатса, жүріп
- VERB: деп, алып, бастап, барып, Сөйтіп, беріп, болып, қашып, құлап, айналып
- Fin
- AUX: болды, еді, жатыр, емес, келеді, отыр, екен, болады, қалды, алды
- VERB: бастады, кетті, деді, біледі, болды, келді, шықты, өтті, береді, түседі
- Ger
- AUX: екенін, болуы, болу, болуға, болғанда, болғанын, алатынына, алмауда, алғаннан, алғаныма
- VERB: алуға, жасау, келгенде, оқу, шешуі, қорғалуға, алу, асыру, атауға, ашылу
- Inf
- AUX: болып, бола, келе, алмай, боп, отыра, тұра
- VERB: бара, басып, дами, алып, жоспарланып, қарап, ала, бақылап, жаулап, көріп
- Part
- AUX: жатқан, болған, отырған, алмайтындай, алмаған, болатын, болушы, жүрген, отыратын, тұрған
- VERB: болған, деген, шыққан, туған, түскен, тұрған, айтарлықтай, айтқан, алған, аталған
Nominal Features
- Fem
- PROPN: Айгүл, Шолпан, Елизавета, Айгүлдің, Александра, Алтынай, Ақбала, Мария, Шолпанның, Айгүлден
- Masc
- PROPN: Бекболат, Азамат, Нұрсұлтан, Назарбаев, Ерназардың, Азаматтың, Реза, Төстік, Қожа, Азаматты
- Plur
- ADJ: ақтардың, Ақтар, баршаларын, лақаптар, туындылар, қызылдар, әскерилер, өзгелері
- AUX-Conv: берсек
- AUX-Fin: жатырмыз, келді, алмады, берді, берейік, беретін, быз, жатыр, жатырсыздар, жүрміз
- NOUN: тілдерін, жылдары, ғасырларда, өзгерістер, қатынастар, актерлер, мемлекеттер, орыстар, сайлаушылар, толқулар
- PRON: біз, біздің, олар, бізді, олардың, сіздер, Бұлардың, Сіздерді, бізге, оларды
- PROPN: ильхандар, салжұқтар, Әзірбайжандар
- VERB-Fin: бастады, келді, сақталған, айтамыз, басталды, білейік, орнады, айқындаймыз, алды, алдық
- VERB-Ger: бірігулері, жасаулары, келгендеріңіз, ұсынғандар
- Sing
- AUX-Conv: болса, болмаса, болсам, болсаң, жатса
- AUX-Fin: болды, еді, жатыр, емес, келеді, отыр, екен, болады, қалды, алды
- PRON: мен, ол, оның, сіздің, оны, сені, Сіз, маған, оған, Сен
- VERB-Conv: берсе, десең, жатса, Сүйсем, алмаса, ашылса, барса, болса, білсе, білсең
- VERB-Fin: кетті, деді, бастады, біледі, болды, шықты, өтті, береді, тұрады, болады
- VERB-Inf: Тарағысы, айтқым, айтқысы, оқытса, Қарағысы, қайтқысы, қатысқысы, құттықтағым, ұсынғым
- Abl
- ADJ: алыстан, жаңадан, күштіден, көптен, жартысынан
- AUX-Ger: алғаннан, болғандықтан
- NOUN: жылдан, футболдан, Соғыстан, ауылдан, дүниеден, елден, күннен, пендеден, шеттен, ғасырдан
- NUM: бірінен, 2°С-тан, миллионнан, мыңнан, қырықтан
- PRON: одан, онан, содан, Бірінен, Менен, Мұнан, Неліктен, Сізден, осыдан
- PROPN: Азиядан, Астанадан, Германиядан, Сұзыдан, Айгүлден, Төлегеннен
- VERB-Ger: кеткеннен, алмастан, басталғаннан, бақылаудан, біткеннен, жетіспеушілігінен, жолыққаннан, жөндеуден, сөйлегеннен, тұрғызылғандықтан
- Acc
- ADJ: талайды, өзгені, Солтүстік-батысын, Турасын, баршаларын, барыңды, оңтүстігін, солтүстік-шығысын, өзгесін
- AUX-Ger: екенін, болғанын, болмасымды, болғанымды, екендіктерін, жатқанын, жүргенін
- NOUN: тілдерін, жобаны, сөзді, чемпионатты, қызды, малын, ахуалды, бейбітшілікті, дыбысты, елді
- NUM: 70%-ін, Бірін
- PRON: оны, сені, бізді, Мені, Сізді, Ешкімді, Кімді, Сіздерді, бәрін, оларды
- PROPN: Иранды, Азаматты, Арабияны, Мысырды, Палестинаны, Сирияны, Қазақстанды, Қожанасырды
- VERB-Ger: біткенді, ойнағанды, алуды, алғанын, білгенді, демократияландыруды, етуді, жазылмасын, жолдауыңызды, жымиғанын
- Dat
- ADJ: алысқа, жайға, жылдығына
- AUX-Ger: болуға, алатынына, алғаныма, болғаныма, екеніне, тұруға, қалғанына
- NOUN: жерге, үйге, адамға, жылға, дағдарысқа, дүниеге, елге, пайызға, тысқа, аймаққа
- NUM: 100-ге, 19,4°С-қа, 400-ге, 80-ге, 90%-ына, 90%-ға
- PRON: оған, маған, кімге, саған, Соған, бізге, ешкімге, оларға, сізге, сіздерге
- PROPN: Астанаға, Иранға, Қазақстанға, Арменияға, Бағдадқа, Византияға, Германияға, Семейге, Тибетке, Украинаға
- VERB-Ger: алуға, қорғалуға, атауға, білуге, орнатуға, табуға, тұруға, азапталуға, айналуға, айрылмауға
- VERB-Part: Блоктарға, сездірмеске
- Gen
- ADJ: ақтардың, жаттың, туындының, жылдығының
- NOUN: жылдың, ғасырдың, халықтың, адамның, елдің, Жобаның, ағаштың, еліміздің, қазақтың, қаланың
- NUM: екеуінің
- PRON: біздің, оның, сіздің, олардың, соның, өзінің, менің, мұның, өзіміздің, Аның
- PROPN: Қазақстанның, Иранның, Астананың, Ерназардың, Азаматтың, Азияның, Еуропаның, Айгүлдің, Алматының, Бекболаттың
- VERB-Ger: жүргізудің, тартудың, теңелуінің, тырысуының, қосылудың, қосылуының, әкелудің
- Ins
- AUX-Ger: екенімен
- NOUN: сезіммен, Асумен, Жорғалықпенен, Күнмен, Нашақорлықпен, Патшамен, Тәсілмен, абыроймен, ерлікпен, жолмен
- PRON: осымен, Онымен, Сізбен, бір-бірімен, бұлармен, кіммен, немен, соныменен
- PROPN: АҚШ-пен, Ауғанстанмен, Грузиямен, Қазақстанмен, Өзбекстанмен, Назарбаевпен
- VERB-Ger: берумен, болуымен, бояумен, жеумен, кигенмен, оқығанменен, сайлануыңызбен, сорумен, қаруымен, өткізілуімен
- Loc
- ADJ: аулақта, жартысында, Анығында
- AUX-Ger: болғанда, алмауда, жүргенде
- NOUN: елде, ғасырда, түрде, елдегі, кезде, жерде, арасында, кезінде, баспасөзде, бақшада
- NUM: 35-те
- PRON: мұнда, Сізде, осында, өзінде, онда, Бізде, Менде, сонда
- PROPN: Қазақстанда, Астанада, Тегеранда, Қазақстандағы, Алматыда, Бразилияда, Иранда, Азияда, Азиядағы, Америкада
- VERB-Ger: келгенде, салыстырғанда, Сөйткенде, араздасқанда, асқанда, ашқанда, дамуда, дамытуда, дегенде, жүргенде
- Nom
- ADJ: бар, атты, дауысты, жақын, жоқ, жуығы, көп, түркі, Ақтар, баршасы
- ADP: дейінгі, кейінгі
- ADV: қазіргі, соңғы, Арғы, Бүгінгі, Ендігі, Жоғарғы, бергі, биылғы, ежелгі, күндізгі
- AUX-Ger: болуы, болу, болатыны, болған, екені, жатқаны, жүрген, отырғаным, қалған
- DET: не
- NOUN: мемлекет, ел, орыс, қазақ, Президент, адам, бала, кісі, мал, орын
- NUM: бірі, екеуі, 2030, 22%-ы, 27%, 30%, 36%-ы, 5%, 51%, 58,3%
- PRON: біз, мен, ол, бұл, не, кім, олар, өзі, ешкім, бәрі
- PROPN: Иран, Қазақстан, АҚШ, Алматы, Астана, Бекболат, Азамат, Нұрсұлтан, Ұлыбритания, Айгүл
- VERB-Ger: жасау, оқу, шешуі, алу, асыру, ашылу, келген, көрсету, салу, сақтау
- VERB-Part: келген, көбейгені
Degree and Polarity
- Cmp
- ADJ: Жақынырақ, анығырақ, арзанырақ, кішірек, тазалау
- ADV: Кейінірек
- Neg
- AUX-Conv: болмаса
- AUX-Fin: емес, алмайды, алмады, алмаймын, алмас, болған емес, болған жоқ, келген жоқ, келмеді, тұрған жоқ
- AUX-Ger: алмауда, болмасымды
- AUX-Inf: алмай
- AUX-Part: алмайтындай, алмаған
- VERB-Conv: алаланбай, алмаса, аспай, жемей, жығылмай, келмей, кетпесем, саналмаса, қалдырмай, қорықпай
- VERB-Fin: келмейді, болмайды, айтпайды, білмеймін, қылмады, айтылмады, айырмайды, араласпаймын, араласқан жоқ, аяма
- VERB-Ger: айрылмауға, алаланбауы, алмастан, бермеуі, жазылмасын, жетіспеушілігінен, келмеуі, кетпесіне, сұғылмауына, қосылмау
- VERB-Inf: ашпай, білінбей, келмей
- VERB-Part: Ашылмайтын, еңсерілмейтін, жатпайтын, оқымаған, сездірмеске, сүймеген, шешілмеген, Қорықпайтын
Verbal Features
- Hab
- AUX-Fin: емес, келеді, екен, болады, мын, алмайды, береді, қалады, аласыз, алмаймын
- VERB-Fin: біледі, береді, түседі, тұрады, болады, табылады, кетеді, көрінеді, дейді, келеді
- Imp
- AUX-Conv: бола
- AUX-Ger: алатынына, болатыны
- AUX-Inf: бола, келе, алмай, отыра, тұра
- AUX-Part: алмайтындай, болатын, отыратын
- VERB-Conv: қайта, ажарлана, арсыздана, арттыра, жая, мадақтай, тұра, шақыра, қаша
- VERB-Ger: жығатынын, мақтанатыны, табылатынын, әкелетіні, өзгеретінін
- VERB-Inf: бара, дами, ала, отыра, араласа, арта, бере, жете, келе, кіре
- VERB-Part: жейтін, тұратын, Ашылмайтын, Танытатын, асыратын, баратын, болатын, білетін, бұзатын, дайындайтын
- Perf
- AUX-Conv: болып, алып, жүріп, отырып, тұрып
- AUX-Inf: болып, алмай, боп
- VERB-Conv: деп, алып, бастап, барып, Сөйтіп, беріп, болып, қашып, құлап, айналып
- VERB-Inf: басып, алып, жоспарланып, қарап, бақылап, жаулап, көріп, шығып, құрып, беріп
- Cnd
- AUX-Conv: болса, болмаса, берсек, болсам, болсаң, жатса
- VERB-Conv: берсе, десең, жатса, Сүйсем, алмаса, ашылса, барса, болса, білсе, білсең
- VERB-Inf: оқытса
- Des
- AUX-Fin: бермек, болмақ
- VERB-Fin: алсам екен, аңдысам екен, кеңейтілмек, көздемек
- VERB-Ger: білмек
- VERB-Inf: Тарағысы, айтқым, айтқысы, Қарағысы, қайтқысы, қатысқысы, құттықтағым, ұсынғым
- Imp
- AUX-Fin: бер, қал
- VERB-Fin: алыңыз, же, Аттан, айт, аяма, бер, берме, беріңіз, гөр, жасаңыздар
- Ind
- AUX-Fin: болды, еді, жатыр, емес, келеді, отыр, екен, болады, қалды, алды
- VERB-Fin: бастады, кетті, деді, біледі, болды, келді, шықты, өтті, береді, түседі
- Opt
- AUX-Fin: болсын, алсын, берейік, берсін, болайын, тұрайық
- VERB-Fin: білейік, білсін, аяйын, барайын, барсын, білдірсін, жалынсын, жейік, жисын, сенсін
- Pot
- AUX-Part: болушы
- VERB-Part: айтарлықтай, айтушы, алаңдарлықтай, атқарушы, басқарушы, деуші, жетелеуші, шығарушы, қабылдаушы, қорқушы
- Fut
- AUX-Fin: бермек, алмас, болмақ
- AUX-Ger: болмасымды
- VERB-Fin: көрсет, барарсың, бүлінер, бәсеңдер, естірсіз, кеңейтілмек, көздемек, көрер, соғармын, суынар
- VERB-Ger: алмастан, білмек, жазылмасын, кетпесіне
- VERB-Part: Блоктарға, артар, аяр, дер, сездірмеске
- Past
- AUX-Fin: болды, еді, қалды, алды, болған, келді, алмады, берді, тұрды, алдым
- AUX-Ger: екенін, болғанда, болғанын, алғаннан, алғаныма, болған, болғаныма, болғанымды, екені, екенімен
- AUX-Part: жатқан, болған, отырған, алмаған, жүрген, тұрған
- VERB-Fin: бастады, кетті, деді, болды, келді, шықты, өтті, алды, ашылды, болыпты
- VERB-Ger: келгенде, біткенді, келген, кеткеннен, ойнағанды, салыстырғанда, Сөйткенде, алғанын, араздасқанда, артқан
- VERB-Part: болған, деген, шыққан, туған, түскен, тұрған, айтарлықтай, айтқан, алған, аталған
- Pres
- AUX-Fin: жатыр, емес, келеді, отыр, екен, болады, мын, алмайды, береді, жатырмыз
- VERB-Fin: біледі, береді, түседі, тұрады, болады, табылады, кетеді, көрінеді, дейді, келеді
- Pass
- VERB-Conv: алаланбай, ажарлана, ашылса, байқалып, басталып, бұзылып, жарияланып, жасалып, жығылмай, расталса
- VERB-Fin: ашылды, табылады, құрылды, жойылды, көрінеді, анықталады, басталды, берілді, жарияланады, жасалады
- VERB-Ger: қорғалуға, ашылу, азапталуға, алаланбауы, асырылуы, аяқталуы, басталуы, басталғаннан, басылуы, білінген
- VERB-Inf: жоспарланып, бөлініп, өткізіліп, басылып, білінбей, бұжырланып, жіберіліп, көрсетіліп, сайланып, салына
- VERB-Part: аталған, кеңейтілген, табылған, Атқарылған, Ашылмайтын, арналған, белгіленген, еңсерілмейтін, жабдықталған, жарияланған
- Rcp
- VERB-Conv: тартысып, Қиюласып, өлтіріспей
- VERB-Fin: айналысады, араласқан жоқ, байланысты, бөлісеміз, жалғасты, жасасты, келісті, сөйлесерміз, танысты, қатысамын
- VERB-Ger: жетіспеушілігінен, танысқаныма, істесуге, Қалыптасу, қатысуға, әңгімелесуіміз, өлтіріскеніне
- VERB-Inf: айтысып, араласа, соғыса, танысып, қатысқысы, құшақтасып
- VERB-Part: таласқандай, топтасқан
- Fh
- AUX-Fin: екен, болыпты
- VERB-Fin: болыпты, кетіпті, келіпті, деген екен, демепті, елемепті, естіген жоқ екен, жасапты, жиналыпты, сыйлайды екенсің
Pronouns, Determiners, Quantifiers
- Dem
- DET: осы, бұл, ол, сол, мына, бұ, мұндай, манағы, Анау, Мұнша
- PRON: бұл, ол, мұнда, одан, оны, содан, соның, мұның, олай, оған
- Ind
- DET: бір, кейбір, сондай, Кей, Осындай, басқа, түрлі, Әлдебір
- PRON: біреу, Бірінен, бірдеме, біреуге, біреудің, нәрсе, Әрбіреудің
- Int
- ADJ: қандай
- ADV: қайда, қайдан, қалай, қашан, неге, неліктен, қашанғы
- DET: қай, не, қандай
- PRON: не, кім, қандай, қанша, немене, кімге, Кімді, Неліктен, Неміз, кіммен
- Neg
- DET: ешқандай, ешбір
- PRON: ешкім, Ешкімді, ешкімге, ешқандай, Ештеңе, еш нәрсені
- Prs
- DET: өз
- PRON: біз, мен, ол, біздің, оның, олар, өзі, сіздің, оны, сені
- Rcp
- PRON: бір-бірімен
- Tot
- DET: барлық, әр, бүкіл, бірқатар, көп, көптеген, қанша, бірнеше, Бірталай, бірсыпыра
- PRON: бәрі, барлығы, бәрін, баршаға, бірқатары, күллі
- Card
- NUM: бір, екі, миллиард, үш, 12, төрт, сегіз, 1, 4, 5
- Card,Ord
- NUM: бірі, бір, 3, бірдей, млн., мың, 1, 1220, 13, 1380
- Coll
- NUM: екеуі, екеуінің, біреуі, үшеуі
- Ord
- NUM: 2, үшінші, 1, 11, 18, 19, 20, 12, 14, 16
- Yes
- DET: өз
- PRON: өзі, өзінің, өзіміздің, өзінде, өзінше, өздері, өздерінің, өздерің, өзін, өзін-өзі
- 1
- AUX-Conv: берсек, болсам
- AUX-Fin: мын, жатырмыз, алдым, алмаймын, отырмын, тұрмын, берейік, беремін, болайын, болдым
- PRON: біз, мен, біздің, маған, бізді, менің, Мені, бізге, Бізде, Менде
- VERB-Conv: Сүйсем, жатсам, кетпесем, тұрсам
- VERB-Fin: құттықтаймын, айтамыз, алам, білейік, білмеймін, көрдім, ойлаймын, айқындаймыз, алдым, алдық
- VERB-Inf: айтқым, құттықтағым, ұсынғым
- 2
- AUX-Conv: болсаң
- AUX-Fin: аласыз, бер, жатырсыздар, келдіңіз, келесіз, отырсыздар, тұрсыңдар, қал
- PRON: сіздің, сені, Сіз, Сен, Сізде, Сізді, саған, сіздер, Сіздерді, сізге
- VERB-Conv: десең, білсең, салсаң
- VERB-Fin: алыңыз, же, Аттан, айт, айтасың, атасың, аяма, барарсың, бер, берме
- 3
- AUX-Conv: болса, болмаса, жатса
- AUX-Fin: болды, еді, жатыр, емес, келеді, отыр, екен, болады, қалды, алды
- PRON: ол, оның, олар, оны, олардың, оған, Аның, одан, оларды, оларға
- VERB-Conv: берсе, жатса, алмаса, ашылса, барса, болса, білсе, жалынса, жыласа, жүрсе
- VERB-Fin: бастады, кетті, деді, біледі, болды, келді, шықты, өтті, береді, түседі
- VERB-Inf: Тарағысы, айтқысы, оқытса, Қарағысы, қайтқысы, қатысқысы
- Form
- AUX-Fin: аласыз, жатырсыздар, келдіңіз, келесіз, отырсыздар
- NOUN: Ел-жұрттарыңыздың, Мерекелеріңізбен, Сұрақтарыңызды, атыңыз, елдеріңіз, елордаларыңызға, еліңіз, сапарыңыз, саясатыңыздың, сеніміңізді
- NUM: жетіңіз
- PRON: сіздің, Сіз, Сізде, Сізді, сіздер, Сіздерді, сізге, сіздерге, Сізбен, Сізден
- VERB-Fin: алыңыз, беріңіз, болдыңыз, білесіз, естірсіз, жасаңыздар, жинаңыз, сөйлейсіз, табыласыздар, шығарасыз
- VERB-Ger: жолдауыңызды, келгендеріңіз, сайлануыңызбен, қылғаныңыз
- Plur
- AUX-Ger: екендіктерін
- NOUN: еліміздің, еліміз, Алдымыз, Дамуымыз, Еліміздегі, Конституциямызды, Отанымыз, азаматтарымыз, алғысымызды, аспанымыз
- PRON: өзіміздің, өздері, Неміз, өздерінің, өздерің
- VERB-Ger: кездесуіміз, көруіміз, әңгімелесуіміз, өлуіміз
- Plur,Sing
- ADJ: жартысында, жуығы, Анығында, Солтүстік-батысын, Турасын, баршаларын, баршасы, жартысынан, жылдығына, жылдығының
- AUX-Ger: екенін, болуы, болғанын, алатынына, болатыны, екені, екенімен, екеніне, жатқаны, жатқанын
- NOUN: басшысы, жылы, әулеті, тілдерін, арасында, кезінде, халқы, Президенті, мемлекеті, ішінде
- NUM: бірі, екеуі, екеуінің, бірінен, 22%-ы, 36%-ы, 70%-ін, 90%-ына, Бірін, біреуі
- PRON: өзі, бәрі, өзінің, өзінде, өзінше, барлығы, бәрін, Бірінен, Онысы, бір-бірімен
- PROPN: Алашордасының, Арабиясының
- VERB-Ger: шешуі, алаланбауы, алуы, алғанын, асырылуы, атқаруы, аяқталуы, басталуы, басылуы, бермеуі
- VERB-Part: көбейгені
- Sing
- ADJ: барыңды
- AUX-Ger: алғаныма, болмасымды, болғаныма, болғанымды, отырғаным
- NOUN: Інім, Атым, Ағам, Ел-жұрттарыңыздың, Жасым, Жауыңнан, Мерекелеріңізбен, Отаным, Съездің, Сұрақтарыңызды
- NUM: жетіңіз
- PRON: өзіңіздің
- VERB-Ger: жолдауыңызды, келгендеріңіз, көргеніме, сайлануыңызбен, танысқаныма, қылғаныңыз
Other Features
- Person[psor]
- 1
- AUX-Ger: алғаныма, болмасымды, болғаныма, болғанымды, отырғаным
- NOUN: еліміздің, еліміз, Інім, Алдымыз, Атым, Ағам, Дамуымыз, Еліміздегі, Жасым, Конституциямызды
- PRON: өзіміздің, Неміз
- VERB-Ger: кездесуіміз, көргеніме, көруіміз, танысқаныма, әңгімелесуіміз, өлуіміз
- 2
- ADJ: барыңды
- NOUN: Ел-жұрттарыңыздың, Жауыңнан, Мерекелеріңізбен, Съездің, Сұрақтарыңызды, атыңды, атыңыз, балаң, балаңа, басың
- NUM: жетіңіз
- PRON: өздерің, өзіңіздің
- VERB-Ger: жолдауыңызды, келгендеріңіз, сайлануыңызбен, қылғаныңыз
- 3
- ADJ: жартысында, жуығы, Анығында, Солтүстік-батысын, Турасын, баршаларын, баршасы, жартысынан, жылдығына, жылдығының
- AUX-Ger: екенін, болуы, болғанын, алатынына, болатыны, екендіктерін, екені, екенімен, екеніне, жатқаны
- NOUN: басшысы, жылы, әулеті, тілдерін, арасында, кезінде, халқы, Президенті, мемлекеті, ішінде
- NUM: бірі, екеуі, екеуінің, бірінен, 22%-ы, 36%-ы, 70%-ін, 90%-ына, Бірін, біреуі
- PRON: өзі, бәрі, өзінің, өзінде, өзінше, барлығы, бәрін, өздері, Бірінен, Онысы
- PROPN: Алашордасының, Арабиясының
- VERB-Ger: шешуі, алаланбауы, алуы, алғанын, асырылуы, атқаруы, аяқталуы, басталуы, басылуы, бермеуі
- VERB-Part: көбейгені
- 1
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: бол, е.
- This corpus uses 9 lemmas as auxiliaries (aux). Examples: жат, ал, отыр, кел, тұр, бер, қал, жүр, бол.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Conv--NOUN-Nom (38)
- VERB-Conv--PRON-Dat (1)
- VERB-Conv--PRON-Nom (8)
- VERB-Fin--NOUN (4)
- VERB-Fin--NOUN-Nom (317)
- VERB-Fin--PRON-Nom (88)
- VERB-Ger--NOUN-Gen (17)
- VERB-Ger--NOUN-Nom (29)
- VERB-Ger--PRON-Gen (7)
- VERB-Ger--PRON-Nom (10)
- VERB-Inf--NOUN-Nom (44)
- VERB-Inf--PRON-Gen (1)
- VERB-Inf--PRON-Nom (34)
- VERB-Part--NOUN-Gen (2)
- VERB-Part--NOUN-Nom (24)
- VERB-Part--PRON-Nom (3)
- obj
- VERB-Conv--NOUN-Acc (27)
- VERB-Conv--NOUN-Nom (25)
- VERB-Conv--PRON-Acc (4)
- VERB-Conv--PRON-Nom (3)
- VERB-Fin--NOUN-Acc (106)
- VERB-Fin--NOUN-Dat (7)
- VERB-Fin--NOUN-Nom (82)
- VERB-Fin--PRON-Acc (32)
- VERB-Fin--PRON-Dat (1)
- VERB-Fin--PRON-Nom (3)
- VERB-Ger--NOUN-Acc (55)
- VERB-Ger--NOUN-Dat (2)
- VERB-Ger--NOUN-Nom (44)
- VERB-Ger--PRON-Acc (8)
- VERB-Ger--PRON-Dat (1)
- VERB-Inf--NOUN-Acc (34)
- VERB-Inf--NOUN-Dat (2)
- VERB-Inf--NOUN-Nom (19)
- VERB-Inf--PRON-Acc (4)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--NOUN-Acc (15)
- VERB-Part--NOUN-Dat (1)
- VERB-Part--NOUN-Nom (11)
- VERB-Part--PRON-Acc (1)
- VERB-Part--PRON-Nom (1)
- iobj
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--NOUN-Dat (1)
- VERB-Ger--NOUN-Abl (1)
- VERB-Part--NOUN-Dat (1)
Verbs with Reflexive Core Objects
- This corpus contains 2 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: басқар өзін-өзі, әкел өзін
Relations Overview
- This corpus uses 5 relation subtypes: acl:relcl, compound:lvc, flat:name, nmod:poss, obl:own
- The following 1 main types are not used alone, they are always subtyped: flat
- The following 5 relation types are not used in this corpus at all: expl, dislocated, list, goeswith, reparandum