UD Ukrainian IU
Language: Ukrainian (code: uk
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v1.4 release.
The following people have contributed to making this treebank part of UD: Natalia Kotsyba, Bohdan Moskalevskyi, Mykhailo Romanenko.
Repository: UD_Ukrainian-IU
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-NC-SA 4.0
Genre: blog, email, fiction, grammar-examples, legal, news, reviews, social, web, wiki
Questions, comments? General annotation questions (either Ukrainian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [org (æt) mova • institute]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | annotated manually |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
Gold standard Universal Dependencies corpus for Ukrainian, developed for UD originally, by Institute for Ukrainian, NGO. [українською]
UD Ukrainian comprises 122K tokens in 7000 sentences of fiction, news, opinion articles, Wikipedia, legal documents, letters, posts, and comments — from the last 15 years, as well as from the first half of the 20th century.
Consider using the latest version at ‘dev’ branch on GitHub. It contains the latest stable improvements while the official releases are up to 6 month old [discussion].
Acknowledgments
Major contributors: Natalia Kotsyba, Bohdan Moskalevskyi, Mykhailo Romanenko.
Large portion of annotation was made by Halyna Samoridna, Ivanka Kosovska, Olha Lytvyn, Oksana Orlenko and by students of Kyiv-Mohyla Academy department of Ukrainian language (headed by Liudmyla Dyka): Hanna Brovko, Bohdana Matushko, Natalia Onyshchuk, Valeriia Pareviazko, Yaroslava Rychyk, Anastasiia Stetsenko, Snizhana Umanets.
We thank Prof. Larysa Masenko for guidance.
Statistics of UD Ukrainian IU
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – Animacy – Animacy[gram] – Aspect – Case – Degree – Foreign – Gender – Hyph – Mood – NameType – Number – NumType – Orth – PartType – Person – Polarity – Poss – PronType – PunctType – Reflex – Tense – Typo – Uninflect – Variant – VerbForm – Voice
Relations
acl – acl:adv – acl:relcl – advcl – advcl:pred – advcl:svc – advmod – advmod:det – amod – appos – aux – case – cc – ccomp – compound – compound:svc – conj – conj:svc – cop – csubj – det – det:numgov – det:nummod – discourse – dislocated – expl – fixed – flat – flat:abs – flat:foreign – flat:name – flat:range – flat:repeat – flat:sibl – flat:title – goeswith – iobj – list – mark – nmod – nsubj – nummod – nummod:gov – obj – obl – orphan – parataxis – parataxis:discourse – parataxis:newsent – parataxis:rel – punct – reparandum – root – vocative – vocative:cl – xcomp – xcomp:pred
Tokenization and Word Segmentation
- This corpus contains 7092 sentences, 122701 tokens and 122750 syntactic words.
- This corpus contains 22891 tokens (19%) that are not followed by a space.
- This corpus contains 15 types of words with spaces. Examples: 1 010, 12 000, 127 806, 19 700, 2 750, 241 233, 26 000, 29 037 892, 3 079, 4 000, 442 509, 5 244 190, 7 222 035, 70 118, 8 440 042
- This corpus contains 660 types of words that contain both letters and punctuation. Examples: здоров’я, об’єднання, пам’яток, пов’язані, п’яти, сім’ї, з-під, зв’язку, прем'єр, п’ять, ім’я, будь-який, м’язів, об’єднаної, пам’ятки, пам’яті, будь-якого, зв'язку, здоров'я, пам'ятати, 1930-х, будь-яких, будь-якому, з’явився, пам'ять, пам’ятці, пов’язаних, п’ятдесят, 1920-х, 2015-го, 2017-го, будь-яку, де-не-де, дев’ять, з-за, зобов’язань, з’ясувати, кров’ю, об’єкта, руків'я, слов'янських, слов’янських, слов’янські, суб’єкта, ім'я, 100-ї, 11-ї, 1995-му, 2-х, 2014-го
- This corpus contains 49 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 24 types of multi-word tokens. Examples: нікому, ніколи, ніде, нікуди, нічим, півгодини, півроку, ніким, ніяк, півдороги, нізвідки, нікого, нічого, пів'ярда, півгарнізона, півгодинки, півметра, півсела, півукраїни, півхати, півхвилини, пів’ягняти, пів’язика, пів’ящика.
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 108 word types tagged as particles (PART): Авжеж, Ачей, Аякже, Ба, Гаразд, Дю, Казна, Коли, Ле, На, Он, Тобто, Тож, Чиж, Якби, а, аж, ані, б, би, бо, бодай, вже, власне, все, все-таки, всього, всього-навсього, геть, да, де, десь, ж, же, за, завгодно, й, куди, лиш, лише, лишень, мало, мов, мовби, навіть, най, наче, начебто, не, невже, немов, немовби, неначе, нехай, но, ну, ні, ніби, нібито, о, ось, осьо, от, отже, ото, отож, оце, пак, попросту, просто, прямо, саме, само, собі, справді, та, так, таки, там, типу, то, тощо, тіке, тільки, тілько, уже, усе, усе-таки, усього, фон, хай, хан, хоч, хоча, хіба, це, чи, чисто, шо, ще, що, щоб, щойно, щось, як, якраз, і, іще
- This corpus contains 37 lemmas tagged as pronouns (PRON): абихто, будь-хто, весь, ви, вона, вони, воно, все, всьо, всяке, він, дехто, дещо, ми, ніхто, ніщо, ото, оце, се, себе, ся, т., таке, те, ти, то, усе, хто, хто-небудь, хтось, це, шо, що, щось, я, інше, її
- This corpus contains 63 lemmas tagged as determiners (DET): багато, будь-який, ваш, ввесь, весь, всенький, всякий, всілякий, декотрий, декілька, деякий, другий, жадний, жодний, ин., його, кожне, кожний, кожній, котрий, котрийсь, кілька, кількасот, мій, наш, небагато, ніякий, один, одне, отакий, отой, оцей, сам, самий, свій, сей, скілька, скільки, стільки, сякий, т., такий, тамтой, твій, то, той, увесь, усякий, усілякий, цей, чий, чийсь, який, який-небудь, якийсь, і., ін., інакший, інш., інший, їх, їхній, її
- Out of the above, 4 lemmas occurred sometimes as PRON and sometimes as DET: весь, т., то, її
- This corpus contains 4 lemmas tagged as auxiliaries (AUX): б, би, бувати, бути
- Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: бувати, бути
- There are 4 (de)verbal forms:
- Conv
- AUX: бувши
- VERB: тримаючи, зважаючи, починаючи, враховуючи, кажучи, знаючи, перебуваючи, вивчаючи, виходячи, говорячи
- Fin
- AUX: було, був, є, була, були, буде, будуть, будемо, буду, будете
- VERB: є, може, має, було, каже, немає, можуть, мав, міг, мають
- Inf
- AUX: бути
- VERB: робити, зробити, сказати, знайти, говорити, працювати, жити, стати, взяти, дати
- Part
- ADJ: пов’язані, установленому, минулого, об’єднаної, затвердженого, вибраний, включені, населених, пов’язаних, визначених
Nominal Features
- Fem
- ADJ: української, державної, національної, українська, великої, Тернопільської, нову, верховної, нова, цілу
- ADJ-Part: об’єднаної, коханої, минулої, розташована, вареною, визначеної, вказаної, датована, зроблена, названа
- AUX-Fin: була
- DET: яка, його, свою, ця, яку, цю, сама, така, цій, цієї
- NOUN: людей, люди, мови, грн, області, землі, території, ради, роботи, тварин
- NUM: дві, двох, одну, одна, обидві, 2, 1, двома, 22, одній
- PRON: вона, її, неї, їй, ній, нею
- PROPN: україни, Україні, Україна, Міра, Росії, Марія, Мотря, Європи, Ради, Європі
- VERB-Fin: була, стала, стояла, мала, знала, зробила, любила, казала, могла, почала
- X: Снарская, блядєй, системы, строгой, частєй
- Masc
- ADJ: 2017, 2016, українського, перший, український, цілий, першого, 2015, новий, нового
- ADJ-Part: установленому, минулого, вибраний, переконаний, призначений, розташований, відкритим, даному, закоханий, зареєстрованого
- AUX-Fin: був
- DET: який, той, цей, цього, один, його, сам, свій, свого, того
- NOUN: час, року, %, років, часу, №, р, рік, чоловік, році
- NUM: 1, 2, два, один, двох, обидва, одного, півтора, 21, 32
- PRON: він, його, йому, хто, нього, ним, кого, кому, ньому, ким
- PROPN: київ, Києва, Вінстон, Гнат, Києві, Михась, О, ХАІ, Андрій, Львові
- VERB-Fin: мав, міг, був, сказав, почав, знав, став, хотів, бачив, пішов
- X: GMAT, Kapital’у, дождєй, факінґ
- Neut
- ADJ: ціле, 27, 1, XI, нове, 3, 15, 23, 25, державного
- ADJ-Part: пастеризоване, введеного, затвердженого, зазначеного, запаковане, зареєстроване, засноване, згаданому, переданого, проведене
- AUX-Fin: було, бувало
- DET: його, все, таке, яке, своє, це, одне, цього, її, тому
- NOUN: життя, питання, слова, рішення, ст, використання, очі, місце, видання, населення
- NUM: одне, двох, одним, 1, два, Одно, одному, 2, 21, одного
- PRON: це, що, те, того, все, щось, воно, його, цього, чого
- PROPN: Закарпаття, Вапліте, Полісся, Сан-Ремо, Токіо, 3G, ЄС, Євро, Дзвонкове, Закарпатті
- VERB-Fin: було, стало, виявилося, вдалося, довелося, здавалося, могло, вийшло, хотілося, відбулося
- X: крушеніє, место
- Anim
- ADJ: малих, нових, величезного, золотого, колишнього, молодого, Засмалених, Мар’яниного, Надзвичайного, Першого
- ADJ-Part: Засмалених, видуманих, вимерлих, витесаного, закоханих, замученого, запліснілих, звільнених, кривляючогося, незадоволених
- DET: всіх, якого, своїх, яких, одного, усіх, свого, тих, мого, такого
- NOUN: людей, люди, чоловік, дзядзьо, чоловіка, тварин, жінки, тато, дітей, батько
- NUM: одного
- PRON: я, ми, мене, нас, ви, мені, ти, хто, вам, нам
- PROPN: Міра, Вінстон, Гнат, Марія, Михась, Мотря, О, Андрій, Михайло, джон
- X: Снарская, блядєй, ю
- Inan
- ADJ: цілий, перший, останні, новий, другий, перші, окремі, різні, музичний, великі
- ADJ-Part: пов’язані, відбиті, забруднені, закритий, минулі, переповнений, ОПОСЕРЕДКОВАНІ, аналізований, базований, битий
- DET: які, свої, свій, той, всі, цей, який, ті, ці, інші
- NOUN: час, року, %, років, життя, часу, №, р, рік, році
- NUM: один
- PRON: це, що, те, того, все, щось, цього, чого, тим, нічого
- PROPN: україни, Україні, США, Україна, київ, Києва, Росії, Києві, ХАІ, Європи
- X: CampUs, D, GMAT, Kapital’у, Утопия, город, дождєй, каро, крушеніє, место
- Plur
- ADJ: різних, українських, перших, різні, нових, нові, місцевих, перші, повинні, великі
- ADJ-Part: пов’язані, включені, населених, пов’язаних, визначених, виявлені, діючих, зареєстровані, знаних, зроблені
- AUX-Fin: були, є, будуть, будемо, будете, будьте, бували, будем
- DET: які, всі, інших, ці, яких, ті, всіх, такі, свої, усі
- NOUN: років, %, людей, люди, грн, днів, тварин, очі, дітей, роки
- NUM: 2, 1, тисяч, тис, млн, млрд, обох, обома, мільйонів, тисячі
- PRON: ми, вони, їх, нас, ви, них, вам, нам, вас, їм
- PROPN: К, Ґракхів, ex.ua, АНів, Ан, Антоновичів, Вали, Городків, Джемалятдінових, Зерови
- VERB-Fin: можуть, мають, були, мали, є, почали, могли, пішли, робили, стали
- X: блядєй, воєнських, дождєй, частєй
- Ptan
- NOUN: грошей, даних, виборів, гроші, двері, дані, коштів, ЗМІ, даними, дверей
- PROPN: США, Карпати, Черкаси, Карпат, Бережани, Броварів, Бітлз, Держгеонадр, Дубосар, Жуляни
- Sing
- ADJ: 2017, української, українського, 2016, державної, перший, державного, національної, український, нового
- ADJ-Part: установленому, минулого, об’єднаної, затвердженого, вибраний, відкритим, зареєстрованого, пастеризоване, переконаний, призначений
- AUX-Fin: було, був, була, є, буде, буду, буває, будеш, бувало
- DET: його, який, яка, той, цей, цього, її, свою, один, свого
- NOUN: час, року, життя, часу, №, р, рік, році, дня, чоловік
- PRON: він, це, я, вона, його, що, мене, те, її, мені
- PROPN: україни, Україні, Україна, київ, Міра, Києва, Росії, Вінстон, Гнат, Києві
- VERB-Fin: може, має, було, каже, є, немає, мав, міг, був, була
- X: GMAT, Kapital’у, Снарская, город, крушеніє, место, системы, строгой, факінґ, ю
- Acc
- ADJ: цілий, нову, цілу, державну, перший, останні, ціле, велику, новий, першу
- ADJ-Part: пов’язані, відбиті, забруднені, закритий, минулі, переповнений, побиту, спожиту, Висушену, Засмалених
- ADP: на, про, в, за, у, через, під, по, понад, попри
- DET: кілька, свою, його, які, свої, свій, яку, той, всі, цей
- NOUN: час, рік, раз, день, життя, місце, питання, роки, голову, участь
- NUM: три, 5, 4, два, 1, 2, пів, 10, 6, 3
- PRON: його, їх, її, те, що, це, мене, себе, нас, все
- PROPN: Україну, київ, Сибір, Хруща, Коцького, Камену, Карпати, М, Михайла, Пуню
- Dat
- ADJ: першому, літературній, фізичній, Всенароднім, визначеним, державним, засудженим, релігійним, спеціалізованим, сучасній
- ADJ-Part: визначеним, засудженим, спеціалізованим, вбитим, вбудованим, вбудованому, вказаній, завербованим, зазначеній, затвердженій
- ADP: завдяки, к, назло
- DET: всім, самому, яким, іншим, нашим, одному, своїм, іншому, її, його
- NOUN: заступнику, людям, начальнику, чоловікові, організаціям, владі, власникам, державі, дівчатам, людині
- NUM: 2, 3, Двом, вісімдесятьом, обом, трьом
- PRON: мені, йому, собі, вам, нам, їй, їм, тобі, кому, нікому
- PROPN: Україні, Софії, Є, Ігорю, Василеві, Г, Дені, Джонові, Марфі, Миколайовичу
- Gen
- ADJ: української, українського, 2017, державної, українських, перших, національної, державного, 2016, нового
- ADJ-Part: минулого, об’єднаної, затвердженого, пов’язаних, визначених, діючих, зареєстрованого, знаних, введеного, даного
- ADP: до, з, для, від, у, після, із, без, в, серед
- DET: цього, інших, свого, того, яких, його, всіх, одного, цих, тих
- NOUN: року, років, %, часу, людей, дня, життя, мови, грн, ради
- NUM: двох, млрд, тис, млн, тисяч, 2, трьох, 1, 60, п’яти
- PRON: того, нас, них, мене, нього, цього, чого, їх, неї, його
- PROPN: україни, США, Києва, Європи, Ради, Росії, Делятина, ОУН, Поттера, УНР
- X: GMAT, Kapital’у, блядєй, воєнських, дождєй, системы, строгой, частєй
- Ins
- ADJ: першим, головним, єдиним, новим, першою, різними, великим, центральним, великою, малими
- ADJ-Part: відкритим, вареною, встановленим, згаданими, контролюючим, недоторканим, прийнятою, укладеними, ілюстрованим, ОБМЕЖЕНОЮ
- ADP: з, за, із, під, між, перед, над, зі, поза, поміж
- DET: таким, своїм, яким, одним, своєю, тим, цим, його, іншими, якою
- NOUN: часом, чином, допомогою, очима, законом, руками, головою, мовою, органом, життям
- NUM: двома, одним, обома, трьома, 3, п’ятьма, 1, 18, 241 233, 25
- PRON: ним, ними, тим, собою, чим, цим, вами, нею, ким, нами
- PROPN: Трампом, Україною, Фациком, Юрком, Дністром, Йохаєм, Л, Лесем, Лесею, Москвою
- Loc
- ADJ: різних, установленому, 2016, українській, великій, далекому, третьому, другій, навчальному, окремих
- ADJ-Part: установленому, даному, встановленому, зареєстрованих, згаданому, населених, поваленій, розвинених, розвинутих, ДОЗВОЛЕНИХ
- ADP: у, в, на, по, при, о, уві
- DET: його, цій, тому, якій, якому, цьому, своїй, яких, кожному, одному
- NOUN: році, разі, світі, території, місці, порядку, ніжці, початку, житті, місті
- NUM: двох, одному, 14, 3, обох, одній, п’яти, семи, 12, 13-ти
- PRON: цьому, тому, ній, ньому, собі, чому, них, всьому, йому, нім
- PROPN: Україні, Києві, Львові, Європі, Франківську, Росії, США, Читі, Празі, Америці
- Nom
- ADJ: українська, український, повинні, нова, нові, різні, перший, повинна, українські, велика
- ADJ-Part: пов’язані, вибраний, включені, виявлені, зареєстровані, зроблені, обмежені, переконаний, розташований, впевнені
- DET: які, яка, який, всі, його, той, цей, сам, ці, один
- NOUN: №, люди, чоловік, дзядзьо, тато, батько, людина, мова, мати, діти
- NUM: 1, 2, 3, 7, 5, 4, один, 6, три, 8
- PRON: він, я, це, ми, вона, вони, ви, ти, що, хто
- PROPN: Україна, Міра, Вінстон, Гнат, Марія, київ, Михась, Мотря, в, Андрій
- X: Снарская, Утопия, город, крушеніє, место, факінґ
- Voc
- ADJ: дорогий, Шановне, дорогі, Високоповажний, Дорогая, Шановна, Шановні, божа, добрі, загублене
- ADJ-Part: загублене
- DET: мій, моя, мої, наші, якийсь
- NOUN: дівко, дядечку, друже, чоловіче, боже, дочко, мамо, Хлопці, видавництво, газдику
- PRON: Ви, ти
- PROPN: Соню, Господи, Григоровичу, Катю, Левку, Павле, Євгене, Іванко, А-ба-ба, Андрію
Degree and Polarity
- Abs
- ADV: щонайменше, якнайбільш, щонайбільше, щонайгірше, щонайширше, якнайбільше, якнайменше, якнайочевидніше, якнайповніше, якнайпорядніше
- Cmp
- ADJ: старший, краще, пізніших, старших, старшого, більших, більшу, більші, вищих, довший
- ADV: більше, більш, раніше, краще, пізніше, менш, менше, вище, швидше, нижче
- Pos
- ADJ: перших, перший, нового, першого, нових, нові, великої, новий, перші, великі
- ADJ-Part: відкритим, обмежені, впевнені, поширених, розвинутих, вживаних, вишуканих, відкриті, закритий, закритих
- ADV: дуже, добре, часто, багато, відповідно, видно, довго, потрібно, значно, швидко
- Sup
- ADJ: найкращих, найбільша, найкращий, найбільших, найважливіші, найближчими, найближчого, найбільший, найбільшу, найкращим
- ADV: найбільш, найбільше, найчастіше, найголовніше, найменше, найкраще, найменш, найперш, Найстрімкіше, Найтяжче
- Neg
- CCONJ: ні, ані
- PART: не, ні, ані
- VERB-Conv: незважаючи
- VERB-Fin: немає, нема, ні, немаю, неприсідає
- Short
- ADJ: повинен, здатен, годен, згоден, винен, дністро, дубо, клено, ладен, потрібен
- DET: кожен, жоден, всяк
- Uncontr
- ADJ: Дорогая, Красную, бідная, грішнії
- NOUN: дорогая
Verbal Features
- Imp
- ADJ-Part: діючих, знаних, незнані, вареною, вживаних, звані, контролюючим, крадений, мальовані, недоторканим
- ADV: неждано
- AUX-Conv: бувши
- AUX-Fin: було, був, є, була, були, буде, будуть, будемо, буду, будете
- AUX-Inf: бути
- VERB-Conv: тримаючи, зважаючи, починаючи, враховуючи, кажучи, знаючи, перебуваючи, вивчаючи, виходячи, говорячи
- VERB-Fin: є, може, має, було, каже, немає, можуть, мав, міг, мають
- VERB-Inf: робити, говорити, працювати, жити, мати, писати, йти, брати, дивитися, чути
- Perf
- ADJ-Part: пов’язані, установленому, минулого, об’єднаної, затвердженого, вибраний, включені, населених, пов’язаних, визначених
- VERB-Conv: отримавши, ставши, Надійшовши, Розглянувши, доповнивши, повернувшись, Вернувшись, Взявши, Глянувши, Дочекавшись
- VERB-Fin: сказав, почав, почали, став, стало, стала, пішов, виявилося, пішли, зробив
- VERB-Inf: зробити, сказати, знайти, стати, взяти, дати, піти, забезпечити, отримати, побачити
- Cnd
- AUX: б, би
- Imp
- AUX-Fin: будьте
- VERB-Fin: див, будь, давай, дивіться, дай, одведи, підкажіть, скажімо, скажіть, слухайте
- Ind
- AUX-Fin: було, був, є, була, були, буде, будуть, будемо, буду, будете
- VERB-Fin: є, може, має, було, каже, немає, можуть, мав, міг, мають
- Fut
- AUX-Fin: буде, будуть, будемо, буду, будете, будеш, будем
- VERB-Fin: буде, вийде, матиме, піду, доведеться, зроблю, прийде, дасть, Нагадаємо, залишиться
- Past
- AUX-Conv: бувши
- AUX-Fin: було, був, була, були, бували, бувало
- VERB-Conv: отримавши, ставши, Надійшовши, Розглянувши, доповнивши, повернувшись, Вернувшись, Взявши, Глянувши, Дочекавшись
- VERB-Fin: було, мав, міг, був, була, були, мали, сказав, почав, почали
- Pres
- ADJ-Part: діючих, контролюючим, Караюча, блеючий, блеючого, взаємодіючих, генеруючими, діючого, діючої, енергогенеруючої
- AUX-Fin: є, буває
- NOUN: оточуючих, виконуюча, завідуючий, командуючого, комплектуючих, комплектуючі
- VERB-Conv: тримаючи, зважаючи, починаючи, враховуючи, кажучи, знаючи, перебуваючи, вивчаючи, виходячи, говорячи
- VERB-Fin: є, може, має, каже, немає, можуть, мають, нема, здається, маю
- Act
- ADJ-Part: минулого, діючих, минулої, контролюючим, минулі, Здичавілі, Караюча, Розшалілий, блеючий, блеючого
- Pass
- ADJ-Part: пов’язані, установленому, об’єднаної, затвердженого, вибраний, включені, населених, пов’язаних, визначених, виявлені
Pronouns, Determiners, Quantifiers
- Dem
- ADV: так, тут, тоді, там, тому, потім, тепер, зараз, туди, досі
- DET: той, цей, цього, ці, ті, того, такі, ця, таких, цих
- PRON: це, те, того, цього, тим, цьому, то, тому, таке, цим
- Ind
- ADV: якось, десь, колись, іноді, дещо, чомусь, інколи, як, інакше, де-не-де
- DET: кілька, інших, багато, один, інші, одного, якийсь, іншого, деякі, одна
- PRON: щось, хтось, що, чого, інше, когось, чимось, дехто, кому, комусь
- Int
- ADV: як, чого, чому, де, коли, навіщо, куди, звідки, скільки, чом
- DET: яка, які, якої, Якого, який
- PRON: що, хто, чим, кого, чого, кому, Шо, ким, чому
- Neg
- ADV: ніколи, ніяк, ніде, нікуди, ніко́ли, нізащо, нізвідки
- DET: жодного, жодних, ніяких, жодному, жодної, ніякої, жодна, жоден, ніяка, ніякого
- PRON: ніхто, нічого, нікого, нікому, ніщо, ніким, нічим, нічо́го, нічому
- Prs
- ADV: по-моєму, по-нашому
- DET: його, її, свою, свого, сам, свої, свій, своїх, наші, їх
- PART: де, Дю, Ле, да, фон, хан
- PRON: він, я, ми, вона, його, вони, їх, мене, нас, її
- X: ю
- Rel
- ADV: коли, де, як, куди, поки, чому, доки, скільки, відколи, звідки
- DET: які, який, яка, яких, яку, якого, яке, яким, якої, якій
- PRON: що, хто, чого, чим, кого, ким, кому, чому, віщо, чім
- Tot
- ADV: завжди, скрізь, всюди, всього, звідусіль, повсюди, усюди
- DET: всі, всіх, усі, усіх, все, кожен, кожного, весь, всю, кожному
- PRON: все, усе, всього, всьому, усього, усім, всьо, всякого
- Card
- DET: кілька, багато, кількох, багатьох, декілька, стільки, багатьма, кількома, скільки, декільком
- NOUN: тисяч, млрд, мільйонів, тисячі, млн, мільйони, мільярди, тис, трлн
- NUM: 1, 2, 5, 3, 7, три, 4, двох, 6, 10
- Ord
- ADJ: 2017, 2016, перших, перший, першого, 2015, перші, 1, другий, 27
- Yes
- ADV: по-моєму, по-нашому
- DET: його, її, свою, свого, свої, свій, своїх, наші, їх, мій
- Yes
- DET: свою, свого, сам, свої, свій, своїх, самі, сама, своє, своїм
- PRON: собі, себе, собою, ся
- 0
- VERB-Fin: заборонено, знайдено, написано, сказано, виявлено, зазначено, записано, позначено, скасовано, використано
- 1
- ADV: по-моєму, по-нашому
- AUX-Fin: будемо, буду, є, будем
- DET: наші, мій, наших, нашого, мого, моя, наша, нашої, мою, мої
- PRON: я, ми, мене, нас, мені, нам, нами, мною
- VERB-Fin: маю, думаю, знаю, маємо, хочу, кажу, можу, бачу, дякую, бачимо
- 2
- AUX-Fin: будете, будеш, будьте
- DET: ваші, вашого, вашої, ваш, ваших, твій, ваша, твоя, вашому, твою
- PRON: ви, ти, вам, вас, тебе, тобі, вами, тобою
- VERB-Fin: знаєте, можеш, див, будь, можете, давай, дивіться, знаєш, бачиш, дай
- X: ю
- 3
- AUX-Fin: є, буде, будуть, буває
- DET: його, її, їх, їхнього, їхніми, їхніх, їхні, їхньому, їхня, їхній
- PRON: він, вона, його, вони, їх, її, йому, них, нього, неї
- VERB-Fin: є, може, має, каже, немає, можуть, мають, нема, здається, дає
Other Features
- Abbr
- Yes
- ADJ: ісп, англ, грец, зв, амер, кв, лат, маль, юґосл, ДХ
- ADP: бл
- ADV: д, т, напр, НМД
- DET: т, інш, і, ін, ин
- NOUN: р, грн, ст, УПА, м, ТЕС, ТОВ, мр, АЕС, км
- NUM: млрд, тис, млн
- PRON: т
- PROPN: О, ХАІ, І, ОУН, УНР, М, В, Ан, Р, С
- VERB-Fin: див, Пор
- Yes
- Animacy[gram]
- Anim
- NOUN: листа, дуба, носа, воза, рота, човна, вимикача, возика, гвера, герба
- Inan
- NOUN: чорти, Гетьмани, академіки, гості, дармоїди, дівки, конячки, куми, мікроби, особи
- Anim
- Foreign
- Yes
- X: Office, the, Windows, Amazon, DITIB, cyanus, Centaurea, GFP, mneme, n
- Yes
- Hyph
- Yes
- ADJ: науково, південно, військово, медико, визвольно, греко, дослідно, жовто, яскраво, історично
- Yes
- NameType
- Giv
- PROPN: Міра, Вінстон, Гнат, Марія, Михась, Мотря, Андрій, Михайло, джон, микола
- Pat
- PROPN: Василівна, І, О, Степанович, П, Іларіонович, Васильовича, Василівни, Г, Григоровичу
- Sur
- PROPN: Лі, Манафорта, Поттера, Трампа, Щербачов, Дудаєва, Гольдштейна, Морріс, Сосницький, Українки
- Giv
- Orth
- Alt
- ADJ: большевицької, большевицького, Всенароднім, Всенародніми, Народніх, инший, инших, матеріяльної, спеціяльні, Всенародніх
- ADV: Инакше, Иноді, спеціяльно
- NOUN: матеріял, матеріялу, смерти, каши, лавреатами, матеріяли, матеріялізм, ролю, автами, автом
- NUM: пів
- PROPN: Европи, Плянка, Колюмба, Колюмбом
- Alt
- PartType
- Conseq
- PART: то, так
- Conseq
- PunctType
- Bull
- PUNCT: —, ✓, -
- Dash
- PUNCT: —, -, –, --
- Hyph
- PUNCT: -, –, −
- Quot
- PUNCT: «, », ", ”, “, „, '
- Bull
- Typo
- Yes
- ADJ: 45-ти, двох
- NOUN: 2014
- PART: як
- SCONJ: що
- Yes
- Uninflect
- Yes
- ADJ: 2017, 2016, 2015, 1, 27, 3, XI, 1945, 2014, 17
- DET: його, її, їх, т, інш, і, ін, ин
- NOUN: %, №, р, грн, ст, УПА, м, $, ТЕС, ТОВ
- NUM: 1, 2, 5, 3, 7, 4, 6, 10, 8, пів
- PRON: т
- PROPN: США, О, ХАІ, І, ОУН, УНР, В, Лі, М, Гаррі
- X: GMAT, каро, факінґ
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: бути, бувати.
- This corpus uses 4 lemmas as auxiliaries (aux). Examples: бути, б, би, бувати.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Gen (97)
- VERB-Fin--NOUN-Gen-ADP(порядок) (1)
- VERB-Fin--NOUN-Nom (3311)
- VERB-Fin--PRON-Acc-ADP(про) (1)
- VERB-Fin--PRON-Gen (5)
- VERB-Fin--PRON-Nom (1819)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Nom (17)
- VERB-Inf--PRON-Nom (15)
- obj
- VERB-Conv--NOUN-Acc (144)
- VERB-Conv--NOUN-Dat (1)
- VERB-Conv--NOUN-Gen (29)
- VERB-Conv--PRON-Acc (16)
- VERB-Conv--PRON-Dat (2)
- VERB-Conv--PRON-Gen (5)
- VERB-Fin--NOUN-Acc (2222)
- VERB-Fin--NOUN-Dat (118)
- VERB-Fin--NOUN-Gen (560)
- VERB-Fin--NOUN-Gen-ADP(близько) (1)
- VERB-Fin--NOUN-Gen-ADP(від) (1)
- VERB-Fin--NOUN-Ins (19)
- VERB-Fin--NOUN-Nom (3)
- VERB-Fin--PRON-Acc (563)
- VERB-Fin--PRON-Dat (199)
- VERB-Fin--PRON-Gen (54)
- VERB-Fin--PRON-Ins (1)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--NOUN-Acc (848)
- VERB-Inf--NOUN-Dat (25)
- VERB-Inf--NOUN-Gen (113)
- VERB-Inf--NOUN-Ins (4)
- VERB-Inf--NOUN-Nom (1)
- VERB-Inf--PRON-Acc (167)
- VERB-Inf--PRON-Dat (28)
- VERB-Inf--PRON-Gen (23)
- iobj
- VERB-Conv--PRON-Acc (1)
- VERB-Conv--PRON-Dat (1)
- VERB-Fin--NOUN-Acc (2)
- VERB-Fin--NOUN-Dat (84)
- VERB-Fin--PRON-Acc (2)
- VERB-Fin--PRON-Dat (151)
- VERB-Inf--NOUN-Acc (2)
- VERB-Inf--NOUN-Dat (32)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Dat (31)
Verbs with Reflexive Core Objects
- This corpus contains 69 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: проявити себе, дозволити собі, дозволяти собі, зробити собі, набрати собі, обрати собі, поставити собі, пізнавати себе, бажати собі, варити собі, вважати себе, вводити собі, взяти собі, вибити собі, вигадати собі, видати собі, визнавати себе, викликати собі, виховувати собі, властивий собі, влаштовувати собі, впізнавати себе, віддати себе, відмовляти собі, віднайти себе, вітати себе, гадати собі, говорити собі, гризти своїх, губити себе, давати собі, доповнювати себе, думати собі, забрати собі, заздрити сама, замовити собі, запам’ятати собі, запитувати себе, зарахувати себе, заспокоювати самі, зварити собі, здобути собі, знайти себе, знайти собі, казати собі, копати собі, купити собі, назвати себе, насолити собі, нафантазувати собі
- Out of those, 1 lemmas occurred more than once, but never without a reflexive dependent. Examples: проявити
Relations Overview
- This corpus uses 22 relation subtypes: acl:adv, acl:relcl, advcl:pred, advcl:svc, advmod:det, compound:svc, conj:svc, det:numgov, det:nummod, flat:abs, flat:foreign, flat:name, flat:range, flat:repeat, flat:sibl, flat:title, nummod:gov, parataxis:discourse, parataxis:newsent, parataxis:rel, vocative:cl, xcomp:pred
- The following 2 relation types are not used in this corpus at all: clf, dep