UD Croatian SET
Language: Croatian (code: hr
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v1.1 release.
The following people have contributed to making this treebank part of UD: Željko Agić, Nikola Ljubešić, Daniel Zeman.
Repository: UD_Croatian-SET
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: news, web, wiki
Questions, comments? General annotation questions (either Croatian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [zeljko • agic (æt) gmail • com]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually, natively in UD style |
Description
The Croatian UD treebank is based on the extension of the SETimes-HR corpus, the hr500k corpus.
The sentences are partially parallel with the smaller Serbian UD treebank, which
comes from the Serbian edition of SETimes. For the UD release 2.4, the Croatian and Serbian
corpus were enriched with newdoc
metadata and re-split so that the corresponding
documents are in the same section (train/dev/test) in Croatian and Serbian.
Sentence ids have also been changed to reflect the domain / source the data comes from, and not the dependence to one of the sections (train/dev/test), as was the case in previous releases.
Training set.
Contains 6,844 sentences (151,226 tokens) from three sources:
- sentence ids
set.hr*
: pseudorandom 80% of documents of newspaper text from the Southeast European Times news website, obtained from the SETimes parallel corpus. This part of the treebank is built on top of the SETimes.HR dependency treebank of Croatian; - sentence ids
news.hr*
: pseudorandom 80% of documents of Croatian news web sources. - sentence ids
web.hr*
: pseudorandom 80% of sentences of Croatian web sources.
Development set.
Contains 954 sentences (21,952 tokens) from three sources:
- sentence ids
set.hr*
: pseudorandom 10% of documents of newspaper text from the Southeast European Times. - sentence ids
news.hr*
: pseudorandom 10% of documents of Croatian news web sources. - sentence ids
web.hr*
: pseudorandom 10% of sentences of Croatian web sources.
Test set.
Contains 1214 sentences (26,263 tokens) from four sources:
- sentence ids
set.hr*
: pseudorandom 10% of documents of newspaper text from the Southeast European Times (+ the previous test set from the same source). - sentence ids
wiki.hr*
: old Wikipedia-based test set. - sentence ids
news.hr*
: pseudorandom 10% of documents of Croatian news web sources. - sentence ids
web.hr*
: pseudorandom 10% of sentences of Croatian web sources.
Details
Sentence and word segmentation was manually checked. The treebank does not include multiword tokens. No language-specific features and relations were used. The POS tags and features were converted from Multext East v6 (present in the XPOS column) and manually checked. The syntactic annotation was done manually.
Acknowledgments
When using the Croatian UD treebank, please cite the following paper:
- Željko Agić and Nikola Ljubešić. 2015. Universal Dependencies for Croatian (that work for Serbian, too).. In Proc. BSNLP, pp. 1–8 (bib).
See file LICENSE.txt for further licensing information.
Statistics of UD Croatian SET
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Animacy – Case – Definite – Degree – Foreign – Gender – Gender[psor] – Mood – Number – Number[psor] – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:emph – amod – appos – aux – case – cc – ccomp – compound – conj – cop – csubj – dep – det – det:numgov – discourse – dislocated – expl – fixed – flat – flat:foreign – iobj – list – mark – nmod – nsubj – nummod – nummod:gov – obj – obl – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 9010 sentences and 199409 tokens.
- This corpus contains 23422 tokens (12%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 635 types of words that contain both letters and punctuation. Examples: UN-a, NATO-u, NATO-a, dr., OESS-a, EBRD-a, KFOR-a, MMF-a, tzv., BDP-a, UNMIK-a, prof., EU-a, HDZ-a, SAD-u, Pop-Lazić, SAD-a, SDP-a, g., npr., tj., Index.hr, sl., sv., ICTY-em, Izbori.net, Lukić-Nagy, OHR-a, UN-ova, r., web-stranica, Bukumirić-Katić, EP-a, EULEX-a, MMF-om, Moody's, PDV-a, UNESCO-a, e-mail, engl., mil., sc., st., HAMAG-a, ICTY-a, KBC-u, NLO-ima, UN-ovog, al-Qaede, on-line
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 33 word types tagged as particles (PART): Eto, ali, ama, bar, barem, baš, bilo, da, evo, god, i, jedva, kako, li, ma, moguće, ne, neka, nešto, ni, niti, npr., ono, pak, sve, tako, tek, tj., to, ustvari, zar, čak, što
- This corpus contains 21 lemmas tagged as pronouns (PRON): biti, itko, išta, ja, mi, netko, nešto, nitko, ništa, on, onaj, oni, sebe, svatko, svašta, taj, ti, tko, vi, što, štošta
- This corpus contains 49 lemmas tagged as determiners (DET): dosta, dovoljno, ikakav, ičiji, još, kakav, kakav-takav, koji, koliki, koliko, malo, mnogo, moj, naš, nekakav, neki, nekoliko, nečiji, nikakav, ničiji, njegov, njen, njezin, njihov, onaj, onakav, ovaj, ovakav, par, podosta, pokoji, pola, posto, previše, puno, sav, svakakav, svaki, svačiji, sve, svoj, taj, takav, te, tolik, toliko, tvoj, vaš, čiji
- Out of the above, 2 lemmas occurred sometimes as PRON and sometimes as DET: onaj, taj
- This corpus contains 2 lemmas tagged as auxiliaries (AUX): biti, htjeti
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: htjeti
- There are 4 (de)verbal forms:
- Conv
- ADV: uključujući, zahvaljujući, govoreći, ističući, dodajući, ukazujući, tražeći, opisujući, pozivajući, sudeći
- Fin
- AUX: je, su, će, bi, nije, smo, sam, neće, nisu, ćete
- VERB: može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju
- Inf
- AUX: biti, bit
- VERB: imati, pomoći, raditi, pronaći, vidjeti, reći, nastaviti, dobiti, doći, morati
- Part
- ADJ: održana, otvorena, održan, povećana, objavljenom, održano, otvoren, rođen, postignut, usmjerene
- AUX: bio, bilo, bila, bili, bile
- VERB: izjavio, rekao, kazao, mogli, mogla, dodao, mogao, moglo, trebala, dobili
Nominal Features
- Fem
- ADJ: prošle, hrvatske, druge, sve, nove, europske, prva, nova, novu, političke
- ADJ-Part: održana, otvorena, povećana, smještene, uspostavljena, objavljena, provedena, završena, integrirane, izrečena
- AUX-Part: bila, bile
- DET: koje, koja, ove, koju, kojoj, svoje, svoju, te, ta, kojima
- NOUN: godine, godina, zemlje, kuna, zemalja, stranke, država, strane, vlada, vlasti
- NUM: dvije, jedna, jednu, dviju, jedne, obje, jednoj, jednom, obiju, objema
- PRON: ona, joj, je, ju, one, nje, njom, nju, njoj, njome
- PROPN: BiH, Hrvatskoj, Srbije, Hrvatska, Srbija, Hrvatske, Europe, Srbiji, Makedonija, Turske
- VERB-Part: mogla, trebala, izjavila, dobila, priopćila, rekla, postala, imala, kazala, objavila
- Masc
- ADJ: novi, prvi, drugi, svi, vanjskih, glavni, hrvatski, bivši, najveći, novog
- ADJ-Part: održan, otvoren, rođen, postignut, namijenjen, objavljen, osuđen, uhićen, izloženi, nazvan
- AUX-Part: bio, bili
- DET: koji, svoj, taj, neki, koje, ovaj, ovog, kojem, kojim, kojima
- NOUN: milijuna, eura, ljudi, dana, predsjednik, poslova, način, ministar, dio, ponedjeljak
- NUM: jedan, jednog, jednom, jednim, jedni, oba, dvaju, dvama, obaju, Dva
- PRON: ga, mu, on, oni, tko, nitko, njega, njemu, netko, svatko
- PROPN: EU, SETimes, UN-a, Windows, Beogradu, NATO-u, NATO-a, Bog, Zagrebu, Zagreb
- VERB-Part: izjavio, rekao, kazao, mogli, dodao, mogao, dobili, trebao, trebali, imali
- Neut
- ADJ: moguće, potrebno, važno, dobro, drugo, prvo, internetskog, ljudskih, pravo, radnih
- ADJ-Part: održano, objavljenom, objavljeno, omogućeno, pronađeno, utvrđeno, učinjeno, predviđeno, provedeno, uhićeno
- AUX-Part: bilo, bila
- DET: to, toga, koje, tome, sve, ovo, koja, svoje, time, tim
- NOUN: vrijeme, mjesto, prava, pitanje, mjesta, pitanja, ulaganja, rješenje, članstvo, području
- NUM: jedno, jednog, jednom, Dvoje, Oba, dva, dvoja, jednoga
- PRON: što, ništa, nešto, ono, čime, čega, čemu, ona, išta, nečemu
- PROPN: Kosova, Kosovo, Kosovu, Sarajevu, Skoplju, Kosovom, Skoplja, Skoplje, Jarinje, Sarajevo
- VERB-Part: moglo, trebalo, došlo, pokazalo, dogodilo, omogućilo, ostalo, dovelo, počelo, prošlo
- Anim
- ADJ: bivšeg, najboljeg, novog, glavnog, drugog, drugoga, britanskog, kosovskog, optuženog, popularnog
- ADJ-Part: optuženog, gonjenog, nagrađivani, nominiranog, organizirani, plaćenog, podređenog, predloženog, zaštićenog
- DET: kojeg, svojeg, nekoga, njegova, svog, svoga, kojega, svakog, onoga, mog
- NOUN: predsjednika, kandidata, ministra, premijera, čovjeka, izvođača, sina, povjerenika, ravnatelja, savjetnika
- NUM: jednog
- PRON: nikoga
- PROPN: Boga, Đinđića, Erdogana, Antu, Borisa, Burkaya, Gruevskog, Ivanova, Krasniqia, Krista
- Inan
- ADJ: prvi, novi, drugi, veći, veliki, gospodarski, velik, najbolji, isti, najveći
- ADJ-Part: nazvan, očekivani, predloženi, baziran, iskazan, isticani, kategoriziran, ljubljeni, nadziran, obavljeni
- DET: svoj, koji, taj, ovaj, njihov, svaki, neki, naš, takav, njegov
- NOUN: način, ponedjeljak, utorak, petak, četvrtak, rad, posao, život, sustav, razvoj
- NUM: jedan, pedeseti, trideset
- PROPN: SETimes, EU, NATO, Windows, Balkan, Haag, Zagreb, Cipar, Beograd, Ferrari
- Plur
- ADJ: svi, sve, vanjskih, novih, svih, drugih, unutarnjih, mnogi, nove, drugi
- ADJ-Part: izloženi, smještene, usmjerene, izabrani, korištene, podijeljeni, integrirane, održani, podignute, uključene
- AUX-Fin: su, smo, će, bi, nisu, ćete, ćemo, ste, biste, bismo
- AUX-Part: bili, bile, bila
- DET: koji, koje, kojima, svoje, neki, koja, tih, svojim, oni, svojih
- NOUN: godina, milijuna, eura, ljudi, kuna, zemalja, poslova, dana, zemlje, prava
- NUM: dvije, dviju, triju, jedni, dvaju, četiriju, dva, dvama, trima, četirima
- PRON: ih, im, njih, mi, nam, vam, nas, oni, njima, vas
- PROPN: Srbi, Srba, Albanaca, Albanci, Grka, Turaka, Grci, Hrvata, Hrvati, Crnogorci
- VERB-Fin: mogu, možete, imaju, moraju, postoje, kažu, žele, možemo, rade, nalaze
- VERB-Part: mogli, dobili, trebali, imali, uspjeli, potpisali, morali, mogle, odlučili, postigli
- Sing
- ADJ: prvi, novi, glavni, prošle, drugi, novog, bivši, prošlog, potrebno, najveći
- ADJ-Part: održana, održan, otvorena, objavljenom, povećana, održano, otvoren, rođen, postignut, namijenjen
- AUX-Fin: je, će, bi, nije, sam, neće, bude, jest, bih, nisam
- AUX-Part: bio, bilo, bila
- DET: to, koji, koja, toga, ove, koje, koju, svoj, sve, tome
- NOUN: godine, predsjednik, vrijeme, način, ministar, dio, ponedjeljak, tjedna, premijer, broj
- NUM: jedan, jedna, jednom, jednog, jednu, jedno, jedne, jednoj, jednim, jednoga
- PRON: ga, mu, on, ona, mi, joj, ono, ja, je, njega
- PROPN: EU, BiH, Kosova, Hrvatskoj, Srbije, SETimes, Hrvatska, Kosovo, Srbija, UN-a
- VERB-Fin: može, ima, kaže, treba, nema, mora, postoji, radi, očekuje, navodi
- VERB-Part: izjavio, rekao, kazao, dodao, mogla, mogao, moglo, trebala, trebao, istaknuo
- Acc
- ADJ: sve, prvi, novi, novu, nove, druge, veliku, ratne, drugi, brojne
- ADJ-Part: usmjerene, usmjerenu, dodanu, ispunjene, iznesene, izrečeno, nazvan, optuženog, oročene, oročenu
- ADP: za, u, na, uz, kroz, po, pred, pod, među, nad
- DET: to, koje, svoje, koju, svoj, sve, svoju, koji, taj, tu
- NOUN: način, ponedjeljak, vrijeme, srijedu, godinu, utorak, petak, mjesto, četvrtak, pomoć
- NUM: jedan, jednu, dvije, jednog, jedno, oba, obje, pedeseti, trideset
- PRON: se, ga, ih, što, nas, je, ništa, vas, nešto, me
- PROPN: SETimes, EU, Kosovo, Hrvatsku, BiH, Srbiju, Tursku, NATO, Bugarsku, Windows
- Dat
- ADJ: svim, drugima, europskoj, međunarodnim, svima, drugim, gospodarskom, bivšem, državnim, europskim
- ADJ-Part: održanom, otežanim, podijeljenom, potpisanim, povećanim, priznatim, provedenim, ubijenom, uključenim, unesrećenome
- ADP: unatoč, ka, usprkos, k, nasuprot
- DET: tome, kojima, onima, svojim, kojoj, svim, svojoj, kojemu, kojem, toj
- NOUN: novinarima, zemlji, djeci, građanima, javnosti, integraciji, premijeru, uniji, zajednici, članstvu
- NUM: jednoj, Dvjema, objema
- PRON: im, mu, nam, vam, mi, joj, ti, si, nikome, nama
- PROPN: EU, NATO-u, Beogradu, Srbiji, Hrvatskoj, Europi, Kosovu, Vladi, Turskoj, Bogu
- Gen
- ADJ: vanjskih, novih, prošle, svih, drugih, prošlog, novog, unutarnjih, europske, hrvatske
- ADJ-Part: organizirane, postavljenih, financiranog, ispitanih, izabranih, iznesenih, nadređenih, namijenjenih, obnovljenih, odobrenog
- ADP: od, iz, do, nakon, zbog, tijekom, protiv, prije, bez, između
- DET: toga, ove, ovog, tih, svojih, te, tog, kojih, svih, svoje
- NOUN: godine, milijuna, eura, godina, kuna, dana, zemalja, poslova, ljudi, tjedna
- NUM: dviju, jednog, jedne, triju, dvaju, obiju, četiriju, obaju, desetaka, jednoga
- PRON: njih, čega, njega, ih, nas, sebe, nje, koga, nečeg, nečega
- PROPN: EU, Kosova, Srbije, BiH, UN-a, Hrvatske, Europe, Turske, NATO-a, Crne
- Ins
- ADJ: drugim, ostalim, velikim, novim, političkim, brojnim, međunarodnim, samim, većim, najvećim
- ADJ-Part: nadređenima, zaštićenim, Navedenim, Provedenom, dokazanom, kvalificiranim, najavljenim, nanesenom, nominiranima, nošenim
- ADP: s, sa, među, pod, za, pred, nad, Preda, umjesto
- DET: kojim, kojima, tim, time, svojim, kojom, svojom, takvim, ovom, nekim
- NOUN: obzirom, ljudima, predsjednikom, zemljama, nazivom, godinama, kolegom, sporazumom, pritiskom, zakonom
- NUM: jednim, jednom, obje, trima
- PRON: čime, njima, sobom, njim, njom, nama, njime, kim, kime, mnom
- PROPN: Srbijom, Crnom, Gorom, Grčkom, Kosovom, EU, Hrvatskom, ICTY-em, Makedonijom, Beogradom
- Loc
- ADJ: prvom, svim, drugom, drugim, novom, prvoj, hrvatskom, međunarodnim, svjetskom, tiskovnoj
- ADJ-Part: objavljenom, održanoj, održanom, pogođenim, danom, objavljenoj, postavljenoj, danim, danoj, dostavljenom
- ADP: u, na, o, prema, po, pri, ka, naspram, pred
- DET: kojoj, kojem, tome, tom, kojima, ovom, svojoj, ovoj, svojim, toj
- NOUN: godini, zemlji, svijetu, području, mjestu, slučaju, odnosu, regiji, izvješću, priopćenju
- NUM: jednom, jednoj, dvama, obje, objema, četirima, jednome, oba, trima
- PRON: njemu, sebi, čemu, njima, nama, njoj, meni, nečemu, nečem, svačemu
- PROPN: Hrvatskoj, Kosovu, Srbiji, Beogradu, EU, Europi, Makedoniji, BiH, NATO-u, Zagrebu
- Nom
- ADJ: svi, drugi, novi, glavni, prvi, hrvatski, bivši, moguće, potrebno, mnogi
- ADJ-Part: održana, otvorena, održan, povećana, održano, rođen, otvoren, postignut, namijenjen, objavljen
- DET: koji, to, koja, koje, neki, ta, ovo, sve, taj, oni
- NOUN: predsjednik, ministar, premijer, dio, vlada, zemlja, ljudi, broj, većina, zemlje
- NUM: jedan, jedna, dvije, jedno, jedni, obje, oba, dva, Dvoje, dvoja
- PRON: što, on, mi, ona, oni, tko, ono, ja, nitko, netko
- PROPN: Hrvatska, Srbija, Kosovo, Makedonija, Bugarska, Turska, Windows, Vlada, EU, Bog
- Voc
- ADJ: Najdraži, Nespretni, Uzoriti, dobri, dragi, mala, prvi, svemogući
- DET: moj, moja, moji
- NOUN: gospodine, akademiče, braćo, budale, gospodo, gradonačelniče, kurvo, mediji, ministre, pape
- PRON: ti
- PROPN: Bože, Isuse, Radoviću
- Def
- ADJ: novi, sve, svi, vanjskih, glavni, novih, nove, prošle, hrvatski, moguće
- ADJ-Part: održana, otvorena, povećana, objavljenom, održano, usmjerene, izloženi, objavljena, smještene, uspostavljena
- Ind
- ADJ: velik, sam, dobar, važan, poznat, održan, otvoren, postignut, rođen, siguran
- ADJ-Part: održan, otvoren, rođen, postignut, namijenjen, objavljen, osuđen, uhićen, nazvan, povećan
Degree and Polarity
- Cmp
- ADJ: veći, veće, manji, veća, veću, većeg, bolje, bolji, niže, većim
- ADV: više, dalje, manje, kasnije, bolje, ranije, brže, češće, lakše, dulje
- DET: više, manje
- Pos
- ADJ: novi, prvi, drugi, sve, svi, vanjskih, glavni, novih, nove, prošle
- ADJ-Part: održana, otvorena, održan, povećana, objavljenom, održano, otvoren, rođen, postignut, usmjerene
- ADV: samo, još, također, već, posto, međutim, oko, vrlo, danas, kada
- DET: nekoliko, mnogo, pola, puno, posto, malo, dosta, dovoljno, previše, koliko
- Sup
- ADJ: najveći, najbolji, najveća, najveće, najvećih, najbolje, najboljeg, najvažnije, najvećim, najvećem
- ADV: najviše, najmanje, najbolje, najčešće, najvjerojatnije, najradije, najgore, najteže, Najdalje, najbrže
- DET: najviše
- Neg
- AUX-Fin: nije, neće, nisu, nismo, nisam, nećemo, niste, nećete, neću, nećeš
- PART: ne, niti, ni
- Pos
- PART: da
Verbal Features
- Cnd
- AUX-Fin: bi, biste, bismo, bih
- Imp
- AUX-Fin: budite
- VERB-Fin: kliknite, recimo, izbjegavajte, koristite, potražite, pročitajte, čuvajte, daj, nemojte, odaberite
- Ind
- AUX-Fin: je, su, će, nije, smo, sam, neće, nisu, ćete, ćemo
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju
- Imp
- AUX-Fin: bijaše
- Past
- ADV-Conv: dodavši, rekavši, kazavši, pobijedivši, završivši, dosegnuvši, naglasivši, primijetivši, Izrazivši, Napomenuvši
- AUX-Fin: bi, biste, bismo, bih
- AUX-Part: bio, bilo, bila, bili, bile
- VERB-Fin: može, dogodi, hoće, iznosi, osigura, pobuni
- VERB-Part: izjavio, rekao, kazao, mogli, mogla, dodao, mogao, moglo, trebala, dobili
- Pres
- ADV-Conv: uključujući, zahvaljujući, govoreći, ističući, dodajući, ukazujući, tražeći, opisujući, pozivajući, sudeći
- AUX-Fin: je, su, će, nije, smo, sam, neće, nisu, ćete, ćemo
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, možete, imaju
- Act
- AUX-Part: bio, bilo, bila, bili, bile
- VERB-Part: izjavio, rekao, kazao, mogli, mogla, dodao, mogao, moglo, trebala, dobili
- Pass
- ADJ-Part: održana, otvorena, održan, povećana, objavljenom, održano, otvoren, rođen, postignut, usmjerene
Pronouns, Determiners, Quantifiers
- Dem
- ADV: sada, tako, tada, onda, tu, zato, ovdje, stoga, tamo, toliko
- DET: to, ove, toga, tome, taj, te, ovog, tom, ovaj, ovo
- Ind
- ADV: ponekad, ikad, nekada, nekoliko, negdje, ikada, nekad, nekako, odnekud
- DET: nekoliko, neki, neke, nekim, neka, nekog, nekih, neku, neko, nekoga
- PRON: nešto, netko, itko, išta, nečemu, nekome, nečeg, nečega, nekog, nečem
- Int,Rel
- ADV: kada, kad, gdje, kako, koliko, zašto, odakle
- DET: koji, koje, koja, kojima, koju, kojoj, kojem, kojim, kojeg, kojih
- PRON: što, tko, čime, čega, čemu, koga, kim, kome, kime, čim
- Neg
- ADV: nikad, nikada, nikako, nigdje
- DET: nikakve, nikakvu, nikakvih, nikakvo, nikakvi, Nikakva, nikakav, ničiju
- PRON: ništa, nitko, nikome, nikoga, ničeg, NIKOG
- Prs
- DET: svoje, svoj, svoju, svojim, njegova, svojih, njegov, njihov, naše, svojoj
- PRON: se, ih, mi, ga, im, mu, on, njih, nam, vam
- Tot
- ADV: uvijek, svakako, svuda, svugdje, posvuda
- DET: sve, svaki, svih, svaka, svakog, svega, svake, svi, svakom, svim
- PRON: svatko, svačemu, svašta
- Card
- NUM: tri, dva, jedan, pet, četiri, 20, 10, šest, dvije, deset
- Mult
- NUM: desetak, oba, dvoje, obje, dvadesetak, stotinjak, troje, obiju, 6-4, tridesetak
- SYM: 50%, 20%, 30%, 13%, 14%, 16%, 40%, 45%, 60%, 66%
- Ord
- ADJ: 1., 2004., 2008., 2007., 2009., 2006., 2., 2005., 2010., 21.
- Yes
- ADJ: nevladinih, nevladine, UN-ova, vladinih, Appleovih, Ashdownov, Božju, UN-ovog, vladini, Appleov
- DET: svoje, svoj, svoju, svojim, njegova, svojih, njegov, njihov, naše, svojoj
- Yes
- DET: svoje, svoj, svoju, svojim, svojih, svojoj, svojeg, svog, svom, svojem
- PRON: se, sebe, sebi, sobom, si
- 1
- AUX-Fin: smo, sam, ćemo, bismo, nismo, bih, nisam, ću, nećemo, neću
- DET: naše, naš, naša, našim, naših, moj, moja, našeg, naši, našu
- PRON: mi, nam, nas, ja, me, nama, mene, meni, mnom
- VERB-Fin: možemo, mislim, imamo, moramo, želimo, mogu, nadamo, vjerujem, nadam, znam
- 2
- AUX-Fin: ćete, ste, biste, si, bi, niste, Jeste, nećete, ćeš, budite
- DET: vaše, vašem, vaš, vaša, vašim, vašeg, tvoj, Tvoji, tvoja, tvoje
- PRON: vam, vas, ti, vi, vama, te, tebe, tebi
- VERB-Fin: možete, želite, kliknite, imate, morate, nemojte, koristite, možeš, nemate, očekujete
- 3
- AUX-Fin: je, su, će, bi, nije, neće, nisu, bude, jest, hoće
- DET: njegova, njegov, njihov, njihova, njegove, njihove, njegovu, njihovu, njezina, njihovo
- PRON: ih, ga, im, mu, on, njih, ona, joj, oni, ono
- VERB-Fin: može, ima, kaže, treba, mogu, nema, mora, postoji, imaju, radi
- Fem
- DET: njezina, njezine, njezin, njen, njezinu, njezinih, njene, njezino, njezinom, njena
- Masc,Neut
- DET: njegova, njegov, njegove, njegovu, njegovim, njegovoj, njegovog, njegovo, njegovih, njegovom
- Plur
- DET: njihov, naše, njihova, naš, njihove, naša, njihovu, našim, naših, njihovo
- Sing
- DET: njegova, njegov, njegove, njegovu, njezina, moj, njegovim, njezine, moja, njegovoj
Other Features
- Foreign
- Yes
- X: online, of, the, de, Company, and, world, European, International, Freedom
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: biti.
- This corpus uses 2 lemmas as auxiliaries (aux). Examples: biti, htjeti.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN (7)
- VERB-Fin--NOUN-Acc (29)
- VERB-Fin--NOUN-Dat (2)
- VERB-Fin--NOUN-Gen (108)
- VERB-Fin--NOUN-Gen-ADP(do) (3)
- VERB-Fin--NOUN-Gen-ADP(od) (17)
- VERB-Fin--NOUN-Nom (2688)
- VERB-Fin--NOUN-Nom-ADP(diljem) (1)
- VERB-Fin--NOUN-Voc (1)
- VERB-Fin--PRON-Acc (6)
- VERB-Fin--PRON-Gen (5)
- VERB-Fin--PRON-Gen-ADP(od) (1)
- VERB-Fin--PRON-Nom (329)
- VERB-Inf--NOUN-Acc (11)
- VERB-Inf--NOUN-Gen (15)
- VERB-Inf--NOUN-Gen-ADP(od) (2)
- VERB-Inf--NOUN-Nom (471)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Nom (53)
- VERB-Part--NOUN (6)
- VERB-Part--NOUN-Acc (12)
- VERB-Part--NOUN-Gen (76)
- VERB-Part--NOUN-Gen-ADP(od) (20)
- VERB-Part--NOUN-Gen-ADP(oko) (1)
- VERB-Part--NOUN-Nom (2293)
- VERB-Part--NOUN-Nom-ADP(između) (1)
- VERB-Part--PRON-Acc (5)
- VERB-Part--PRON-Dat (1)
- VERB-Part--PRON-Gen (6)
- VERB-Part--PRON-Nom (190)
- obj
- VERB-Fin--NOUN (7)
- VERB-Fin--NOUN-Acc (1914)
- VERB-Fin--NOUN-Acc-ADP(na) (3)
- VERB-Fin--NOUN-Dat (116)
- VERB-Fin--NOUN-Gen (205)
- VERB-Fin--NOUN-Gen-ADP(od) (13)
- VERB-Fin--NOUN-Gen-ADP(preko) (1)
- VERB-Fin--NOUN-Ins (31)
- VERB-Fin--NOUN-Loc (4)
- VERB-Fin--NOUN-Nom (45)
- VERB-Fin--PRON-Acc (500)
- VERB-Fin--PRON-Acc-ADP(na) (2)
- VERB-Fin--PRON-Acc-ADP(za) (3)
- VERB-Fin--PRON-Dat (72)
- VERB-Fin--PRON-Gen (3)
- VERB-Fin--PRON-Gen-ADP(od) (1)
- VERB-Fin--PRON-Ins (3)
- VERB-Fin--PRON-Loc (1)
- VERB-Fin--PRON-Nom (14)
- VERB-Inf--NOUN (3)
- VERB-Inf--NOUN-Acc (1257)
- VERB-Inf--NOUN-Dat (40)
- VERB-Inf--NOUN-Gen (96)
- VERB-Inf--NOUN-Gen-ADP(do) (1)
- VERB-Inf--NOUN-Gen-ADP(između) (1)
- VERB-Inf--NOUN-Gen-ADP(od) (2)
- VERB-Inf--NOUN-Gen-ADP(oko) (1)
- VERB-Inf--NOUN-Ins (15)
- VERB-Inf--NOUN-Loc-ADP(u) (1)
- VERB-Inf--NOUN-Nom (17)
- VERB-Inf--PRON-Acc (162)
- VERB-Inf--PRON-Dat (19)
- VERB-Inf--PRON-Ins (2)
- VERB-Inf--PRON-Nom (3)
- VERB-Part--NOUN (1)
- VERB-Part--NOUN-Acc (1819)
- VERB-Part--NOUN-Acc-ADP(na) (1)
- VERB-Part--NOUN-Acc-ADP(po) (1)
- VERB-Part--NOUN-Acc-ADP(za) (1)
- VERB-Part--NOUN-Dat (100)
- VERB-Part--NOUN-Gen (171)
- VERB-Part--NOUN-Gen-ADP(do) (1)
- VERB-Part--NOUN-Gen-ADP(od) (7)
- VERB-Part--NOUN-Ins (26)
- VERB-Part--NOUN-Loc (11)
- VERB-Part--NOUN-Loc-ADP(o) (1)
- VERB-Part--NOUN-Nom (38)
- VERB-Part--PRON-Acc (310)
- VERB-Part--PRON-Acc-ADP(na) (1)
- VERB-Part--PRON-Acc-ADP(za) (4)
- VERB-Part--PRON-Dat (33)
- VERB-Part--PRON-Gen (2)
- VERB-Part--PRON-Ins (1)
- VERB-Part--PRON-Loc (1)
- VERB-Part--PRON-Nom (11)
- iobj
- VERB-Fin--NOUN-Acc (3)
- VERB-Fin--NOUN-Dat (83)
- VERB-Fin--NOUN-Gen (5)
- VERB-Fin--NOUN-Ins (17)
- VERB-Fin--NOUN-Loc (4)
- VERB-Fin--PRON-Dat (108)
- VERB-Fin--PRON-Ins (1)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--NOUN-Dat (59)
- VERB-Inf--NOUN-Gen (1)
- VERB-Inf--NOUN-Ins (15)
- VERB-Inf--NOUN-Loc (2)
- VERB-Inf--PRON-Acc (2)
- VERB-Inf--PRON-Dat (44)
- VERB-Inf--PRON-Loc (1)
- VERB-Part--NOUN-Dat (89)
- VERB-Part--NOUN-Gen (4)
- VERB-Part--NOUN-Ins (14)
- VERB-Part--NOUN-Ins-ADP(sa) (1)
- VERB-Part--NOUN-Loc (5)
- VERB-Part--PRON-Acc (1)
- VERB-Part--PRON-Dat (65)
- VERB-Part--PRON-Gen (1)
- VERB-Part--PRON-Ins (1)
Verbs with Reflexive Core Objects
- This corpus contains 260 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: baviti se, nalaziti se, vratiti se, kretati se, moći se, nadati se, pojaviti se, boriti se, odlučiti se, trebati se, činiti se, dogoditi se, odnositi se, osjećati se, pridružiti se, priključiti se, vraćati se, zalagati se, događati se, grijati se, okladiti se, očitovati se, pokazati se, pripremati se, raditi se, sastati se, sastojati se, uvjeriti se, dizati se, morati se, naći se, obratiti se, okupljati se, pitati se, probuditi se, razvijati se, služiti se, suočiti se, temeljiti se, upoznati se, širiti se, aktivirati se, brinuti se, fokusirati se, gaditi se, izjasniti se, javiti se, mijenjati se, odlučivati se, odreći se
- Out of those, 6 lemmas occurred more than once, but never without a reflexive dependent. Examples: grijati, okladiti, fokusirati, gaditi, požaliti, pridruživati
Relations Overview
- This corpus uses 4 relation subtypes: advmod:emph, det:numgov, flat:foreign, nummod:gov
- The following 3 relation types are not used in this corpus at all: clf, goeswith, reparandum