home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

UD Slovenian SSJ

Language: Slovenian (code: sl)
Family: IE

This treebank has been part of Universal Dependencies since the UD v1.2 release.

The following people have contributed to making this treebank part of UD: Kaja Dobrovoljc, Tomaž Erjavec, Simon Krek.

Repository: UD_Slovenian-SSJ
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.18

License: CC BY-SA 4.0

Genre: news, nonfiction, fiction

Questions, comments? General annotation questions (either Slovenian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [kaja • dobrovoljc (æt) ijs • si]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.

Annotation	Source
Lemmas	annotated manually
UPOS	annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion
XPOS	annotated manually
Features	annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion
Relations	annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion

Description

The SSJ treebank is the reference UD treebank for Slovenian, consisting of approximately 13,000 sentences and 267,097 tokens from fiction, non-fiction, periodical and Wikipedia texts in standard modern Slovenian. As of UD release 2.10 in May 2022, the original version of the SSJ UD treebank has been partially manually revised and extended with new manually annotated data.

The original Slovenian SSJ UD Treebank, first released as part of UD v1.2 in 2015 (Dobrovoljc et al. 2017), was created through a fine-grained rule-based conversion of the ssj500k treebank (Krek et al. 2021), the largest collection of manually syntactically annotated data in Slovenian, originally annotated in the JOS annotation scheme (Erjavec et al. 2010). With the exception of the manual disambiguation of the AUX and VERB occurrences of the verb ‘biti’ (to be), the conversion was fully automatic, based on a set of rules for both morphosyntactic and syntactic layer, which include different lexical, morphological and dependency features, while the original ssj500k tokenization and lemmatization principles remained unchanged. The rules and conversion scripts are available at https://github.com/clarinsi/jos2ud.

In 2022, the original SSJ UD treebank was partially manually revised to correct the previously identified annotation inconsistencies, and implement the newly introduced changes in the annotation guidelines. In addition, the treebank was substantially extended to almost double the original size, with new manually annotated sentences coming from the previously unreleased subset of the ssj500k corpus, and the Slovenian subset of the ELEXIS parallel sense-annotated corpus of Wikipedia texts (Martelli et al. 2021). Despite the extension, the data split remained unchanged with the original SSJ sentences being preserved as part of the same train-dev-test subset. More details on the latest SSJ UD version are given in Dobrovoljc and Ljubešić (2022).

The metadata for most documents in the treebank includes also the document genre. The documents fall into six different genre categories: newspaper, magazine, internet, professional, fiction, other.

The issues section of this repository serves as a platform for general discussion regarding suggestions for the Slovenian UD guidelines and other open issues.

Acknowledgments

We wish to thank all of the contributors to the original ssj500k training corpus (Kristina Bizjak, Živa Blaževič, Klara Canzutti, Lea Cibrič, Kaja Dobrovoljc, Tadeja Dušej, Tomaž Erjavec, Ivana Fekeža, Nanika Holz, Urška Kamenšek, Simon Krek, Andreja Košir, Robert Kuret, Nina Ledinek, Andrej Lovšin, Boštjan Marhold, Nina Mikulin, Barbara Modrijan, Sara Može, Tanja Novak, Lea Peršič, Tanja Radovič, Simona Šinkovec, Urška Vranjek, Jerneja Umer, Petra Žalodec), and the annotators within the Development of Slovene in the Digital Environment project (Tina Munda, Ina Poteko, Rebeka Roblek, Luka Terčon and Karolina Zgaga).

This work was financially supported by Slovenian Research and Innovation Agency (Grants no. Z6-4617, P6-0411, Young Researcher Programme 2013, 2022), Ministry of Culture & the European Regional Development Fund, as well as the COST Actions PARSEME and UniDive.

Key reference

Kaja Dobrovoljc, Tomaž Erjavec, Simon Krek. 2017. The Universal Dependencies Treebank for Slovenian. In: Proceeding of the 6th Workshop on Balto-Slavic Natural Language Processing (BSNLP 2017), 33–38. Valencia, 2017.

Other

Kaja Dobrovoljc, Nikola Ljubešić. 2022. Extending the SSJ Universal Dependencies Treebank for Slovenian: Was it Worth it?. In: Proceedings of the 16th Linguistic Annotation Workshop (LAW-XVI), LREC 2022, 15–22. Marseille, 2022.

Statistics of UD Slovenian SSJ

POS Tags

ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X

Features

Abbr – Animacy – Aspect – Case – Definite – Degree – Foreign – Gender – Gender[psor] – Mood – Number – Number[psor] – NumForm – NumType – Person – Polarity – Poss – PronType – Reflex – Tense – Typo – Variant – VerbForm

Relations

acl – advcl – advmod – amod – appos – aux – case – cc – cc:preconj – ccomp – conj – cop – csubj – dep – det – discourse – dislocated – expl – fixed – flat – flat:foreign – flat:name – goeswith – iobj – list – mark – nmod – nsubj – nummod – obj – obl – orphan – parataxis – punct – root – vocative – xcomp

Tokenization and Word Segmentation

This corpus contains 13435 sentences and 267097 tokens.

This corpus contains 39149 tokens (15%) that are not followed by a space.

This corpus does not contain words with spaces.

This corpus contains 148 types of words that contain both letters and punctuation. Examples: dr., i., št., d., t., m., o., p., l., oz., str., itd., npr., A., n., sv., tel., k., r., s., j., pr., š., g., b., v., H., II., c., itn., E., ipd., TAM-u, angl., mag., odst., prof., z., f., med., W., it., opr., st., tj., IV., IX., gl., ok., 1990-ih

Morphology

Nominal Features

Gender

Fem
- ADJ: druge, drugi, prva, nove, velika, sama, novo, druga, evropske, drugih
- ADJ-Part: določene, znana, povezane, prepričana, ustanovljena, določenih, namenjena, združene, določeno, imenovana
- AUX-Part: bila, bile, bili, bla
- DET: svojo, te, svoje, ta, vse, to, svoji, tej, kateri, vseh
- NOUN: strani, države, večina, možnosti, vrste, država, oči, podlagi, poti, skupine
- NUM: ena, eno, dve, eni, tri, dveh, štiri, ene, treh, dvema
- PRON: jo, jih, ji, njej, njo, je, ona, jim, njih, nje
- PROPN: Slovenije, Sloveniji, EU, Slovenija, ZDA, Evropi, Ljubljana, Ljubljani, Evrope, Slovenijo
- VERB-Part: bila, imela, postala, morala, začela, rekla, dobila, prišla, pokazala, povedala

Masc
- ADJ: prvi, drugi, sam, drugih, slovenski, sami, velik, novi, pravi, veliki
- ADJ-Part: znani, prepričan, pripravljeni, zaposlenih, znan, povezani, namenjen, sprejet, pripravljen, odraslih
- AUX-Part: bil, bili, bila, bli
- DET: ta, vsi, tem, vsak, svoj, njegov, katerem, vse, tega, tisti
- NOUN: primer, dan, ljudi, čas, del, času, dni, tolarjev, svetu, milijonov
- NUM: dva, eden, en, enega, dveh, enem, tri, treh, trije, štiri
- PRON: ga, jih, mu, jim, kdo, njim, njimi, njih, njem, nihče
- PROPN: Maribor, Janez, Mariboru, New, Bojan, ESS, Jože, Slovenci, Slovencev, Boris
- VERB-Part: imel, moral, povedal, imeli, morali, bil, rekel, začel, dejal, postal

Neut
- ADJ: mogoče, potrebno, pomembno, jasno, novo, drugim, težko, znano, dobro, podobno
- ADJ-Part: znano, povezano, prepovedano, rečeno, dovoljeno, odprto, zapisano, določeno, namenjeno, povezana
- AUX-Part: bilo, bila, bili, blo
- DET: to, tem, tega, vse, temu, svoje, njegovo, tisto, vsega, vsem
- NOUN: leta, let, delo, leto, letih, mesto, dela, življenje, vprašanje, mestu
- NUM: eno, dve, tri, štirih, dveh, enem, treh, štiri, dvema, tremi
- PRON: kar, kaj, nekaj, nič, ga, jih, čemer, česar, ničesar, marsikaj
- PROPN: Celje, Kosova, Hrvaškem, Japonskem, Kitajskem, Koroškem, Kosovu, Laško, Slovenskem, Celju
- VERB-Part: bilo, zgodilo, uspelo, prišlo, šlo, zdelo, začelo, ostalo, dalo, imelo

Animacy

Anim
- NOUN: otroka, človeka, predsednika, moža, boga, sina, duha, konja, prijatelja, fanta
- PROPN: Billyja, Andreja, Henrika, Tomaža, Toneta, Boja, Carlosa, Damijana, Damjana, Filipa

Inan
- NOUN: primer, dan, čas, način, del, razvoj, denar, teden, svet, sistem
- PROPN: Dunaj, Irak, Jeruzalem, Nato, Pariz, Windows, Atlantik, Bled, Bruselj, Egipt

Number

Dual
- ADJ: trebušni, izgubljeni, novi, posamični, zadnja, desnima, dodatna, drugačna, drugih, edini
- ADJ-Part: izgubljeni, interpelirana, obsojena, povezana, predstavljena, pridobljeni, Preostalih, identificirana, izoblikovana, izrezani
- AUX-Fin: sta, sva, bosta, nista, nisva, bova
- AUX-Part: bila, bili
- DET: oba, obeh, obe, obema, ti, svoja, ta, katerih, katerima, njuni
- NOUN: leti, letoma, meseca, letih, otroka, policista, primerih, starša, strani, državi
- NUM: dve, dva, dveh, dvema
- PRON: ju, nama, jima, njima, njiju, naju, midva, onadva, vaju, vama
- PROPN: Francoza, Belokranjca, Egipčana, Francozov, Litijana, Makedonca
- VERB-Fin: imata, sta, morata, prideta, sva, omogočata, postaneta, predstavljata, prihajata, vodita
- VERB-Part: imela, morala, bila, odšla, bili, dobila, začela, pogovarjala, srečala, hotela

Plur
- ADJ: drugih, druge, različnih, nove, drugi, novih, sami, drugimi, zadnjih, slovenskih
- ADJ-Part: določene, določenih, zaposlenih, povezani, pripravljeni, povezane, združenih, odraslih, prepričani, zaposleni
- AUX-Fin: so, bodo, smo, niso, bomo, boste, ste, nismo, niste, bodite
- AUX-Part: bili, bile, bila, bli
- DET: vse, vseh, vsi, teh, katerih, te, svojih, svoje, nekatere, nekateri
- NOUN: let, ljudi, letih, dni, tolarjev, milijonov, ljudje, odstotkov, oči, podatkov
- NUM: tri, štiri, pet, tisoč, treh, deset, štirih, sto, šest, sedem
- PRON: jih, nas, jim, nam, vam, njih, njimi, vas, vi, mi
- PROPN: ZDA, Slovenci, Slovencev, Nemci, Francozi, Rusi, Slovence, Američani, Aten, Atenah
- VERB-Fin: so, imajo, moramo, morajo, imamo, uporabljajo, živijo, nimajo, denimo, moremo
- VERB-Part: imeli, morali, začeli, dobili, bili, prišli, našli, odločili, predstavili, ugotovili

Sing
- ADJ: prvi, mogoče, drugi, sam, novo, veliko, prva, drugo, potrebno, drugega
- ADJ-Part: znano, znana, prepričan, znan, namenjen, sprejet, določeno, prepričana, pripravljen, ustanovljena
- AUX-Fin: je, bo, ni, sem, bom, nisem, si, boš, nisi, bodi
- AUX-Part: bil, bila, bilo, bla, blo
- DET: to, tem, tega, ta, vse, svojo, svoje, vsak, katerem, svoj
- NOUN: leta, strani, delo, primer, dan, leto, čas, del, mesto, času
- NUM: eno, ena, eden, enega, en, enem, eni, ene, enim, dvoje
- PRON: ga, jo, kar, mu, kaj, mi, ji, me, nekaj, kdo
- PROPN: Slovenije, Sloveniji, EU, Slovenija, Evropi, Ljubljana, Ljubljani, Evrope, Slovenijo, Maribor
- VERB-Fin: je, ima, ni, gre, bo, mora, pomeni, pravi, zdi, velja
- VERB-Part: bilo, imel, moral, povedal, bila, bil, rekel, začel, dejal, postal

Case

Acc
- ADJ: druge, novo, nove, veliko, drugo, prvi, prvo, različne, prihodnje, splošno
- ADJ-Part: določene, določeno, minuli, ostale, določen, odrasle, zaposlene, pripravljene, dodano, imenovano
- ADP: za, na, v, čez, skozi, po, med, pod, zoper, pred
- DET: to, vse, svoje, svojo, svoj, ta, vsak, te, ves, njegovo
- NOUN: leto, primer, delo, dan, življenje, čas, način, mesto, vlogo, voljo
- NUM: eno, dve, tri, dva, štiri, tisoč, pet, deset, en, enega
- PRON: ga, jih, jo, kaj, me, kar, nas, nekaj, vas, ju
- PROPN: Slovenijo, EU, Evropo, Ljubljano, Jugoslavijo, Slovence, Francijo, Nemčijo, Japonsko, Rusijo

Dat
- ADJ: drugim, drugemu, novim, državnemu, mlajšim, drugi, evropskim, novemu, velikemu, desni
- ADJ-Part: zbranim, sodelujočim, Združenim, Zmletemu, določenemu, določeni, določenim, gnilim, grozeči, imenovanemu
- ADP: k, proti, kljub, h, navkljub, blizu, Klub, nasproti
- DET: temu, vsem, vsemu, svoji, tistim, tej, svojim, njegovi, svojemu, tem
- NOUN: ljudem, členu, delu, koncu, moškim, bogovom, otrokom, predsedniku, skupini, članom
- NUM: eni, trem, enemu, petim, štirim, petdesetim
- PRON: si, mu, mi, ji, jim, nam, vam, ti, njemu, sebi
- PROPN: Sloveniji, Evropi, Janezu, Kopaču, Ljubljani, Mariji, Srbom, Bosku, Diegu, Eulerju

Gen
- ADJ: drugih, različnih, novega, drugega, novih, evropske, slovenskih, slovenske, prvega, velikih
- ADJ-Part: zaposlenih, združenih, določenega, določenih, znanih, omenjenih, obolelih, nasičenih, odraslih, okuženih
- ADP: iz, od, do, zaradi, brez, z, poleg, s, izmed, glede
- DET: tega, vseh, te, teh, svojega, svoje, svojih, katerih, vsega, njegovega
- NOUN: leta, let, dela, ljudi, tolarjev, milijonov, časa, dni, sveta, zakona
- NUM: dveh, treh, enega, ene, petih, štirih, sedmih, desetih, osmih, petnajstih
- PRON: jih, ga, njih, nas, česar, je, njega, sebe, nje, ničesar
- PROPN: Slovenije, EU, Evrope, RS, ESS, Ljubljane, Slovencev, Amerike, Kosova, Zemlje

Ins
- ADJ: drugim, drugimi, različnimi, veliko, kratkim, drugo, novimi, številnimi, velikim, evropsko
- ADJ-Part: znanimi, ostalimi, povečanim, določenim, določenimi, imenovanimi, izrečeno, oslabljeno, povišanim, pridobljenimi
- ADP: z, s, med, pred, pod, za, nad
- DET: tem, svojo, katerimi, svojim, katerim, katero, svojimi, vsemi, temi, njegovimi
- NOUN: leti, pomočjo, delom, letom, vojno, časom, imenom, ljudmi, besedami, naslovom
- NUM: dvema, tremi, petimi, enim, eno, desetimi, šestimi, štirimi, sedmimi, devetimi
- PRON: njimi, njim, seboj, njo, nami, sabo, mano, njima, čimer, menoj
- PROPN: ZDA, Madžarsko, Rusijo, Britanijo, Davidom, Francijo, Hrvaško, Irakom, Jugoslavijo, Marjanom

Loc
- ADJ: drugi, drugem, drugih, zadnjih, prvem, prvi, različnih, glavnem, novem, zadnjem
- ADJ-Part: določenih, odraslih, končani, minulih, omenjenem, ostalih, preteklih, imenovanem, končanem, odprtem
- ADP: v, na, po, pri, o, ob
- DET: tem, katerem, katerih, kateri, tej, svoji, vseh, njegovem, svojem, teh
- NOUN: letih, strani, času, svetu, delu, mestu, koncu, letu, podlagi, področju
- NUM: dveh, enem, eni, štirih, treh, petih, šestih, desetih, osmih, sedmih
- PRON: njem, njej, nas, njih, čemer, sebi, meni, čem, vas, marsičem
- PROPN: Sloveniji, Evropi, Ljubljani, ZDA, Ameriki, Italiji, Mariboru, Nemčiji, Rimu, Zemlji

Nom
- ADJ: mogoče, drugi, sam, prvi, prva, velika, sama, druga, potrebno, sami
- ADJ-Part: znano, znana, prepričan, znani, pripravljeni, znan, povezani, namenjen, prepričana, sprejet
- DET: to, ta, vsi, vse, njegov, njegova, vsak, tisti, nekateri, te
- NOUN: predsednik, ljudje, del, večina, človek, država, čas, mesto, zakon, otroci
- NUM: ena, eden, dva, dve, trije, tri, en, pet, tisoč, eno
- PRON: kar, kaj, kdo, jaz, nič, nekaj, nihče, nekdo, vi, on
- PROPN: Slovenija, Ljubljana, Maribor, Janez, LJUBLJANA, New, Bojan, Jože, Slovenci, Boris

Definite

Def
- ADJ: drugi, novi, pravi, slovenski, državni, veliki, glavni, edini, zadnji, največji
- ADJ-Part: minuli, znani, izbrani, omenjeni, spoštovani, diplomirani, imenovani, izpodbijani, nagrajeni, navedeni

Ind
- ADJ: sam, velik, drug, nov, pomemben, dober, prepričan, podoben, znan, lep
- ADJ-Part: prepričan, znan, namenjen, sprejet, pripravljen, povezan, rojen, določen, sestavljen, imenovan

Degree and Polarity

Degree

Cmp
- ADJ: večje, večji, večja, boljše, boljši, manjše, manjši, večjo, starejši, višje
- ADV: bolj, prej, pozneje, bolje, večkrat, kasneje, raje, dlje, hitreje, laže

Pos
- ADJ: mogoče, nove, različnih, sam, novo, veliko, velika, slovenski, novi, potrebno
- ADJ-Part: znano, določene, znana, določenih, znani, prepričan, povezani, pripravljeni, zaposlenih, znan
- ADV: lahko, tako, zelo, kako, vedno, potem, zdaj, kar, treba, danes
- DET: obilo

Sup
- ADJ: največji, največja, najboljši, največje, največjih, najboljša, najboljših, najvišja, najmlajši, najpomembnejši
- ADV: najbolj, najprej, najmanj, najbolje, največkrat, najpogosteje, najverjetneje, najraje, najpozneje, najkasneje

Polarity

Neg
- AUX-Fin: ni, niso, nisem, nismo, niste, nista, nisi, nisva
- PART: ne
- VERB-Fin: ni, nima, nimajo, nimam, noče, nimamo, niso, nočem, nimate, nočemo

Pos
- AUX-Fin: je, so, bo, sem, bodo, sta, smo, bomo, boste, ste
- VERB-Fin: je, ima, so, imajo, bo, imamo, imam, hoče, imate, bodo

Variant

Bound
- PRON: zanj, zase, zame, zanjo, nanj, nanjo, vanj, vanjo, nase, zanje

Short
- PRON: se, ga, jih, si, jo, mu, mi, ji, jim, me

Verbal Features

Aspect

Imp
- VERB-Fin: ima, imajo, mora, zdi, moramo, morajo, velja, omogoča, more, nima
- VERB-Inf: imeti, vedeti, živeti, govoriti, delati, veljati, sodelovati, uporabljati, igrati, paziti
- VERB-Part: imel, imeli, moral, morali, imela, morala, hotel, mogel, vedel, govoril
- VERB-Sup: delat, spat, gledat, hodit, iskat, krpat, mižat, prest, prosit, smučat

Perf
- VERB-Fin: pride, postane, denimo, recimo, začne, da, povzroči, nastane, dobi, najdemo
- VERB-Inf: dobiti, narediti, povedati, reči, sprejeti, najti, doseči, plačati, spremeniti, ohraniti
- VERB-Part: povedal, rekel, začel, dejal, postal, dobil, začeli, začela, zgodilo, postala
- VERB-Sup: pogledat, odpotovat, ogledat, osvobodit, skuhat, zajebat

Mood

Cnd
- AUX-Fin: bi, b
- VERB-Fin: bi

Imp
- AUX-Fin: bodite, bodi
- VERB-Fin: denimo, recimo, dodajte, dajte, glej, Ugotovimo, povej, vzemite, govori, pazite

Ind
- AUX-Fin: je, so, bo, ni, sem, bodo, sta, smo, niso, bomo
- VERB-Fin: je, ima, ni, gre, so, imajo, bo, mora, pomeni, pravi

Tense

Fut
- AUX-Fin: bo, bodo, bomo, boste, bom, bosta, boš, bova, bojo
- VERB-Fin: bo, bodo, boste, bom, bomo, bosta, boš

Pres
- AUX-Fin: je, so, ni, sem, sta, smo, niso, ste, nisem, sva
- VERB-Fin: je, ima, ni, gre, so, imajo, mora, pomeni, pravi, zdi

Pronouns, Determiners, Quantifiers

PronType

Dem
- DET: to, tem, ta, tega, te, toliko, teh, temu, tej, tisti

Ind
- DET: več, nekaj, veliko, manj, dovolj, malo, pol, preveč, največ, nekatere
- PRON: nekaj, nekdo, marsikaj, nekoga, nečesa, neki, marsikoga, marsičem, nekom, marsikdo

Int
- DET: katerih, katerem, kateri, katere, katero, katerega, koliko, kakšno, katerimi, katerim
- PRON: kaj, kdo, komu, česa, koga, čem, kom, čim, kej, kva

Neg
- DET: nobene, nobenega, nobena, nobenih, noben, nobeno, nikakršne, nobenem, nikakršnega, nikakršnih
- PRON: nič, nihče, ničesar, nikogar, nikomur, ničemer, nobeden, nč, ničemur

Prs
- DET: svoje, svojo, svoj, njegov, svojih, svojega, svoji, njegovo, njegova, njegove
- PRON: se, ga, jih, si, jo, mu, mi, nas, ji, jim

Rel
- DET: kakršen, kakršnih, kakršno, kakršna, kakršne, kakršnokoli, kakršni, čigar, kakršnega, kakršnegakoli
- PRON: kar, čemer, česar, kdor, čimer, karkoli, kdorkoli, komerkoli, komurkoli, kogar

Tot
- DET: vse, vseh, vsi, vsak, vsem, ves, oba, vsako, obeh, vsega
- PRON: vsakdo, vsakogar, vsakomur

NumType

Card
- NUM: 2, eno, 1, dve, dva, dveh, tri, ena, eden, 10

Mult
- ADJ: dvojna, dvojne, dvojnega, dvojnim, dvojnimi, dvojno, trojnim

Ord
- ADJ: prvi, prva, prvo, prve, prvem, prvega, prvih, tretji, tretje, tretjem
- NUM: 1., 20., 9., 2., 3., 18., 19., 11., 5., 17.

Sets
- NUM: dvoje, troje, tisočerih

Poss

Yes
- ADJ: človekovih, Nobelovo, človekove, Marijinega, ogljikovih, Mešlova, Vallaressovi, alzheimerjeve, litijev, otrokove
- DET: svoje, svojo, svoj, njegov, svojih, svojega, svoji, njegovo, njegova, njegove

Reflex

Yes
- DET: svoje, svojo, svoj, svojih, svojega, svoji, svojim, svojem, svojimi, svoja
- PRON: se, si, seboj, sebi, sebe, zase, sabo, nase, vase, medse

Person

1
- AUX-Fin: sem, smo, bomo, bom, nisem, sva, nismo, nisva, bova
- DET: naše, moj, naša, naših, moja, naši, naš, moje, našo, moji
- PRON: mi, nas, nam, me, jaz, meni, zame, mene, nama, nami
- VERB-Fin: moramo, imamo, vem, mislim, denimo, moremo, recimo, imam, smemo, vemo

2
- AUX-Fin: boste, ste, si, niste, boš, bodite, nisi, bodi, sta, bosta
- DET: vaš, vaša, vaše, vašo, tvoje, tvoja, vašega, vašem, vaši, vaših
- PRON: vam, vas, ti, vi, te, vami, tebe, vaju, tebi, vama
- VERB-Fin: imate, morate, veste, želite, dobite, dodajte, ste, veš, imaš, potrebujete

3
- AUX-Fin: je, so, bo, ni, bodo, sta, niso, bosta, nista, bojo
- DET: njegov, njegovo, njegova, njegove, njeno, njihove, njen, njegovem, njegovi, njene
- PRON: ga, jih, jo, mu, ji, jim, njih, njimi, njim, njem
- VERB-Fin: je, ima, ni, gre, so, imajo, bo, mora, pomeni, pravi

Gender[psor]

Fem
- DET: njeno, njen, njene, njena, njeni, njenih, njenega, njenim, njenem, njenemu

Masc
- DET: njegov, njegovo, njegova, njegove, njegovem, njegovi, njegovega, njegovih, njegovim, njegovimi

Neut
- DET: njegov, njegova

Number[psor]

Dual
- DET: njun, njuna, njuno, njunih, njuni, njune, njunega, vajino, najin, najinih

Plur
- DET: naše, njihove, naša, njihova, njihovo, naših, njihov, naši, njihovi, njihovih

Sing
- DET: njegov, njegovo, njegova, njegove, njeno, njen, njegovem, njegovi, njene, njegovega

Other Features

Abbr
- Yes
  - X: dr., št., d., t., m., o., p., i., oz., itd.

Foreign
- Yes
  - X: de, the, of, a, la, New, and, to, Al, on

NumForm
- Digit
  - NUM: 2, 1, 10, 3, 6, 30, 1., 20, 4, 2000
- Roman
  - NUM: I., II, II., III, I, IV., IX., V., VIII, VI
- Word
  - NUM: eno, dve, dva, dveh, tri, ena, eden, štiri, enega, pet

Typo
- Yes
  - DET: pol

Syntax

Auxiliary Verbs and Copula

This corpus uses 1 lemmas as copulas (cop). Examples: biti.

This corpus uses 1 lemmas as auxiliaries (aux). Examples: biti.

Core Arguments, Oblique Arguments and Adjuncts

Here we consider only relations between verbs (parent) and nouns or pronouns (child).

nsubj
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--NOUN-Gen (256)
- VERB-Fin--NOUN-Gen-ADP(do) (4)
- VERB-Fin--NOUN-Gen-ADP(okoli) (2)
- VERB-Fin--NOUN-Nom (3321)
- VERB-Fin--PRON-Acc (1)
- VERB-Fin--PRON-Gen (28)
- VERB-Fin--PRON-Nom (297)
- VERB-Inf--NOUN-Acc (1)
- VERB-Inf--NOUN-Gen (2)
- VERB-Inf--NOUN-Nom (47)
- VERB-Inf--PRON-Nom (6)
- VERB-Part--NOUN-Gen (171)
- VERB-Part--NOUN-Gen-ADP(do) (2)
- VERB-Part--NOUN-Loc (1)
- VERB-Part--NOUN-Nom (3131)
- VERB-Part--PRON-Acc (7)
- VERB-Part--PRON-Gen (21)
- VERB-Part--PRON-Nom (243)

obj
- VERB-Fin--NOUN-Acc (2731)
- VERB-Fin--NOUN-Acc-ADP(za) (1)
- VERB-Fin--NOUN-Dat (66)
- VERB-Fin--NOUN-Gen (557)
- VERB-Fin--NOUN-Gen-ADP(do) (1)
- VERB-Fin--NOUN-Nom (9)
- VERB-Fin--PRON (16)
- VERB-Fin--PRON-Acc (769)
- VERB-Fin--PRON-Dat (128)
- VERB-Fin--PRON-Gen (50)
- VERB-Fin--PRON-Nom (7)
- VERB-Inf--NOUN-Acc (682)
- VERB-Inf--NOUN-Dat (22)
- VERB-Inf--NOUN-Gen (220)
- VERB-Inf--NOUN-Nom (3)
- VERB-Inf--PRON (8)
- VERB-Inf--PRON-Acc (172)
- VERB-Inf--PRON-Dat (10)
- VERB-Inf--PRON-Gen (47)
- VERB-Part--NOUN-Acc (3012)
- VERB-Part--NOUN-Dat (88)
- VERB-Part--NOUN-Gen (564)
- VERB-Part--NOUN-Gen-ADP(do) (3)
- VERB-Part--NOUN-Ins (1)
- VERB-Part--NOUN-Nom (1)
- VERB-Part--PRON (45)
- VERB-Part--PRON-Acc (1011)
- VERB-Part--PRON-Dat (132)
- VERB-Part--PRON-Gen (64)
- VERB-Part--PRON-Nom (1)
- VERB-Sup--NOUN-Acc (7)
- VERB-Sup--NOUN-Gen (1)
- VERB-Sup--PRON-Acc (1)

iobj
- VERB-Fin--NOUN-Acc (27)
- VERB-Fin--NOUN-Dat (189)
- VERB-Fin--NOUN-Loc (2)
- VERB-Fin--PRON-Acc (30)
- VERB-Fin--PRON-Dat (289)
- VERB-Inf--NOUN-Acc (15)
- VERB-Inf--NOUN-Dat (68)
- VERB-Inf--NOUN-Gen (2)
- VERB-Inf--PRON (1)
- VERB-Inf--PRON-Acc (5)
- VERB-Inf--PRON-Dat (70)
- VERB-Inf--PRON-Gen (3)
- VERB-Part--NOUN-Acc (27)
- VERB-Part--NOUN-Dat (202)
- VERB-Part--NOUN-Gen (1)
- VERB-Part--PRON (4)
- VERB-Part--PRON-Acc (45)
- VERB-Part--PRON-Dat (467)
- VERB-Part--PRON-Gen (4)
- VERB-Sup--PRON-Acc (1)

Verbs with Reflexive Core Objects

This corpus contains 151 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: predstaviti se, izbrati si, zagotoviti si, poiskati si, privoščiti si, pridobiti si, kupiti si, narediti si, pomagati si, sleči se, vpisati se, nadeti si, obdati se, obleči si, obremenjevati se, poviteziti se, poškodovati se, preživljati se, prijaviti se, pripeljati se, priskrbeti si, reči si, rešiti se, služiti si, umiti se, uničiti si, zaščititi se, zlomiti si, biti se, bičati se, braniti se, darovati sebe, delati si, določiti si, doživeti svojo, financirati se, hraniti se, identificirati se, iskati si, iskati svojo, izboljšati si, izboriti si, izbrizgati si, izdelati si, izničiti se, izprositi si, karikirati sebe, kaznovati sebe, kopati si, krojiti si

Out of those, 3 lemmas occurred more than once, but never without a reflexive dependent. Examples: obleči, poviteziti, preobleči

Relations Overview

This corpus uses 3 relation subtypes: cc:preconj, flat:foreign, flat:name
The following 3 relation types are not used in this corpus at all: clf, compound, reparandum