UD Estonian EDT
Language: Estonian (code: et
)
Family: Uralic
This treebank has been part of Universal Dependencies since the UD v1.2 release.
The following people have contributed to making this treebank part of UD: Kadri Muischnek, Kaili Müürisep, Tiina Puolakainen, Andriela Rääbis, Liisi Torga.
Repository: UD_Estonian-EDT
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-NC-SA 4.0
Genre: fiction, news, nonfiction, academic
Questions, comments? General annotation questions (either Estonian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [kadri • muischnek (æt) ut • ee, kaili • muurisep (æt) ut • ee]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD |
XPOS | annotated manually in non-UD style, automatically converted to UD |
Features | annotated manually in non-UD style, automatically converted to UD |
Relations | annotated manually in non-UD style, automatically converted to UD |
Description
UD Estonian is a converted version of the Estonian Dependency Treebank (EDT), originally annotated in the Constraint Grammar (CG) annotation scheme, and consisting of genres of fiction, newspaper texts and scientific texts. The treebank contains 30,972 trees, 437,769 tokens.
The Estonian UD EDT treebank is based on the Estonian Dependency Treebank (EDT), created at the University of Tartu. The treebank has been automatically converted and then manually reviewed and reannotated.
The treebank covers 3 different genres, namely newspaper texts, fiction and scientific texts:
- fiction (67,744 tokens, 5,522 sentences)
- newspapers (266,806 tokens, 18,690 sentences)
- scientific texts (94,022 tokens, 5,483 sentences)
- Also, the subpart of Estonian part of HamleDT 3.0 treebank has been reannotated and included in the treebank; it contains 9,200 tokens in 1277 sentences.
Acknowledgments
We wish to thank all who have contributed to the original EDT annotation effort, especially Eleri Aedmaa, Riin Kirt and Dage Särg.
We also thank developers of udapi, ud annotatrix and , and ConlluEditor tools.
This work was financed by the National Programme for Estonian Language Technology and Estonian Ministery of Education and Research (grant 20-56 IUT20-56 “Computational models for Estonian”).
Statistics of UD Estonian EDT
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – AdpType – Case – Connegative – Definite – Degree – Foreign – Gender – Hyph – InflClass – Mood – Number – Number[psor] – NumForm – NumType – Person – Person[psor] – Polarity – Poss – PronType – Reflex – Style – Tense – Typo – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – cc:preconj – ccomp – compound – compound:prt – conj – cop – csubj – csubj:cop – dep – det – discourse – fixed – flat – flat:foreign – goeswith – list – mark – nmod – nmod:poss – nsubj – nsubj:cop – nummod – obj – obl – obl:agent – orphan – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 30930 sentences, 437787 tokens and 437788 syntactic words.
- This corpus contains 67552 tokens (15%) that are not followed by a space.
- This corpus contains 21 types of words with spaces. Examples: 1 100,0, 2 46 453, 2 53 284, 22 322, 23 578, 24 952, 25 575, 25 926, 26 085, 26 333, 27 003, 28 003, 29 995, 30 471, 36 611, 43 328, 43 701, 49 207, 64 558, 74 351, 79 398
- This corpus contains 2560 types of words that contain both letters and punctuation. Examples: a., al., ω-3-rasvhapete, e., jt., võib-olla, aeg-ajalt, n., s.t, %-l, n-ö, s., enam-vähem, nn., m., L., südame-veresoonkonna, v., ω-3-rasvhapetega, d., %-ni, J., Kr., ω-6-rasvhapete, H., c., km/h, Esto-TV, Ida-Euroopa, kesk-, ω-3-, ω-3-rasvhappeid, ω-rasvhapete, Põhja-Kaukaasia, USA-s, detrusor'i, k., vt., P., Shakespeare'i, e-posti, maa-ala, v.a., ω-linoleenhappe, Lääne-Euroopa, R., b., g/kg/min, ja/või, lk.
- This corpus contains 1 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 1 types of multi-word tokens. Examples: It's.
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 2 word types tagged as particles (PART): not, to
- This corpus contains 72 lemmas tagged as pronouns (PRON): I, anyone, ei-tea-mitmes, ei_keegi, ei_miski, esimene, iga, iga_sugune, iga_üks, ise, ise_enese, it, keegi, kes, kumb, kumbki, kõik, meie, mi-mina, milleks, milline, mina, mingi, mingi_sugune, minu-mina, minu_sugune, mis, mis_laadi, mis_sugune, miski, mitme_sugune, mitu, muu, my, mõlema, mõni, nemad, nii_sugune, oma, oma_enese, oma_sugune, oma_taoline, palju, sama, sama_sugune, se, see, see_sama, see_samune, see_sugune, selline, sihuke, sina, sinu_sugune, sinä, säärane, teie_sugune, teine, teine_teise, teist_sugune, tema, tema_sugune, too, too_sama, we, what, you, üks, üks-teine, üks_teise, üks_teist, ükski
- This corpus contains 56 lemmas tagged as determiners (DET): A, der, esimene, iga, iga_sugu, iga_sugune, keegi, kogu, kumb, kumbki, kõik, meie_sugune, milline, mingi, mingi_sugune, minu_sugune, mis, mis_sugune, miski, mitme_sugune, mitmes, mitu, muist, muu, mõlema, mõne_sugune, mõni, mõningane, mõningas, nihuke, nii_sugune, palju, sama, sama_laadne, sama_sugune, see, see-ja-see, see_sama, see_sugune, selline, sihuke, siuke, säherdune, säärane, taoline, teine, teist_sugune, tema, tema_sugune, tema_taoline, terve, the, too, too_sama, üks, ükski
- Out of the above, 37 lemmas occurred sometimes as PRON and sometimes as DET: esimene, iga, iga_sugune, keegi, kumb, kumbki, kõik, milline, mingi, mingi_sugune, minu_sugune, mis, mis_sugune, miski, mitme_sugune, mitu, muu, mõlema, mõni, nii_sugune, palju, sama, sama_sugune, see, see_sama, see_sugune, selline, sihuke, säärane, teine, teist_sugune, tema, tema_sugune, too, too_sama, üks, ükski
- This corpus contains 12 lemmas tagged as auxiliaries (AUX): be, ei, näima, olema, olla, paistma, pidama, saama, tohtima, tunduma, võima, ära
- Out of the above, 9 lemmas occurred sometimes as AUX and sometimes as VERB: be, näima, olema, paistma, pidama, saama, tohtima, tunduma, võima
- There are 6 (de)verbal forms:
- Conv
- AUX: olles
- VERB: võrreldes, arvates, kasutades, öeldes, vaadates, arvestades, võttes, minnes, tehes, pidades
- Fin
- AUX: on, oli, pole, võib, ole, olid, oleks, peaks, saab, olen
- VERB: on, tuleb, ütles, sai, tuli, saab, jääb, läks, ütleb, jäi
- Ger
- VERB: Walking, Writing, cutting, stimulating
- Inf
- AUX: olla, tunduda, paista, pidada, saada
- VERB: teha, saada, teada, võtta, näha, öelda, minna, kasutada, leida, panna
- Part
- ADJ: erinevate, seotud, teatud, tehtud, antud, tuntud, möödunud, erinevad, erinevaid, ülejäänud
- AUX: olnud, pidanud, saanud, võinud, tohtinud, paistnud, saand, saanudki, tohtinudki
- NOUN: hõivatute, hõivatud, uuritavat, hõivatuist, uuritavad, Eeltoodu, hõivatutest, nähtu, surnu, uuritavatel
- PROPN: Ühinenud, Avatud, Relvastatud, Hukkunud, Iseseisva, Sõltuvas
- VERB: saanud, jäänud, jõudnud, seotud, teinud, muutunud, tulnud, tehtud, näinud, kasvanud
- Sup
- ADJ: polüküllastumata, küllastumata, mehitamata, saamata, teadmata, tulemata, alustamata, lõpetamata, etteteatamata, juhtimata
- AUX: olema, saama, Olemata, olemas, olemast
- VERB: olemas, minema, hakkama, tegema, saama, võtma, maksma, käima, vaatama, tulema
Nominal Features
- Fem
- ADJ: Labas
- DET: der
- NOUN: Conpatronin, jure, rokas
- PROPN: St., Antoni-Gilde, Johannis-Gemeinde
- Masc
- ADJ: ancien
- NOUN: Heil, Sieg, globus
- Neut
- PRON: It
- Plur
- ADJ: erinevate, uusi, suured, uute, erinevad, erinevaid, suurte, suuremad, uued, esimesed
- ADJ-Part: erinevate, erinevad, erinevaid, erinevates, erinevatel, vastavad, kuuluvate, olevad, olevate, huvitavaid
- AUX-Fin: on, olid, võivad, oleme, peavad, olete, võiksid, peaksid, oleksid, peame
- DET: kõik, need, nende, teiste, neid, mõned, paljud, kõigi, kõiki, teised
- NOUN: sissetulekute, inimesed, sõnul, inimeste, aastatel, inimesi, andmete, mehed, aastate, ettevõtete
- NOUN-Part: hõivatute, hõivatud, hõivatuist, uuritavad, hõivatutest, uuritavatel, osalenute, vastanuist, kinnipeetavate, olemasolevaid
- NUM: pooled, tuhandeid, miljardeid, miljoneid, kümneid, tuhanded, sadu, sajad, kümnete, miljonite
- PRON: nad, nende, meie, kes, me, mis, neid, need, meil, mida
- PROPN: Nõukogude, Mõõdukad, Põhjamaade, Ühendriikide, Ametiühingute, Arstide, Baltimaade, Bekajd, Jagomägede, Mõõdukate
- VERB-Fin: saavad, said, on, hakkavad, jäävad, tulevad, annavad, teevad, lähevad, jäid
- Sing
- ADJ: suur, hea, võimalik, suurem, uue, suure, raske, esimene, oluline, viimase
- ADJ-Part: huvitav, erinev, vastava, vastav, erineva, erinevat, käesoleva, olev, elav, meeldiv
- AUX-Fin: on, oli, võib, saab, olen, peab, olin, pidi, võis, ongi
- DET: see, selle, üks, iga, seda, sel, ühe, samal, sama, mitu
- NOUN: aasta, aastal, aastat, raha, osa, krooni, korda, ajal, mõju, töö
- NOUN-Part: uuritavat, Eeltoodu, nähtu, surnu, allakirjutanu, juhtunu, toimunu, toimunut, uuritav, uuritava
- NUM: kaks, üks, kolm, kahe, ühe, miljonit, viis, miljoni, neli, kolme
- PRON: ta, see, oma, mis, ma, seda, tema, kes, selle, mida
- PROPN: eesti, Eestis, Euroopa, Tartu, Tallinna, Peeter, Maa, Vene, Jan, Venemaa
- PROPN-Part: Iseseisva, Sõltuvas
- SYM: %-l, %-ni, %-lt, %-le, %-ga, %l, %ni, A-ga, A-ks, B-ga
- VERB-Fin: tuleb, on, ütles, sai, tuli, saab, jääb, läks, ütleb, jäi
- Abe
- ADJ-Sup: polüküllastumata, küllastumata, mehitamata, saamata, teadmata, tulemata, alustamata, lõpetamata, etteteatamata, juhtimata
- AUX-Sup: Olemata
- NOUN: tasuta, abita, tööta, traadita, heakskiiduta, järelevalveta, palgata, vastuseta, Piirideta, eelarvamusteta
- PRON: minuta, selleta, milleta, selletagi, sinuta
- PROPN: Lufthansata, Visnapuuta
- VERB-Sup: rääkimata, saamata, teadmata, tegemata, hoolimata, sõltumata, kasutamata, tulemata, arvestamata, küsimata
- Abl
- ADJ: esimeselt, vasakult, puhtalt, vahetumalt, Kaugelt, Vaimsetelt, Vanematelt, Vormikohastelt, alumistelt, asuvalt
- ADJ-Part: asuvalt, kasvavalt, lebavalt, olevalt, piirnevalt, saadavatelt, tiirlevatelt, valitsevatelt, vastujuhtuvatelt
- DET: ühelt, teistelt, kõigilt, mitmelt, samalt, sellelt, Igasuguselt, Muudelt, minusuguselt, mitmetelt
- NOUN: töölt, maalt, seisukohalt, riigilt, välismaalt, inimestelt, katuselt, kohalt, lavalt, põrandalt
- NUM: miljonilt, ühelt, 30-lt, 33-lt, kahelt, kolmelt, kuuelt, viielt
- PRON: ühelt, teiselt, temalt, neilt, minult, omalt, millelt, teistelt, endalt, kellelt
- PROPN: Venemaalt, Prantsusmaalt, Saksamaalt, Landerilt, Maalt, Janilt, Kuubalt, Marsilt, Päikeselt, A.K-lt
- SYM: %-lt
- Add
- ADJ: uude, esimesse, laia, kohalikku, suurde, kummalisse, pikka, tagumisse, Eelmisse, I
- DET: teise, mõnda, ühte, kumba, kumbagi
- NOUN: kätte, koju, tuppa, meelde, silma, pähe, selga, kööki, ellu, toime
- NUM: kahte, ühte, nelja, viide, kuude, poolde, teise
- PRON: teise, ühte
- PROPN: Tallinna, Liitu, ELi, Soome, Berliini, Hansapanka, Kadriorgu, Rootsi, Shveitsi, EL-i
- Ade
- ADJ: viimasel, järgmisel, eelmisel, esimesel, teisel, viimastel, suurel, varasematel, erinevatel, õigel
- ADJ-Part: erinevatel, käesoleval, tuleval, vaadeldaval, erineval, algavatel, järgnevatel, peetaval, vaadeldavatel, elaval
- DET: sel, samal, igal, ühel, sellel, mingil, sellisel, kõigil, mõnel, mõlemal
- NOUN: aastal, ajal, sõnul, juhul, aastatel, alusel, hommikul, päeval, õhtul, hetkel
- NOUN-Part: uuritavatel, ravituil, uuritaval, Allakirjutanul, juhtunul, jõudnutel, liitunutel, nähtul, olnutel, ravitutel
- NUM: kahel, kolmel, paaril, ühel, neljal, kaheksal, kolmandikul, pooltel, kuuel, poolel
- PRON: mul, tal, meil, neil, kellel, sul, millel, kel, omal, teil
- PROPN: Venemaal, Saksamaal, Inglismaal, Iirimaal, Harjumaal, Prantsusmaal, Hiiumaal, Toompeal, Eestil, Eestimaal
- SYM: %-l, %, %l
- All
- ADJ: uuele, suurele, suuremale, uutele, avalikule, praegusele, rasvhappelisele, endisele, strateegilistele, viimasele
- ADJ-Part: elavale, olevale, toimuvale, armastavatele, asuvale, erinevatele, kuuldavale, kättesaadavatele, kõikehõlmavale, näivale
- DET: sellele, kõigile, ühele, teistele, igale, paljudele, samale, mõnele, teisele, kõikidele
- NOUN: tööle, lastele, inimestele, inimesele, tööhõivele, teele, ebavõrdsusele, riigile, küsimusele, põrandale
- NOUN-Part: tulnule, allakirjutanule, deporteeritutele, edasijõudnutele, eelnenule, elavatele, kannatanutele, käinutele, lahkunuile, läinutele
- NUM: kahele, ühele, neljale, paarile, kuuele, kolmele, kümnele, sadadele, 32-le, 4-le
- PRON: talle, endale, mulle, neile, sellele, meile, kellele, sulle, millele, teile
- PROPN: Eestile, Postimehele, Venemaale, Maale, Tõnule, Saksamaale, Inglismaale, Janile, Hiinale, Kerdile
- SYM: %-le, i-le
- Com
- ADJ: viimasega, 80ndatega, II-ga, IV-ga, Viimastega, abstraktsega, auklikuga, dekoratiivsega, dementsetega, eelmisega
- ADJ-Part: toimuvaga
- NOUN: aastaga, osaajaga, käega, arhitektuuriga, nimega, punktiga, tööga, häälega, tõenäosusega, pilguga
- NOUN-Part: Eelnevaga, ennustatuga, koondatavaga, olemasolevaga, soovitatuga, tooduga
- NUM: ühega, 2/3ga, 2ga, nulliga, 17.99ga, 3.51,1-ga, 351ga, 49,38ga, 54,68ga, kümnega
- PRON: sellega, millega, temaga, kellega, nendega, minuga, endaga, meiega, omaga, kellegagi
- PROPN: Liiduga, Sposatoga, Joogaga, NATOga, Savisaarega, Leeduga, Venemaaga, Allikuga, Eestiga, Euroopaga
- SYM: %-ga, A-ga, B-ga, K-ga, i-ga
- Dat
- DET: der
- PROPN: Antoni-Gilde, St.
- Ela
- ADJ: keskmisest, suurest, esimesest, tavalisest, senisest, vanast, uuest, endisest, mustast, viimasest
- ADJ-Part: toimuvast, erinevatest, loodetust, eelnevast, mõjutavatest, olevast, toimuvatest, ümbritsevast, asuvast, erinevast
- AUX-Sup: olemast
- DET: sellest, neist, ühest, teistest, teisest, kõigist, mõnest, paljudest, nendest, mitmest
- NOUN: aastast, ajast, aastatest, elust, peast, algusest, uksest, küljest, tervisest, üldlipiididest
- NOUN-Part: hõivatuist, hõivatutest, vastanuist, eeltoodust, toodust, uurituist, uuritutest, vastanutest, Eelöeldust, alustanust
- NUM: kahest, kolmest, kümnest, ühest, neljast, sajast, kuuest, 644-st, viiest, üheksast
- PRON: sellest, neist, millest, endast, temast, kellest, nendest, meist, minust, teistest
- PROPN: Eestist, Soomest, Tallinnast, Hiinast, Tartust, Moskvast, Itaaliast, Päikesest, Suurbritanniast, USAst
- VERB-Sup: avaldamast, kommenteerimast, laulmast, registreerimast, tegemast, tulemast, tunnistamast, ennustamast, kaagutamast, kadumast
- Ess
- ADJ: esimesena, järgmisena, mõõdetuna, vaadatuna, võetuna, stabiilsena, 17aastasena, hinnatuna, koosnevana, kuivana
- ADJ-Part: mõõdetuna, vaadatuna, võetuna, hinnatuna, koosnevana, lummatuna, Ajendatuna, Kaasuvana, aetuna, avatuna
- NOUN: reeglina, tulemusena, tervikuna, mõjurina, põhjusena, ainsana, näitajana, tegurina, mõjuritena, osana
- NOUN-Part: Ajendatuna, Kannatanuna, armununa, elavana, jaotatuna, juhatatuna, jõudnuna, kadunutena, kantuna, poolsurnuna
- NUM: nullina, ühena
- PRON: iseendana, Teisena, kellena, sellisena, ühena, esimesena, iseendina, millena, säärasena
- PROPN: Accordina, Ehatähena, Koidutähena, Liibanonina, Liliana
- Gen
- ADJ: uue, suure, viimase, erinevate, suurema, esimese, uute, keskmise, hea, suurte
- ADJ-Part: erinevate, vastava, erineva, käesoleva, oleva, asuva, kuuluvate, huvitava, olevate, sõltuva
- DET: selle, nende, ühe, teiste, iga, mõne, kõigi, sellise, teise, sama
- NOUN: aasta, sissetulekute, riigi, töö, maailma, inimese, inimeste, ebavõrdsuse, aja, andmete
- NOUN-Part: hõivatute, osalenute, kinnipeetavate, surnu, uuritava, Eeltoodu, hukkunute, juhtunu, käinute, manipuleeritavuse
- NUM: kahe, ühe, miljoni, kolme, viie, poole, kümne, nelja, paari, miljardi
- PRON: oma, tema, selle, nende, mille, meie, minu, ta, kelle, enda
- PROPN: eesti, Euroopa, Tartu, Tallinna, Vene, Maa, Liidu, Soome, Venemaa, Rootsi
- PROPN-Part: Iseseisva
- Ill
- ADJ: endisesse, asuvasse, erinevatesse, suuremasse, uutesse, väikestesse, jahedasse, lähimasse, millisesse, pimedasse
- ADJ-Part: asuvasse, erinevatesse, nõustavasse, olemasolevatesse, põlevasse, tegelevasse, ilmuvasse, loodavasse, marssivatesse, moodustuvatesse
- AUX-Sup: olema, saama
- DET: sellesse, neisse, samasse, igasse, mingisse, teistesse, mõnesse, nendesse, kellessegi, kõigisse
- NOUN: arvesse, haiglasse, masinatesse, voodisse, kohtusse, ehitistesse, autosse, taskusse, politseisse, sajandisse
- NUM: kümnetesse, 28-sse, esikaheksasse, miljarditesse, seitsmesse, tuhandetesse
- PRON: sellesse, endasse, temasse, millesse, kellesse, kellessegi, neisse, üksteisesse, millessegi, mitmetesse
- PROPN: Eestisse, Tartusse, Euroopasse, NATOsse, Tallinnasse, Moskvasse, Ameerikasse, Hiinasse, Helsingisse, Indiasse
- VERB-Sup: minema, hakkama, tegema, saama, võtma, maksma, käima, vaatama, tulema, andma
- Ine
- ADJ: esimeses, suures, erinevates, teises, käesolevas, viimases, uues, kolmandas, multiskalaarses, heas
- ADJ-Part: erinevates, käesolevas, asuvas, järgnevas, erinevas, muutuvas, põhinevas, iseseisvas, olevas, vaadeldavas
- AUX-Sup: olemas
- DET: selles, ühes, igas, teises, mõnes, teistes, paljudes, neis, samas, mingis
- NOUN: maailmas, mõttes, riigis, alguses, elus, aastas, keeles, lõpus, kodus, nädalas
- NOUN-Part: juhtunus, loodus, segatus
- NUM: ühes, kolmes, kahes, 644-s, neljas, tuhandetes, 1-s, 25s, 2s, Paaris
- PRON: selles, milles, neis, endas, temas, paljuski, omas, minus, teises, meis
- PROPN: Eestis, Tallinnas, Tartus, Euroopas, USAs, Hiinas, Soomes, Liidus, Rootsis, Moskvas
- PROPN-Part: Sõltuvas
- VERB-Sup: olemas, tulemas, valimas, tegemas, vaatamas, kasvamas, kujunemas, käimas, muutumas, tantsimas
- Nom
- ADJ: suur, võimalik, suurem, hea, esimene, oluline, raske, uus, väike, viimane
- ADJ-Part: erinevad, huvitav, erinev, vastav, olev, elav, meeldiv, põhinev, asuv, vastavad
- DET: see, kõik, üks, need, iga, mitu, selline, mõni, mõned, paljud
- NOUN: mees, inimesed, inimene, osa, aeg, asi, naine, riik, osakaal, mõju
- NOUN-Part: hõivatud, uuritavad, allakirjutanu, Eeltoodu, nähtu, Surnu, Vastsündinu, loodu, ravitud, sõbrad-tuttavad
- NUM: kaks, üks, kolm, viis, neli, paar, kümme, pool, seitse, kuus
- PRON: ta, see, mis, ma, kes, nad, me, sa, need, ise
- PROPN: Peeter, Jan, Eesti, Tsee, Jüri, Tõnu, Mart, Ott, Jooga, Saksamaa
- Par
- ADJ: uusi, esimest, suurt, erinevaid, uut, head, suuri, suuremat, viimast, pikka
- ADJ-Part: erinevaid, erinevat, huvitavaid, toimuvat, vastavat, huvitavat, täiendavaid, täiendavat, vajaminevat, sobivat
- DET: seda, mingit, neid, kõiki, sellist, mingeid, mitmeid, selliseid, sama, teisi
- NOUN: aastat, korda, krooni, aega, raha, tegemist, tööd, aru, inimesi, mõju
- NOUN-Part: uuritavat, olemasolevaid, toimunut, juhtunut, kinnipeetavat, süüdistatavaid, edasijõudnuid, eeltoodut, elusolevat, hõivatuid
- NUM: miljonit, kahte, miljardit, kolme, ühtegi, tuhandeid, üht, ühte, nelja, kaht
- PRON: seda, mida, midagi, neid, end, teda, mind, ennast, meid, keda
- PROPN: Eestit, Siiditeed, Maad, Liitu, Venemaad, Tallinna, Teist, Kristust, USAd, Ernesaksa
- Ter
- ADJ: praeguseni, 1990ndateni, Homseni, mustjaspruunini, neljandani, segmentaarseteni, seitsmekümnendateni, äärmuslikeni, üheksakümnendateni
- NOUN: lõpuni, aastani, õhtuni, kroonini, dollarini, protsendini, päevani, detsembrini, keskpaigani, novembrini
- NUM: kolmeni, miljardini, miljonini, üheksani, 27-ni, 3.30ni, 34-ni, 48-ni, 6ni, 800ni
- PRON: selleni, meieni, milleni, minuni, teieni, paljudeni, temani
- PROPN: Keilani, Alaskani, Andreseni, Galileini, Inglismaani, Lapimaani, Liiduni, Marjuni, Mihhailini, Miksoni
- SYM: %-ni, %ni, Hg-ni
- Tra
- ADJ: selgeks, oluliseks, kindlaks, heaks, paremaks, esimeseks, puhtaks, suuremaks, tänaseks, nüüdseks
- ADJ-Part: sobivaks, iseseisvaks, juhtivaks, kättesaadavaks, määravaks, vähendavaks, soovitavaks, õnnestunuks, algavaks, enesestmõistetavaks
- DET: üheks, selleks, igaks, mõneks, mitmeks, teiseks, esimeseks, samaks, selliseks, Nendeks
- NOUN: lisaks, põhjuseks, aluseks, aastaks, eesmärgiks, ajaks, lõpuks, kasuks, õnneks, ülesandeks
- NOUN-Part: viibinuks, väljavalituteks
- NUM: kaheks, kolmeks, üheks, neljaks, viieks, paariks, kuueks, pooleks, 10ks, 51-ks
- PRON: selleks, omaks, milleks, samaks, nendeks, selliseks, iseendaks, kõigeks, kelleks, sellisteks
- PROPN: Arpanetiks, Atriumiks, Cabernet'-veiniks, Chappaquaks, Entente'iks, Franckiks, Francoks, Hitleriks, Indiaks, Iraagiks
- SYM: A-ks
- VERB-Sup: leidmaks, kirjeldamaks, vältimaks, näitamaks, rõhutamaks, selgitamaks, Andmaks, Jõudmaks, Kavandamaks, Saavutamaks
- Def
- DET: the, der
- Ind
- ADJ: Labas
- DET: A
Degree and Polarity
- Cmp
- ADJ: suurem, suurema, parem, väiksem, suuremad, kõrgem, suuremat, lihtsam, kõrgema, parema
- ADJ-Part: adutavamaid, eelistatavamad, hinnatavam, konverteeritavam, nauditavam, nähtavam, soovitatavam
- ADV: more
- Pos
- ADJ: suur, hea, võimalik, uue, eri, raske, suure, oluline, viimase, valmis
- ADJ-Part: erinevate, seotud, teatud, tehtud, antud, möödunud, tuntud, erinevad, erinevaid, ülejäänud
- ADJ-Sup: polüküllastumata, küllastumata, mehitamata, teadmata, tulemata, alustamata, lõpetamata, saamata, etteteatamata, juhtimata
- ADV: well
- Sup
- ADJ: parim, suurim, suurima, parimaks, kõrgeim, parima, parimad, suurimaks, tuntuim, suurimad
- Neg
- ADV: mitte, ega, ei, Egä
- AUX: ei, pole, polnud, poleks, ära, polegi, ärge, polnudki, polevat, polekski
- AUX-Fin: pole, polnud, poleks, ei, ära, polegi, ärge, polnudki, polevat, polekski
- CCONJ: ega
- VERB-Fin: pole, polnud, polegi, poleks, polnudki, kasutata, olevat, polekski
Verbal Features
- Cnd
- AUX-Fin: oleks, peaks, võiks, poleks, võiksid, peaksid, saaks, oleksid, tohiks, olnuks
- VERB-Fin: tuleks, oleks, tahaks, saaks, annaks, läheks, tasuks, suudaks, tahaksin, teeks
- Imp
- AUX-Fin: olgu, ära, ole, ärge, olgem, ärgem, ärgu, Olge, saa, Ärme
- VERB-Fin: vaata, vt, tule, mine, kuule, näe, pane, võta, tee, vt.
- Ind
- AUX-Fin: on, oli, pole, võib, ole, olid, saab, olen, peab, saa
- VERB-Fin: on, tuleb, ütles, sai, tuli, saab, jääb, läks, ütleb, jäi
- Qot
- AUX-Fin: olevat, polevat, pidavat, võivat, olevatki, saavat
- VERB-Fin: olevat, tulevat, elustavat, hindavat, meeldivat, muutuvat, tõusvat, ajavat, arutlevat, elavat
- Past
- ADJ-Part: seotud, teatud, tehtud, antud, tuntud, möödunud, ülejäänud, nimetatud, jäänud, loodud
- AUX-Fin: oli, olid, polnud, olnud, olin, pidi, võis, sai, saanud, oligi
- AUX-Part: olnud, pidanud, saanud, võinud, tohtinud, paistnud, saand, saanudki, tohtinudki
- NOUN-Part: hõivatute, hõivatud, hõivatuist, Eeltoodu, hõivatutest, nähtu, surnu, allakirjutanu, osalenute, vastanuist
- PROPN-Part: Ühinenud, Avatud, Relvastatud, Hukkunud
- VERB-Fin: ütles, sai, tuli, läks, jäi, tegi, hakkas, oli, võttis, andis
- VERB-Part: saanud, jäänud, jõudnud, seotud, teinud, muutunud, tulnud, tehtud, näinud, kasvanud
- Pres
- ADJ-Part: erinevate, erinevad, erinevaid, huvitav, erinev, vastava, vastav, erineva, erinevat, erinevates
- ADJ-Sup: tasumata
- AUX-Fin: on, pole, võib, ole, oleks, peaks, saab, olen, peab, saa
- NOUN-Part: uuritavat, uuritavad, uuritavatel, kinnipeetavate, olemasolevaid, uuritav, uuritava, uuritaval, kinnipeetavat, sõbrad-tuttavad
- PROPN-Part: Iseseisva, Sõltuvas
- VERB-Fin: on, tuleb, saab, jääb, ütleb, läheb, teeb, hakkab, pole, annab
- VERB-Part: looking
- Act
- ADJ-Part: erinevate, möödunud, erinevad, erinevaid, ülejäänud, jäänud, toimunud, saanud, ilmunud, erinev
- ADJ-Sup: polüküllastumata, küllastumata, mehitamata, saamata, teadmata, tulemata, alustamata, lõpetamata, etteteatamata, juhtimata
- AUX-Fin: on, oli, pole, võib, ole, olid, oleks, peaks, saab, olen
- AUX-Part: olnud, pidanud, saanud, võinud, tohtinud, paistnud, saand, saanudki, tohtinudki
- AUX-Sup: olema, saama, Olemata, olemas, olemast
- NOUN-Part: uuritavat, surnu, uuritavad, uuritavatel, allakirjutanu, osalenute, vastanuist, juhtunu, kinnipeetavate, olemasolevaid
- PROPN-Part: Ühinenud, Hukkunud, Iseseisva, Sõltuvas
- VERB-Fin: on, tuleb, ütles, sai, tuli, saab, jääb, läks, ütleb, jäi
- VERB-Part: saanud, jäänud, jõudnud, teinud, muutunud, tulnud, näinud, kasvanud, läinud, leidnud
- VERB-Sup: olemas, minema, hakkama, tegema, saama, võtma, maksma, käima, vaatama, tulema
- Pass
- ADJ-Part: seotud, teatud, tehtud, antud, tuntud, nimetatud, loodud, saadud, suunatud, avatud
- AUX-Fin: ollakse, võidakse, oldi, olda, võidi, oldud, ollaksegi
- NOUN-Part: hõivatute, hõivatud, hõivatuist, Eeltoodu, hõivatutest, nähtu, ravituil, eeltoodust, etnofutu, loodu
- PROPN-Part: Avatud, Relvastatud
- VERB-Fin: kasutatakse, peetakse, tehti, tehakse, hakati, leiti, nimetatakse, võeti, antakse, peeti
- VERB-Part: seotud, tehtud, toodud, antud, võetud, leitud, kirjeldatud, kasutatud, loodud, tingitud
- VERB-Sup: alustatama, arutletama, avatama, kirjutatama, lastama, saadetama, suletama, toodama
Pronouns, Determiners, Quantifiers
- Art
- DET: the, der, A
- Dem
- ADJ: selline, sama, samasugune, sellised, sellist, säärane, selliseid, niisugune, samad, samasugused
- DET: see, selle, need, seda, sel, nende, samal, sama, teiste, selline
- PRON: see, seda, selle, sellest, nende, need, neid, selleks, sellega, sellele
- PROPN: teise
- Ind
- ADJ: mingisugust, muu, muud, muul
- DET: üks, ühe, mitu, mingi, mingit, mõne, mõni, mõned, paljud, ühel
- PRON: midagi, keegi, muud, üks, muu, paljud, kedagi, igaüks, kellelegi, miski
- Int
- ADJ: millised
- DET: The, milline
- PRON: what, kes
- Int,Rel
- ADJ: missugune, kumb, Missugust, milline, missugused, mitmendal
- DET: mis, kumb, millise, millist, missugune, missugused, kumbagi, millised, missugust, Milliseid
- PRON: mis, kes, mida, mille, kelle, millest, millega, kellel, milles, keda
- Prs
- DET: nende, neist
- PRON: ta, oma, ma, tema, nad, meie, me, sa, nende, minu
- PROPN: Meie
- Rcp
- PRON: teineteist, teineteise, teineteisest, üksteist, üksteise, üksteisest, teineteisele, üksteisele, iseenda, üksteisega
- Rel
- ADJ: milline, millised, millist, millise, milliseid, millises, kumb, millisesse, milliste, milliseks
- ADV: kus
- DET: millise, millist, milline, millised, milliseid, millises, kumb, kumma, kummas, millisest
- PRON: mis, kes, mida, mille, milline, millised, kelle, kellel, keda, kellele
- Tot
- ADJ: kogu-, mõlemas
- DET: kogu, kõik, iga, igal, kõigi, kõiki, terve, igas, mõlemad, kõikide
- PRON: kõik, kõike, kõigile, mõlemad, igal, kõiki, kõigil, kõigi, kõigele, kõigest
- Card
- ADJ: 17, 20, Teine
- NUM: kaks, 1, üks, 10, 2, kolm, kahe, ühe, 3, miljonit
- PROPN: GP-2, Sputnik-1, ZIL-130, 8, Kolme, MiG-29
- SYM: %, ω-6-
- Frac
- NUM: pool, poole, pooled, veerand, kolmandik, kolmandiku, 1/5, kolmandikku, viiendik, 1/2
- Ord
- ADJ: esimene, 1., esimest, esimese, teine, 2000., 2., teise, 1997., 1999.
- NUM: kolmandat, 18., 3., I, IX, Teine, XII, esimest, kolmas, sajas
- PROPN: Teist, Teise, Kolmanda, ADV, Esimene, Esimese, M, Neljanda, Neljandal, Teisel
- Range
- NUM: 1-2, 1989-2001, 3-4, 1997-2000, 3-5, 1995-2000, 10-15, 1991-2001, 1998-2000, 2-3
- Yes
- PRON: oma, omal, omad, omaks, omaenda, omaga, omalt, omast, omas, omadega
- Yes
- PRON: ise, end, endale, enda, ennast, endast, endal, iseenda, enese, endaga
- 1
- AUX-Fin: olen, oleme, olin, pean, peame, olime, võime, saame, peaksime, oleksin
- PRON: ma, meie, me, minu, mul, meil, mind, mina, mulle, mu
- PROPN: Meie
- VERB-Fin: arvan, sain, mõtlesin, tean, ütlesin, nägin, tegin, mäletan, vaatan, läksin
- 2
- AUX-Fin: oled, olete, olid, ära, võid, ole, pead, ärge, võite, peate
- PRON: sa, te, teie, sinu, sul, sulle, sind, sina, su, teid
- VERB-Fin: vaata, tule, tahad, mine, tead, lähed, kuule, saad, näe, pane
- 3
- AUX-Fin: on, oli, võib, olid, saab, peab, võivad, ongi, pidi, võis
- DET: nende, neist
- PRON: ta, tema, nad, nende, talle, tal, teda, neid, neil, neile
- VERB-Fin: on, tuleb, ütles, sai, tuli, saab, jääb, läks, ütleb, jäi
- Sing
- NOUN: Kutatointezete
Other Features
- Abbr
- Yes
- ADJ: nn, nn., van, %-lise, 80'ndate, jm, nim, nim., %-se, %-st
- ADV: jne, jt., jt, s.t, sh, n-ö, nt, st, jm, jms
- CCONJ: &, e, e.
- NOUN: a., a, USB, p, VD, g, km, cm, m, kr
- NUM: milj., mln, milj
- PROPN: USA, AS, NATO, A., LRE, EL, N., HA, ETV, de
- SYM: *, §, sulev@ekspress.ee, =, C18:2n-6, C18:3n-3, anne@ekspress.ee, s., 'i, +
- VERB-Fin: vt, vt., vrd
- X: of, a, b, in, n, x, AT, NB, P., S.
- Yes
- AdpType
- Post
- ADP: eest, kohta, vahel, järgi, jooksul, vastu, korral, puhul, all, pärast
- ADV: ees
- Prep
- ADP: üle, pärast, enne, koos, ilma, läbi, mööda, alates, peale, kuni
- Post
- Connegative
- Yes
- AUX: ole, saa, olnud, ei, tohi, pea, tohiks, saanud, oleks, peaks
- AUX-Fin: ole, saa, olnud, tohi, pea, tohiks, saanud, oleks, peaks, või
- VERB-Fin: tea, saa, taha, ole, suuda, oska, saanud, pruugi, suutnud, tule
- Yes
- Foreign
- Yes
- ADJ: funky, Digital, Versatile, ancien, grand, low-tech, new, old, second-hand, silent
- ADV: la, á
- CCONJ: versus
- NOUN: Bullshit, Content, Disk, Help, Quality, Scramble, Self, System, acid, chef
- PROPN: Darkmans, Meltzinger, siperian
- X: al., et, ceteris, de, paribus, in, tõ, Helicobacter, Marsa, khorji
- Yes
- Hyph
- Yes
- ADJ: täis-, pika-, väike-, eesti-, keskeri-, 4-, Monomikro-, administratiiv-, ekstra-, era-
- ADP: siin-
- ADV: sisse-, Elektro-, jae-, mehe-, sinna-, vara-
- NOUN: teadus-, kesk-, haigus-, alg-, kodu-, laade-, majandus-, uurimis-, haridus-, andme-
- NUM: 1-, 128-, 5-, 10-, 100-, 2-, 2004-, 256-, 3-, 50-
- PROPN: Kesk-, Haridus-, Kuurort-, Liha-, Lõuna-, Ida-, Julgeoleku-, Lähis-, Saare-, Agnese-
- PUNCT: --, ---
- SYM: ω-3-, ω-6-, A-, B-
- VERB-Fin: karjus-
- Yes
- InflClass
- IndEurI
- NOUN: jure
- IndEurO
- NOUN: globus
- IndEurI
- NumForm
- Digit
- ADJ: 1., 2000., 2., 1997., 1999., 3., 1996., 1998., 1992., 1995.
- NUM: 1, 2, 10, 3, 4, 5, 15, 20, 6, 12
- PROPN: 8
- SYM: %
- Roman
- ADJ: II, I, III, XI, VII, XX, VI, XII, IV, MDCXXXII
- NUM: I, IX, XII
- PROPN: ADV, CX, M, XM
- Word
- ADJ: esimene, esimest, esimese, teine, teise, esimesel, esimesed, esimeses, teisel, kolmas
- NUM: kaks, üks, kolm, kahe, ühe, miljonit, viis, miljoni, neli, kolme
- PROPN: Teist, Teise, Kolmanda, Esimene, Esimese, Kolme, Neljanda, Neljandal, Teisel
- Digit
- Person[psor]
- 3
- NOUN: Kutatointezete
- 3
- Style
- Slng
- NOUN: Hahhollidele, kilti, mersu, plevna
- Slng
- Typo
- Yes
- ADJ: 125, 15-69, 16,4, 20-, 200, 3,5, 30, 50, 500, 82
- ADP: eest
- ADV: 18,1, näteks, valimis
- DET: niiguse, sama, to
- NOUN: Los, eestirahvas, inimestel, keskkofnnaasjadest, külalsed, nishi, pealvaatajat, progrmmeerija, protsessor-, reziim
- NUM: 10, 100, 50, 25, 20, 30, 200, 21, 400, 60
- PROPN: Los, Muinuskaitsenõukogu, Sipe-, Stas-i
- VERB-Inf: kripeldada, soovitada
- VERB-Part: suutud
- VERB-Sup: leppime
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 3 lemmas as copulas (cop). Examples: olema, be, olla.
- This corpus uses 11 lemmas as auxiliaries (aux). Examples: olema, ei, võima, pidama, saama, tohtima, tunduma, ära, näima, paistma, be.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Conv--NOUN-Nom (1)
- VERB-Fin--NOUN (60)
- VERB-Fin--NOUN-All (1)
- VERB-Fin--NOUN-Gen (16)
- VERB-Fin--NOUN-Gen-ADP(ringis) (1)
- VERB-Fin--NOUN-Ine (2)
- VERB-Fin--NOUN-Nom (11346)
- VERB-Fin--NOUN-Par (1086)
- VERB-Fin--PRON-Nom (5800)
- VERB-Fin--PRON-Par (139)
- VERB-Inf--NOUN (4)
- VERB-Inf--NOUN-Gen (3)
- VERB-Inf--NOUN-Nom (517)
- VERB-Inf--NOUN-Par (46)
- VERB-Inf--PRON-Nom (270)
- VERB-Inf--PRON-Par (15)
- VERB-Part--NOUN (3)
- VERB-Part--NOUN-Gen (5)
- VERB-Part--NOUN-Ine (1)
- VERB-Part--NOUN-Nom (1401)
- VERB-Part--NOUN-Par (120)
- VERB-Part--PRON-Nom (702)
- VERB-Part--PRON-Par (24)
- VERB-Sup--NOUN (2)
- VERB-Sup--NOUN-Gen (1)
- VERB-Sup--NOUN-Nom (315)
- VERB-Sup--NOUN-Par (19)
- VERB-Sup--PRON-Nom (176)
- VERB-Sup--PRON-Par (5)
- obj
- VERB-Conv--NOUN (1)
- VERB-Conv--NOUN-Gen (45)
- VERB-Conv--NOUN-Nom (10)
- VERB-Conv--NOUN-Par (415)
- VERB-Conv--PRON-Gen (1)
- VERB-Conv--PRON-Nom (2)
- VERB-Conv--PRON-Par (33)
- VERB-Fin--NOUN (40)
- VERB-Fin--NOUN-Gen (2193)
- VERB-Fin--NOUN-Nom (1281)
- VERB-Fin--NOUN-Par (6054)
- VERB-Fin--NOUN-Par-ADP(kuni) (1)
- VERB-Fin--NOUN-Par-ADP(of) (1)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Gen (189)
- VERB-Fin--PRON-Nom (189)
- VERB-Fin--PRON-Par (1473)
- VERB-Inf--NOUN (5)
- VERB-Inf--NOUN-Ela (1)
- VERB-Inf--NOUN-Gen (303)
- VERB-Inf--NOUN-Nom (639)
- VERB-Inf--NOUN-Par (2590)
- VERB-Inf--NOUN-Par-ADP(kuni) (1)
- VERB-Inf--PRON-Gen (25)
- VERB-Inf--PRON-Nom (67)
- VERB-Inf--PRON-Par (664)
- VERB-Part--NOUN (7)
- VERB-Part--NOUN-Gen (314)
- VERB-Part--NOUN-Gen-ADP(üle) (1)
- VERB-Part--NOUN-Nom (730)
- VERB-Part--NOUN-Par (920)
- VERB-Part--PRON-Gen (28)
- VERB-Part--PRON-Nom (169)
- VERB-Part--PRON-Par (211)
- VERB-Sup--NOUN (2)
- VERB-Sup--NOUN-Gen (116)
- VERB-Sup--NOUN-Nom (30)
- VERB-Sup--NOUN-Par (831)
- VERB-Sup--PRON-Gen (7)
- VERB-Sup--PRON-Nom (3)
- VERB-Sup--PRON-Par (148)
Verbs with Reflexive Core Objects
- This corpus contains 191 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: tundma end, liigutama end, pidama ennast, ajama end, nimetama ennast, tundma ennast, täiendama end, hoidma end, nimetama end, registreerima end, seadma ennast, tasuma ennast, tegema ennast, tunnistama end, kuulutama end, laskma end, leidma end, liigutama ennast, lohutama end, pakkuma ennast, panema end, petma ennast, pidama end, seadma end, väitma end, võtma end, õigustama ennast, esitlema end, kaitsma end, keerama ennast, kohendama end, näitama end, paigutama ennast, pesema ennast, pidav end, pildistama end, pooma ennast, pressima end, pühendama end, registreerima ennast, samastama end, segama ennast, suruma end, suruma ennast, sättima end, sättima ennast, süstima end, tapma ennast, tuletama ennast, tutvustama end
- Out of those, 3 lemmas occurred more than once, but never without a reflexive dependent. Examples: pooma, samastama, välistav
Relations Overview
- This corpus uses 8 relation subtypes: acl:relcl, cc:preconj, compound:prt, csubj:cop, flat:foreign, nmod:poss, nsubj:cop, obl:agent
- The following 5 relation types are not used in this corpus at all: iobj, expl, dislocated, clf, reparandum