Statistics of DET in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Estonian-EWT: POS Tags: `DET`

There are 50 DET lemmas (0%), 245 DET types (1%) and 2247 DET tokens (2%). Out of 17 observed tags, the rank of DET is: 13 in number of lemmas, 8 in number of types and 11 in number of tokens.

The 10 most frequent DET lemmas: see, mingi, selline, üks, iga, kõik, mõni, teine, sama, kogu

The 10 most frequent DET types: see, mingi, selle, kõik, seda, iga, need, üks, selline, sama

The 10 most frequent ambiguous lemmas: see (PRON 1399, DET 746), mingi (DET 281, PRON 3), selline (DET 194, ADJ 40, PRON 10), üks (DET 161, NUM 73, PRON 25), iga (DET 132, PRON 6, NOUN 1), kõik (PRON 179, DET 126, ADV 1), mõni (DET 101, PRON 29, ADJ 5), teine (DET 92, PRON 89, ADJ 33), sama (DET 80, ADV 26, ADJ 18, PRON 8, PROPN 1), kogu (DET 50, NOUN 3)

The 10 most frequent ambiguous types: see (PRON 422, DET 214), mingi (DET 143, PRON 2), selle (DET 101, PRON 101, ADJ 1), kõik (PRON 98, DET 76, X 1), seda (PRON 279, DET 81), iga (DET 71, NOUN 1, PRON 1), need (PRON 74, DET 68, VERB 2), üks (DET 57, NUM 27, PRON 12, ADV 1, X 1), selline (DET 56, ADJ 19, PRON 1), sama (DET 49, ADV 21, ADJ 13, PRON 3, X 1)

see
- PRON 422: Kurb aga nii see on ….
- DET 214: Minupärast võib see teema lukku minna .
mingi
- DET 143: Raha pole karmil masuajal mingi probleem .
- PRON 2: Mai saa nendelt küsida kuna nad ple msnnis ja üks mingi läheb täiega närvi ja teisel ple telefoni ka .
selle
- DET 101: onia fotopoe peded korrutavad nagunii selle hinna 2X .
- PRON 101: Muumak : minu meelest ka , selle nimi on pigem mudel !
- ADJ 1: kirusin sl õhtulehte põhiliselt , muuhulgas arendasin edasi ühe siit foorumist bännitu , rate lisainfot ( selle aegaset ) ..
kõik
- PRON 98: Ma arvan et selle mõttega on kõik nõus
- DET 76: KAs sul on need kõik materiaalid arvutis või lihtsalt paberil ?
- X 1: Üks kõik mida ta ka ei teinud , sai naine ikka surma ( erinevatel viisidel , kui tulemus oli olemas ) .
seda
- PRON 279: paljudel tesitel pead seda menüüst tegema .
- DET 81: gudher : Kõige targem oleks seda asja oma enda õpetaja käest küsida .
iga
- DET 71: Olemas on kogu materjal , me teeme iga asja peale spikri …
- NOUN 1: Nüüd hea end lohutada nii , et iga juba niisugune , et pole patt ümara ( potensiaalse ) vanaemana ringi veereda .
- PRON 1: Kuhu täpselt - seda teab iga üks ise .
need
- PRON 74: Nad ei tea mida mõelda need kes pole iial käinud seal
- DET 68: KAs sul on need kõik materiaalid arvutis või lihtsalt paberil ?
- VERB 2: Ei , vaatasin youtube’i videot “ You need to listen to this leading COVID-19 expert from South Korea “ .
üks
- DET 57: Isiksus on üks ääretult harv nähtus .
- NUM 27: Ja veel üks küsimus …
- PRON 12: Tore lugemine , kuigi üks pole enam käbi ega teine veel känd .
- ADV 1: Ja kui see kõik rutamine üks kord otsa saab ja pühad juba käes , siis oledki kõige pingelisema katsetuse juurde jõudnud .
- X 1: Kuhu täpselt - seda teab iga üks ise .
selline
- DET 56: On selline väljend pista ennast põleema mulle sobib .
- ADJ 19: Dedicated : Seda minagi , et teema on selline , mis mõtteid pähe ei too .
- PRON 1: Teravam ja meeldib just sellepärast , keegi eespool mainis midagi poro kuse kohta > vot mitte selline igaljuhul .
sama
- DET 49: ma tahtsin ise ka muied sama jutu panna . . .
- ADV 21: sama moodi võtsin ka füüsika .
- ADJ 13: Ülejäänud rada on sama , nagu eelmisel aastal .
- PRON 3: aga noh , sisu on ikka sama
- X 1: Nagu ma aru saan , siis on isiksus midagi lineaarset ja ma ei saa tunda ennast oma koopias kuna me pole olnud iial üks ja see sama .

Morphology

The form / lemma ratio of DET is 4.900000 (the average of all parts of speech is 1.733800).

The 1st highest number of forms (25) was observed with the lemma “see”: Neile, need, neid, neil, neis, neisse, neist, nende, nendel, nendele, nendelt, nendest, se, seda, see, sel, selle, selleks, sellel, sellele, sellelt, selleni, selles, sellesse, sellest.

The 2nd highest number of forms (20) was observed with the lemma “üks”: yheks, yhele, yhtegi, yks, ühe, ühed, ühegi, üheks, ühel, ühele, ühelgi, ühes, ühest, üht, ühte, ühtegi, ühtgi, ühtki, üks, ükski.

The 3rd highest number of forms (19) was observed with the lemma “mõni”: m6nes, m6ni, mõnd, mõnda, mõne, mõned, mõnede, mõnedel, mõnedele, mõnedki, mõnegi, mõneks, mõnel, mõnelegi, mõnelt, mõnes, mõnest, mõni, mõnigi.

DET occurs with 5 features: PronType (2247; 100% instances), Number (2187; 97% instances), Case (2185; 97% instances), Typo (28; 1% instances), Definite (4; 0% instances)

DET occurs with 24 feature-value pairs: Case=Abl, Case=Add, Case=Ade, Case=All, Case=Ela, Case=Gen, Case=Ill, Case=Ine, Case=Nom, Case=Par, Case=Ter, Case=Tra, Definite=Def, Definite=Ind, Number=Plur, Number=Sing, PronType=Art, PronType=Dem, PronType=Ind, PronType=Int,Rel, PronType=Neg, PronType=Rel, PronType=Tot, Typo=Yes

DET occurs with 84 feature combinations. The most frequent feature combination is Case=Nom|Number=Sing|PronType=Dem (392 tokens). Examples: see, selline, teine, sama, samasugune, seesama, too, 1, niisugune, säherdune

Relations

DET nodes are attached to their parents using 11 different relations: det (2220; 99% instances), nsubj:cop (6; 0% instances), conj (5; 0% instances), nmod (4; 0% instances), obl (4; 0% instances), nsubj (2; 0% instances), root (2; 0% instances), amod (1; 0% instances), dep (1; 0% instances), obj (1; 0% instances), xcomp (1; 0% instances)

Parents of DET nodes belong to 10 different parts of speech: NOUN (2043; 91% instances), PRON (52; 2% instances), PROPN (49; 2% instances), ADJ (43; 2% instances), NUM (32; 1% instances), VERB (11; 0% instances), ADV (6; 0% instances), DET (5; 0% instances), SYM (4; 0% instances), (2; 0% instances)

2148 (96%) DET nodes are leaves.

95 (4%) DET nodes have one child.

1 (0%) DET nodes have two children.

3 (0%) DET nodes have three or more children.

The highest child degree of a DET node is 7.

Children of DET nodes are attached using 12 different relations: advmod (79; 71% instances), conj (7; 6% instances), cc (6; 5% instances), punct (6; 5% instances), obl (3; 3% instances), acl (2; 2% instances), cop (2; 2% instances), nsubj:cop (2; 2% instances), case (1; 1% instances), det (1; 1% instances), goeswith (1; 1% instances), parataxis (1; 1% instances)

Children of DET nodes belong to 12 different parts of speech: ADV (79; 71% instances), CCONJ (6; 5% instances), PUNCT (6; 5% instances), DET (5; 5% instances), NOUN (4; 4% instances), AUX (2; 2% instances), PRON (2; 2% instances), PROPN (2; 2% instances), VERB (2; 2% instances), ADJ (1; 1% instances), ADP (1; 1% instances), X (1; 1% instances)

Treebank Statistics: UD_Estonian-EWT: POS Tags: DET

Morphology

Relations

Treebank Statistics: UD_Estonian-EWT: POS Tags: `DET`