Treebank Statistics: UD_Lithuanian-HSE: POS Tags: DET
There are 31 DET
lemmas (2%), 67 DET
types (3%) and 166 DET
tokens (3%).
Out of 16 observed tags, the rank of DET
is: 7 in number of lemmas, 7 in number of types and 11 in number of tokens.
The 10 most frequent DET
lemmas: tas, toks, mūsų, savo, visas, jų, šis, jo, koks, jos
The 10 most frequent DET
types: mūsų, savo, jų, jo, jos, tą, kokia, mano, tas, tokia
The 10 most frequent ambiguous lemmas: tas (DET 24, PRON 12), toks (DET 19, PRON 4, ADV 2), visas (DET 11, PRON 6), šis (DET 9, ADV 5, PRON 1), koks (DET 7, PRON 2), pats (DET 6, PRON 1), joks (DET 5, PRON 2), jis (PRON 34, DET 4), kuris (PRON 38, DET 3), tam (DET 2, ADV 1)
The 10 most frequent ambiguous types: mūsų (DET 17, PRON 2), jų (DET 10, PRON 10), jo (DET 9, PRON 6), jos (DET 6, PRON 3), tas (DET 4, PRON 2), jokių (DET 3, PRON 1), to (PRON 9, DET 2), viso (PRON 4, DET 3), tam (DET 2, ADV 1, PRON 1), toks (ADV 2, DET 2)
- mūsų
- jų
- jo
- jos
- tas
- DET 4: Ko gero , tas grįžtamasis ryšys veikia nuo 1939 metų .
- PRON 2: Kas sovietams tikrai rūpėjo padaryti , tas jiems ir pavyko : savo valdinius , kad ir kokia kalba jie kalbėtų ir kuo save laikytų , jie smarkiai demoralizavo , įdiegė jiems siaurą primityvų mentalitetą , kurio dalis , beje , buvo ir ksenofobija , ir neapykanta visokiems „ kosmopolitams “ .
- jokių
- DET 3: Bet nepriklausomybė be jokių apribojimų praktiškai neįmanoma , o jeigu įmanoma , tai žalinga .
- PRON 1: Išties , Tu-154 katastrofą tiriantys ekspertai dėmesį atkreipė į paskutines dešimt pilotų pokalbių sekundžių – iki tol kilęs lėktuvas nepatyrė jokių gedimų , o apie „ ypatingą situaciją “ lėktuve tyrėjams užuominas suteikė būtent pilotų pokalbiai .
- to
- viso
- tam
- DET 2: Galima ne be tam tikro pagrindo tikėtis Rusijai tokios išeities , kokią savo metu pasirinko Mustafos Kemalio Turkija .
- ADV 1: Nesame pribrendę tam , kad suvoktume : neleistina teisinti ir remti nusikaltėlio tik todėl , kad jis etninis lietuvis ( laikąs save patriotu ) , o jo aukos ir ieškovai – nelietuviai .
- PRON 1: Žinoma , tam reikia protingai išspręsti Lietuvos pilietybės klausimą .
- toks
Morphology
The form / lemma ratio of DET
is 2.161290 (the average of all parts of speech is 1.442977).
The 1st highest number of forms (10) was observed with the lemma “tas”: tais, tame, tas, tie, to, toji, tos, tuo, tą, tų.
The 2nd highest number of forms (9) was observed with the lemma “toks”: tokia, tokiai, tokias, tokiems, tokio, tokios, tokią, tokių, toks.
The 3rd highest number of forms (8) was observed with the lemma “visas”: visa, visas, visi, viso, visos, visus, visą, visų.
DET
occurs with 5 features: Case (95; 57% instances), Number (93; 56% instances), Gender (91; 55% instances), Definite (6; 4% instances), Person (2; 1% instances)
DET
occurs with 13 feature-value pairs: Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Definite=Def
, Definite=Ind
, Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, Person=3
DET
occurs with 28 feature combinations.
The most frequent feature combination is _
(71 tokens).
Examples: mūsų, savo, jo, jų, jos, mano, tavo, šių, tam, tuos
Relations
DET
nodes are attached to their parents using 8 different relations: det (143; 86% instances), fixed (6; 4% instances), amod (5; 3% instances), nsubj (5; 3% instances), obj (3; 2% instances), conj (2; 1% instances), appos (1; 1% instances), obl (1; 1% instances)
Parents of DET
nodes belong to 8 different parts of speech: NOUN (136; 82% instances), VERB (9; 5% instances), ADJ (5; 3% instances), PROPN (5; 3% instances), PRON (4; 2% instances), SCONJ (3; 2% instances), ADP (2; 1% instances), DET (2; 1% instances)
144 (87%) DET
nodes are leaves.
19 (11%) DET
nodes have one child.
1 (1%) DET
nodes have two children.
2 (1%) DET
nodes have three or more children.
The highest child degree of a DET
node is 4.
Children of DET
nodes are attached using 10 different relations: advmod (6; 21% instances), punct (6; 21% instances), acl:relcl (3; 11% instances), case (3; 11% instances), fixed (3; 11% instances), acl (2; 7% instances), cc (2; 7% instances), advmod:emph (1; 4% instances), conj (1; 4% instances), parataxis (1; 4% instances)
Children of DET
nodes belong to 11 different parts of speech: PUNCT (6; 21% instances), PART (5; 18% instances), ADV (3; 11% instances), VERB (3; 11% instances), ADP (2; 7% instances), CCONJ (2; 7% instances), DET (2; 7% instances), NOUN (2; 7% instances), ADJ (1; 4% instances), PRON (1; 4% instances), SCONJ (1; 4% instances)