Treebank Statistics: UD_Latvian-LVTB: Features: Case
This feature is universal.
It occurs with 6 different values: Acc
, Dat
, Gen
, Loc
, Nom
, Voc
.
147352 tokens (48%) have a non-empty value of Case
.
41727 types (79%) occur at least once with a non-empty value of Case
.
17163 lemmas (76%) occur at least once with a non-empty value of Case
.
The feature is used with 8 part-of-speech tags: NOUN (83062; 27% instances), PRON (16555; 5% instances), ADJ (14937; 5% instances), VERB (12007; 4% instances), PROPN (11409; 4% instances), DET (7338; 2% instances), NUM (1838; 1% instances), AUX (206; 0% instances).
NOUN
83062 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (56616; 68%), Gender=Fem (41777; 50%).
NOUN
tokens may have the following values of Case
:
Acc
(17015; 20% of non-emptyCase
): laiku, gadus, reizi, darbu, gadu, iespēju, vietu, dienu, informāciju, daļuDat
(8373; 10% of non-emptyCase
): piemēram, gadiem, cilvēkiem, bērniem, iedzīvotājiem, gadam, valstīm, rokām, kājām, beigāmGen
(26647; 32% of non-emptyCase
): gada, valsts, darba, gadu, laika, izglītības, pasaules, dzīves, zemes, cilvēkuLoc
(11616; 14% of non-emptyCase
): laikā, gadā, gadījumā, vietā, gados, mājās, pasaulē, sākumā, veidā, vidūNom
(19343; 23% of non-emptyCase
): cilvēki, cilvēks, bērni, iespēja, vīrietis, laiks, sieviete, skaits, daļa, jautājumsVoc
(68; 0% of non-emptyCase
): kolēģi, minci, Opi, meli, bērniņ, deputāti, mopsi, radioklausītāji, saule, DievsEMPTY
(836): eiro, SIA, auto, kino, foto, TV, video, radio, IKP, plkst.
Paradigm platība | Nom | Acc | Dat | Gen | Voc | Loc |
---|---|---|---|---|---|---|
Number=Sing | platība | platību | platības | platība | platībā | |
Number=Plur | platības | platības | platībām | platību | platībās |
PRON
16555 PRON tokens (100% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Number=Sing (9757; 59%).
PRON
tokens may have the following values of Case
:
Acc
(3328; 20% of non-emptyCase
): to, ko, viņu, mani, kuru, sevi, visu, tos, tās, nekoDat
(2771; 17% of non-emptyCase
): man, tam, mums, viņam, viņai, viņiem, tev, sev, tiem, kamGen
(1249; 8% of non-emptyCase
): viņa, mūsu, viņas, viņu, tā, jūsu, tās, kā, manis, sevisLoc
(511; 3% of non-emptyCase
): kurā, tajā, kurās, sevī, kuros, pašā, kādā, tajos, tajās, viņāNom
(8696; 53% of non-emptyCase
): kas, es, tas, viņš, viņa, mēs, tā, viņi, tu, kurš
Paradigm tas | Nom | Acc | Dat | Gen | Loc |
---|---|---|---|---|---|
Gender=Masc|Number=Sing | tas | to | tam | tā | tajā, tai |
Gender=Masc|Number=Sing|Typo=Yes | to | ||||
Gender=Masc|Number=Plur | tie | tos | tiem | to | tajos |
Gender=Masc|Number=Plur|Typo=Yes | tos | ||||
Gender=Fem|Number=Sing | to |
ADJ
14937 ADJ tokens (90% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: NumType=EMPTY (14127; 95%), Degree=Pos (13658; 91%), Number=Sing (9964; 67%), Gender=Masc (7855; 53%), Definite=Ind (7634; 51%).
ADJ
tokens may have the following values of Case
:
Acc
(3379; 23% of non-emptyCase
): pirmo, lielu, jaunu, labu, jauno, lielāku, otro, īpašu, lielāko, ekonomiskoDat
(1439; 10% of non-emptyCase
): dažādiem, dažādām, lielām, pirmajiem, vietējiem, lieliem, lielākajiem, jaunajiem, pirmajam, pārējiemGen
(2573; 17% of non-emptyCase
): dažādu, administratīvā, nacionālās, pedagoģisko, pirmā, pirmās, nekustamā, jauna, augstākās, sociāloLoc
(1544; 10% of non-emptyCase
): pirmajā, otrajā, lielā, nākamajā, pēdējos, dažādās, pēdējā, iepriekšējā, jaunajā, dažādosNom
(6000; 40% of non-emptyCase
): iespējams, nepieciešams, liela, liels, galvenais, pirmais, pirmā, skaidrs, dažādi, lielākāVoc
(2; 0% of non-emptyCase
): mīļoEMPTY
(1705): 1., 2., 3., 2014., 2012., 4., 9., 2011., 2015., 6.
Paradigm mīļš | Nom | Acc | Dat | Gen | Voc | Loc |
---|---|---|---|---|---|---|
Definite=Def|Degree=Pos|Gender=Masc|Number=Sing | mīļais | mīļo | mīļajam | mīļā | ||
Definite=Def|Degree=Pos|Gender=Masc|Number=Plur | mīļie | |||||
Definite=Def|Degree=Pos|Gender=Fem|Number=Sing | mīļā | mīļās | mīļo | |||
Definite=Def|Degree=Cmp|Gender=Masc|Number=Sing | mīļākais | mīļāko | mīļākajā | |||
Definite=Def|Degree=Cmp|Gender=Masc|Number=Plur | mīļākie | |||||
Definite=Def|Degree=Cmp|Gender=Fem|Number=Sing | Mīļākā | mīļāko | ||||
Definite=Def|Degree=Cmp|Gender=Fem|Number=Plur | mīļākās | mīļākās | mīļākajām | |||
Definite=Def|Degree=Sup|Gender=Masc|Number=Plur | vismīļākie | |||||
Definite=Ind|Degree=Pos|Gender=Masc|Number=Sing | mīļš | mīļu | ||||
Definite=Ind|Degree=Pos|Gender=Masc|Number=Plur | mīļi | mīļus | ||||
Definite=Ind|Degree=Pos|Gender=Fem|Number=Sing | mīļa | mīļu | ||||
Definite=Ind|Degree=Pos|Gender=Fem|Number=Plur | mīļās |
VERB
12007 VERB tokens (26% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Evident=EMPTY (12007; 100%), Mood=EMPTY (12007; 100%), Person=EMPTY (12007; 100%), VerbForm=Part (11862; 99%), Degree=Pos (11784; 98%), Polarity=Pos (11644; 97%), Reflex=EMPTY (11090; 92%), Aspect=Perf (9912; 83%), Tense=Past (9912; 83%), Definite=Ind (9017; 75%).
VERB
tokens may have the following values of Case
:
Acc
(1300; 11% of non-emptyCase
): minēto, esošo, noteiktu, noteikto, notikušo, zināmu, notiekošo, teikto, atlikušo, vienotuDat
(612; 5% of non-emptyCase
): esošajiem, noteiktajam, aizturētajiem, iesaistītajām, minētajiem, bijušajām, izveidotajām, noteiktajiem, noteiktiem, strādājošajiemGen
(839; 7% of non-emptyCase
): pagājušā, esošo, teiktā, dzimušo, minētā, pagājušās, aptaujāto, bruņoto, bijušā, noteiktaLoc
(430; 4% of non-emptyCase
): pagājušajā, noteiktā, noteiktajā, minētajā, aizvadītajā, zināmā, drukātajā, vienotā, atbilstošā, dzimtajāNom
(8815; 73% of non-emptyCase
): zināms, bijis, redzams, paredzēts, ziņots, plānots, bijusi, saistīts, izdevies, noteiktsVoc
(11; 0% of non-emptyCase
): cienījamie, Godājamie, cienījamās, godātāEMPTY
(34691): ir, var, varētu, nav, bija, nevar, būs, notiek, sāka, saka
Paradigm būt | Nom | Acc | Dat | Gen | Loc |
---|---|---|---|---|---|
Aspect=Imp|Definite=Def|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošais | esošo | esošajam | esošā | esošajā |
Aspect=Imp|Definite=Def|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošie | esošos | esošajiem | esošo | esošajos |
Aspect=Imp|Definite=Def|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošā | esošo | esošās | ||
Aspect=Imp|Definite=Def|Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošās | esošās | esošajām | esošo | esošajās |
Aspect=Imp|Definite=Ind|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošā | ||||
Aspect=Imp|Definite=Ind|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošus | esošiem | |||
Aspect=Imp|Definite=Ind|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošu | esošas | esošā | ||
Aspect=Imp|Definite=Ind|Degree=Pos|Gender=Fem|Number=Plur|Polarity=Neg|Tense=Pres|VerbForm=Part|Voice=Act | neesošām | ||||
Aspect=Imp|Definite=Ind|Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošas | esošām | esošās | ||
Aspect=Perf|Definite=Def|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušais | bijušo | bijušajam | bijušā | bijušajā |
Aspect=Perf|Definite=Def|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušie | bijušajiem | bijušo | ||
Aspect=Perf|Definite=Def|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušo | bijušajai | bijušās | ||
Aspect=Perf|Definite=Def|Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušās | bijušajām | bijušajās | ||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebijis | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijis | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijuši | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebijušu | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijusi | Bijušās | |||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos|Tense=Past|Typo=Yes|VerbForm=Part|Voice=Act | bijušās | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušas | ||||
Definite=Def|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Neg|Tense=Pres|VerbForm=Part|Voice=Pass | neesošajai | ||||
Definite=Ind|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Neg|Tense=Pres|VerbForm=Part|Voice=Pass | nebijušiem | ||||
Definite=Ind|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Neg|Tense=Pres|VerbForm=Part|Voice=Pass | nebijušu | ||||
Gender=Masc|Number=Sing|Polarity=Neg|VerbForm=Conv | nebūdams | ||||
Gender=Masc|Number=Sing|Polarity=Pos|VerbForm=Conv | būdams |
PROPN
11409 PROPN tokens (86% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (10965; 96%), Gender=Fem (7148; 63%).
PROPN
tokens may have the following values of Case
:
Acc
(963; 8% of non-emptyCase
): Latviju, Rīgu, Eiropu, Igauniju, Lietuvu, Vāciju, Jāni, Somiju, Losandželosu, ĪrijuDat
(518; 5% of non-emptyCase
): Latvijai, Sofijai, Ievai, Jāņiem, Saeimai, Apsītim, Eiropai, Rīgai, Helēnai, KārlimGen
(4083; 36% of non-emptyCase
): Latvijas, Eiropas, Rīgas, Krievijas, Baltijas, Saeimas, Jelgavas, Liepājas, Bauskas, LietuvasLoc
(1192; 10% of non-emptyCase
): Latvijā, Rīgā, Eiropā, Krievijā, Vācijā, Saeimā, Liepājā, Lietuvā, Īrijā, FrancijāNom
(4626; 41% of non-emptyCase
): Sofija, Andris, Latvija, Rīga, Jānis, Māris, Vilks, Iveta, Saeima, LauraVoc
(27; 0% of non-emptyCase
): Sofij, Armand, Didzi, Dmitrij, Čarli, Agnes, Andrej, Augustīn, DIDZI, DievsEMPTY
(1872): ES, LETA, ASV, A., Lattelecom, V., M., NATO, ZAAO, I.
Paradigm Sofija | Nom | Acc | Dat | Gen | Voc | Loc |
---|---|---|---|---|---|---|
Sofija | Sofiju | Sofijai | Sofijas | Sofij | Sofijā |
DET
7338 DET tokens (100% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Poss=EMPTY (6024; 82%), Person=EMPTY (5012; 68%), Number=Sing (4561; 62%), Gender=Masc (4016; 55%).
DET
tokens may have the following values of Case
:
Acc
(2107; 29% of non-emptyCase
): savu, šo, kādu, to, visu, katru, savas, šādu, savus, visusDat
(843; 11% of non-emptyCase
): saviem, citiem, visiem, citām, šiem, savām, visām, šim, tiem, šīmGen
(1515; 21% of non-emptyCase
): tā, tās, to, šīs, šī, savas, kuru, citu, šo, kurasLoc
(1091; 15% of non-emptyCase
): šajā, savā, tajā, kādā, tādā, visā, tai, citā, katrā, pašāNom
(1782; 24% of non-emptyCase
): šī, šis, visi, šie, kāds, mans, vairāki, daudzi, šāda, tā
Paradigm šis | Nom | Acc | Dat | Gen | Loc |
---|---|---|---|---|---|
Gender=Masc|Number=Sing | šis | šo | šim | šī, šā | šajā, šai |
Gender=Masc|Number=Plur | šie | šos | šiem | šo | šajos |
Gender=Fem|Number=Sing | šo |
NUM
1838 NUM tokens (46% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: NumType=Card (1824; 99%), Gender=Masc (1128; 61%), Number=Plur (964; 52%).
NUM
tokens may have the following values of Case
:
Acc
(491; 27% of non-emptyCase
): vienu, otru, trīs, divas, divus, piecus, četrus, sešus, septiņus, četrasDat
(290; 16% of non-emptyCase
): diviem, trim, vienam, divām, pieciem, vienai, otram, četrām, astoņiem, septiņiemGen
(233; 13% of non-emptyCase
): vienas, divu, viena, trīs, otras, piecu, otra, sešu, četru, astoņuLoc
(164; 9% of non-emptyCase
): vienā, otrā, divos, deviņos, divās, piecos, trīs, četros, piecās, trijāsNom
(660; 36% of non-emptyCase
): viens, viena, trīs, divi, divas, otrs, četri, pieci, otra, septiņiEMPTY
(2115): desmit, 20, 3, 2, 30, 1, 5, 10, 15, 50
Paradigm viens | Nom | Acc | Dat | Gen | Loc |
---|---|---|---|---|---|
Gender=Masc|Number=Sing | viens | vienu | vienam | viena | vienā |
Gender=Masc|Number=Plur | vieni | vieniem | vienu | vienos | |
Gender=Fem|Number=Sing | viena | vienu | vienai | vienas | vienā |
Gender=Fem|Number=Plur | vienas | vienas, Vienu | vienām | Vienās |
AUX
206 AUX tokens (2% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Evident=EMPTY (206; 100%), Mood=EMPTY (206; 100%), Person=EMPTY (206; 100%), Polarity=Pos (203; 99%), VerbForm=Part (195; 95%), Voice=Act (195; 95%), Tense=Past (193; 94%).
AUX
tokens may have the following values of Case
:
Acc
(6; 3% of non-emptyCase
): bijušo, nebijušuDat
(1; 0% of non-emptyCase
): bijušajāmGen
(1; 0% of non-emptyCase
): esošāsLoc
(1; 0% of non-emptyCase
): bijušajosNom
(197; 96% of non-emptyCase
): bijis, bijusi, bijuši, tikusi, ticis, bijušas, būdams, tikuši, būdami, tikušasEMPTY
(8224): ir, bija, nav, tiek, tika, būtu, būs, būt, esmu, tiks
Paradigm būt | Nom | Acc | Dat | Gen | Loc |
---|---|---|---|---|---|
Aspect=Imp|Definite=Def|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esošās | ||||
Aspect=Imp|Definite=Ind|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos|Tense=Pres|VerbForm=Part|Voice=Act | esoša | ||||
Aspect=Perf|Definite=Def|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | Bijušo | ||||
Aspect=Perf|Definite=Def|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušajos | ||||
Aspect=Perf|Definite=Def|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušo | ||||
Aspect=Perf|Definite=Def|Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušajām | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | nebijušu | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Masc|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijis | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Masc|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijuši | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Fem|Number=Sing|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijusi | ||||
Aspect=Perf|Definite=Ind|Degree=Pos|Gender=Fem|Number=Plur|Polarity=Pos|Tense=Past|VerbForm=Part|Voice=Act | bijušas | ||||
Gender=Masc|Number=Sing|Polarity=Neg|VerbForm=Conv | nebūdams | ||||
Gender=Masc|Number=Sing|Polarity=Pos|VerbForm=Conv | būdams | ||||
Gender=Masc|Number=Plur|Polarity=Pos|VerbForm=Conv | būdami | ||||
Gender=Fem|Number=Sing|Polarity=Pos|VerbForm=Conv | būdama |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (10920; 87%),
NOUN –[det]–> DET (6313; 91%),
NOUN –[conj]–> NOUN (4563; 90%),
NOUN –[amod]–> VERB (3599; 96%),
VERB –[nsubj:pass]–> NOUN (1724; 96%),
PROPN –[flat:name]–> PROPN (1536; 79%),
NOUN –[nummod]–> NUM (1223; 51%),
PROPN –[nmod]–> NOUN (1060; 70%),
ADJ –[nsubj]–> NOUN (813; 97%),
PROPN –[conj]–> PROPN (805; 92%).