Treebank Statistics: UD_Lithuanian-HSE: Features: Case
This feature is universal.
It occurs with 7 different values: Acc
, Dat
, Gen
, Ins
, Loc
, Nom
, Voc
.
2283 tokens (43%) have a non-empty value of Case
.
1636 types (70%) occur at least once with a non-empty value of Case
.
1075 lemmas (67%) occur at least once with a non-empty value of Case
.
The feature is used with 8 part-of-speech tags: NOUN (1102; 21% instances), ADJ (392; 7% instances), PROPN (300; 6% instances), PRON (233; 4% instances), VERB (146; 3% instances), DET (95; 2% instances), NUM (14; 0% instances), AUX (1; 0% instances).
NOUN
1102 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NOUN
and Case
co-occurred: Number=Sing (714; 65%), Gender=Masc (682; 62%).
NOUN
tokens may have the following values of Case
:
Acc
(222; 20% of non-emptyCase
): tautą, apdovanojimą, demaskavimą, interesus, tėvynę, dieną, draudimą, duomenis, eitynes, gyvybęDat
(56; 5% of non-emptyCase
): tautai, žurnalistui, pavyzdžiui, valdžiai, Daugeliui, armėnams, asmeniui, atlikėjai, bulgarams, daugumaiGen
(339; 31% of non-emptyCase
): tautos, metų, valstybės, pilotų, tolerancijos, abejonės, amžiaus, komedijos, pagrindo, sąmonėsIns
(96; 9% of non-emptyCase
): laikais, metu, metais, akmenimis, būdu, dievais, kategorijomis, keliu, lenkais, muziejumiLoc
(61; 6% of non-emptyCase
): pasaulyje, įrašuose, Santykiuose, ateityje, centre, epochoje, gale, galvoje, gamykloje, gyvenimeNom
(328; 30% of non-emptyCase
): tauta, tiesa, daugelis, dauguma, filosofas, klaida, prietaisai, žodžiai, adresas, daiktasEMPTY
(3): m, pusėn
Paradigm prietaisas | Nom | Acc | Dat | Gen | Ins |
---|---|---|---|---|---|
Number=Sing | prietaisas | prietaisą | prietaisu | ||
Number=Plur | prietaisai | prietaisams | prietaisų |
ADJ
392 ADJ tokens (95% of all ADJ
tokens) have a non-empty value of Case
.
The most frequent other feature values with which ADJ
and Case
co-occurred: Degree=Pos (367; 94%), Definite=Ind (359; 92%), Number=Sing (245; 63%), Gender=Masc (235; 60%).
ADJ
tokens may have the following values of Case
:
Acc
(59; 15% of non-emptyCase
): lietuvius, genetiškus, pirmąjį, sudėtingas, Laikinąją, Sovietinę, antrąją, apsauginę, beviltišką, blogusDat
(12; 3% of non-emptyCase
): abejotinoms, aiškiam, karinei, kitai, klaikiam, lietuviai, mentalinei, naujoms, patriarchališkai, sveikamGen
(92; 23% of non-emptyCase
): kitų, gero, lietuvių, tautinės, Laikinosios, kitokių, laisvo, lenkų, plėšraus, politinėsIns
(46; 12% of non-emptyCase
): lietuviu, įvairiais, dešiniaisiais, kitais, lietuvišku, tautinėmis, Literatūriniu, Sovietiniais, absoliučia, anachroniškomisLoc
(13; 3% of non-emptyCase
): 9-jame, Geroje, Juodojoje, dabartinėje, kitame, kituose, linksmoje, nepriklausomoje, slaptame, specialiameNom
(170; 43% of non-emptyCase
): vienas, lietuvis, tautinė, viena, vienintelis, blogesnis, didelė, kitas, pasaulinė, paskutiniaiEMPTY
(22): 1939, XIX, nesunku, sunku, šiaip, 1941, 1944, 1961, 2002, 25
Paradigm kitas | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Gender=Masc|Number=Sing | kitas | kito | kitame | |||
Gender=Masc|Number=Plur | kiti | kitų | kituose | kitais | ||
Gender=Fem|Number=Sing | kitai | kitos | ||||
Gender=Fem|Number=Plur | kitos | kita, kitas |
PROPN
300 PROPN tokens (93% of all PROPN
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PROPN
and Case
co-occurred: Number=Sing (287; 96%), Gender=Masc (187; 62%).
PROPN
tokens may have the following values of Case
:
Acc
(11; 4% of non-emptyCase
): Lietuvą, Rusiją, Aristofaną, Atėnus, Efraimą, Europą, Turkiją, ZuroffąDat
(39; 13% of non-emptyCase
): Rusijai, Andriui, Lietuvai, Airijai, Algimantui, Arūnui, BNS, Balčiūnui, Beržiniui, DaivaiGen
(117; 39% of non-emptyCase
): Lietuvos, Strepsiado, Sokrato, Europos, Rusijos, Aristofano, Stalino, Sąjūdžio, Tu-154, BeniušioIns
(7; 2% of non-emptyCase
): Alkibiadu, Atika, Faidonais, Faidrais, Izraeliu, Kritonais, RusijaLoc
(27; 9% of non-emptyCase
): Lietuvoje, Vilniuje, Atėnuose, Lenkijoje, Slovakijoje, Vilmoje, Europoje, Holokauste, Jeruzalėje, KauneNom
(98; 33% of non-emptyCase
): Sokratas, Strepsiadas, Lietuva, Rusija, Vilma, Vytautas, Radžvilas, Aristofanas, Juknaitė, KavolisVoc
(1; 0% of non-emptyCase
): DieveEMPTY
(23): BM, MARS, KGB, R., A., JAV, MN-61, NATO, SSRS, TSRS
Paradigm Lietuva | Nom | Acc | Dat | Gen | Loc |
---|---|---|---|---|---|
Lietuva | Lietuvą | Lietuvai | Lietuvos | Lietuvoje |
PRON
233 PRON tokens (92% of all PRON
tokens) have a non-empty value of Case
.
The most frequent other feature values with which PRON
and Case
co-occurred: Number=Sing (120; 52%).
PRON
tokens may have the following values of Case
:
Acc
(56; 24% of non-emptyCase
): juos, ką, mus, save, ją, jį, kurį, man, jus, kuriuosDat
(21; 9% of non-emptyCase
): mums, sau, jam, jiems, kuriems, man, niekam, jai, joms, tiemsGen
(57; 24% of non-emptyCase
): jų, to, jo, nieko, savęs, viso, jos, kurio, kurios, kuriųIns
(9; 4% of non-emptyCase
): kuo, juo, ja, jais, jokiu, kuriais, mumisLoc
(2; 1% of non-emptyCase
): jose, kuriojeNom
(88; 38% of non-emptyCase
): jis, kas, ji, jie, kuris, mes, aš, kurie, jūs, kuriEMPTY
(21): tai, tuo
Paradigm kuris | Nom | Acc | Dat | Gen | Loc | Ins |
---|---|---|---|---|---|---|
Gender=Masc|Number=Sing | kuris | kurį | kurio | |||
Gender=Masc|Number=Plur | kurie | kuriuos | kuriems | kurių | kuriais | |
Gender=Fem|Number=Sing | kuri | kurią | kurios | kurioje | ||
Gender=Fem|Number=Plur | kurios | kurias |
VERB
146 VERB tokens (21% of all VERB
tokens) have a non-empty value of Case
.
The most frequent other feature values with which VERB
and Case
co-occurred: Person=EMPTY (146; 100%), VerbForm=Part (146; 100%), Definite=Ind (142; 97%), Mood=EMPTY (140; 96%), Polarity=Pos (128; 88%), Gender=Masc (108; 74%), Number=Sing (94; 64%), Voice=Act (87; 60%), Tense=Past (75; 51%).
VERB
tokens may have the following values of Case
:
Acc
(9; 6% of non-emptyCase
): aplamdytą, dedamus, esantį, nepažeistus, nepažeistą, nepriklausomą, prieštaraujančią, privalomą, teikiamąDat
(4; 3% of non-emptyCase
): mąstančiam, pasisakiusiam, patyrusiems, stojusiamGen
(25; 17% of non-emptyCase
): sudužusio, apsemtų, atitinkančios, baramos, dirbusio, gaminamos, gerbtinų, klausiusių, konfrontuojančių, mylinčiųIns
(4; 3% of non-emptyCase
): išlaikančiu, kalbančiu, nepriimtina, pabrėžiamomisLoc
(7; 5% of non-emptyCase
): apsuptose, nenorinčiose, nežinančiose, nukritusiame, prižiūrimose, valdomame, veikusiojeNom
(97; 66% of non-emptyCase
): vadinami, girdėję, grįžtamasis, laikomas, paskelbta, pastebimi, skirtas, žinojęs, Mąstanti, PradėjęsEMPTY
(562): gali, turi, negali, žinoma, būti, galima, nėra, sako, žino, analizuoja
Paradigm būti | Nom | Acc |
---|---|---|
Tense=Past|Variant=Short | buvęs | |
Tense=Pres | esantį |
Case
seems to be lexical feature of VERB
. 93% lemmas (106) occur only with one value of Case
.
DET
95 DET tokens (57% of all DET
tokens) have a non-empty value of Case
.
The most frequent other feature values with which DET
and Case
co-occurred: Number=Sing (60; 63%), Gender=Masc (51; 54%).
DET
tokens may have the following values of Case
:
Acc
(17; 18% of non-emptyCase
): tą, tokią, kokias, tokias, kurį, pačius, visas, visus, visąDat
(5; 5% of non-emptyCase
): tokiai, kokiai, tokiems, visokiemsGen
(27; 28% of non-emptyCase
): jokių, to, tų, viso, tokios, tos, jokios, jos, jų, kitokiųIns
(7; 7% of non-emptyCase
): tuo, jokiu, kokiu, savuoju, svo, tais, tokiaLoc
(5; 5% of non-emptyCase
): šioje, kuriuose, tame, ŠioseNom
(34; 36% of non-emptyCase
): kokia, tas, tie, tokia, kai, kiekvienas, pats, toks, visa, TokiosEMPTY
(71): mūsų, savo, jo, jų, jos, mano, tavo, šių, tam, tuos
Paradigm tas | Nom | Acc | Gen | Loc | Ins |
---|---|---|---|---|---|
_ | tuo | ||||
Definite=Ind|Gender=Masc|Number=Plur | tų | ||||
Gender=Masc|Number=Sing | tas | tą | to | tame | |
Gender=Masc|Number=Plur | tie | tais | |||
Gender=Fem|Number=Sing | toji | tą | tos | ||
Gender=Fem|Number=Plur | Tos | ||||
Number=Plur|Person=3 | tie |
NUM
14 NUM tokens (58% of all NUM
tokens) have a non-empty value of Case
.
The most frequent other feature values with which NUM
and Case
co-occurred: Gender=Masc (11; 79%), Number=EMPTY (8; 57%).
NUM
tokens may have the following values of Case
:
Acc
(8; 57% of non-emptyCase
): šimtus, du, dvi, penkis, tūkstančius, vieną, šimtąGen
(2; 14% of non-emptyCase
): trijųNom
(4; 29% of non-emptyCase
): trys, Dešimtys, DuEMPTY
(10): penkiasdešimt, 1994, 30, 4151, 52, 7, 92, dešimt, tūkst.
Paradigm trys | Nom | Gen |
---|---|---|
Gender=Masc | trys | trijų |
Gender=Fem | trijų |
AUX
1 AUX tokens (1% of all AUX
tokens) have a non-empty value of Case
.
The most frequent other feature values with which AUX
and Case
co-occurred: Mood=EMPTY (1; 100%), Number=Sing (1; 100%), Person=EMPTY (1; 100%), Polarity=Pos (1; 100%), Tense=Pres (1; 100%), VerbForm=Part (1; 100%), Voice=Act (1; 100%).
AUX
tokens may have the following values of Case
:
Nom
(1; 100% of non-emptyCase
): esąsEMPTY
(111): buvo, yra, nėra, būtų, būti, nebūtų, būna, esu, nebuvo, bus
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case
:
NOUN –[amod]–> ADJ (217; 86%),
NOUN –[conj]–> NOUN (121; 92%),
PROPN –[flat]–> PROPN (37; 90%),
ADJ –[conj]–> ADJ (28; 90%),
PROPN –[nmod]–> NOUN (27; 87%),
NOUN –[acl]–> VERB (25; 81%),
ADJ –[nsubj]–> NOUN (22; 100%),
NOUN –[amod]–> VERB (22; 81%),
PROPN –[conj]–> PROPN (17; 85%),
NOUN –[conj]–> PROPN (15; 94%).