Treebank Statistics: UD_Karelian-KKPP: Features: Case
This feature is universal.
It occurs with 14 different values: Abe, Abl, Acc, Ade, Com, Ela, Ess, Gen, Ill, Ine, Ins, Nom, Par, Tra.
1586 tokens (51%) have a non-empty value of Case.
1015 types (72%) occur at least once with a non-empty value of Case.
620 lemmas (66%) occur at least once with a non-empty value of Case.
The feature is used with 8 part-of-speech tags: NOUN (837; 27% instances), PRON (288; 9% instances), ADJ (213; 7% instances), PROPN (181; 6% instances), NUM (42; 1% instances), VERB (20; 1% instances), ADP (3; 0% instances), AUX (2; 0% instances).
NOUN
837 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Case.
The most frequent other feature values with which NOUN and Case co-occurred: Number=Sing (587; 70%).
NOUN tokens may have the following values of Case:
Abe(1; 0% of non-emptyCase): valottaAbl(5; 1% of non-emptyCase): saitilta, ulkomailta, ulkopuolelta, Šuolta, šeuvultaAde(61; 7% of non-emptyCase): avulla, kielellä, lapšilla, pojalla, tiellä, šuolla, alovehella, muamolla, ruavolla, šijallaCom(1; 0% of non-emptyCase): jäšeninehEla(13; 2% of non-emptyCase): mieleštä, alkoholista, artistoista, huumehista, järještöistä, kiäštä, luomistöistä, meininkistä, näkömykšistä, tašavalloistaEss(27; 3% of non-emptyCase): vuotena, aikana, tarkotukšena, huomenekšena, johtajana, perehenä, piäaihiena, piälaušehena, proplemana, päivänäGen(191; 23% of non-emptyCase): muan, kulttuurien, lapšien, karjalan, muajilman, pelin, pojan, -projektin, ihmisen, järještönIll(68; 8% of non-emptyCase): aktijoh, kulttuurih, luontoh, pelih, -aktijoh, aikah, hilloh, kieleh, kotih, laitahIne(70; 8% of non-emptyCase): yhteistyöššä, kylissä, ativoissa, kilpailušša, lopušša, roolissa, -eepossašta, -leheššä, -teatterissa, -tehnikaššaIns(1; 0% of non-emptyCase): ropehellisinNom(225; 27% of non-emptyCase): muamo, poika, tunti, ropehet, aktijo, luokka, peli, tuatto, valot, eläjätPar(167; 20% of non-emptyCase): ihmisie, hilluo, henkie, kulttuurie, lapšie, lauluja, muata, kaupunkie, kertua, kevätkuutaTra(7; 1% of non-emptyCase): kunnivokši, voittajakši, karjalakši, runonlaulajakši, tunniksiEMPTY(2): klo, ven.
| Paradigm ihmini | Nom | Gen | Par | Ine | Ill | Ade |
|---|---|---|---|---|---|---|
| Number=Sing | ihmini | ihmisen | ihmiseh | |||
| Number=Plur | ihmiset | ihmisien | ihmisie | ihmisissä | ihmisillä |
PRON
288 PRON tokens (100% of all PRON tokens) have a non-empty value of Case.
The most frequent other feature values with which PRON and Case co-occurred: Number=Sing (186; 65%), Person=EMPTY (161; 56%).
PRON tokens may have the following values of Case:
Abl(1; 0% of non-emptyCase): meiltäAcc(2; 1% of non-emptyCase): ket, miutAde(17; 6% of non-emptyCase): meilä, miula, Molommilla, heilä, hänellä, ičellä, ičelläh, kaikilla, kellä, tälläCom(1; 0% of non-emptyCase): kaikkineEla(17; 6% of non-emptyCase): šiitä, kumpasešta, niistä, Miušta, kumpasistaEss(2; 1% of non-emptyCase): tänäGen(49; 17% of non-emptyCase): meijän, miun, šen, hänen, kumpasien, šiun, tämän, Näijen, heijän, kenenIll(18; 6% of non-emptyCase): mih, šinne, šiih, tähä, molompih, niihi, näih, tähIne(10; 3% of non-emptyCase): missä, mistä, täššä, monešša, šiinäIns(5; 2% of non-emptyCase): kaikinNom(126; 44% of non-emptyCase): hyö, mie, hiän, myö, še, kaikki, šie, ne, kumpaset, mitPar(40; 14% of non-emptyCase): mitä, tätä, šitä, iččie, niitä, kumpaista, muuta, Milma, heitä, häntäEMPTY(1): kennih
| Paradigm še | Nom | Gen | Par | Ine | Ill | Ela |
|---|---|---|---|---|---|---|
| še | šen | šitä | šiinä | šinne, šiih | šiitä |
ADJ
213 ADJ tokens (99% of all ADJ tokens) have a non-empty value of Case.
The most frequent other feature values with which ADJ and Case co-occurred: Number=Sing (133; 62%).
ADJ tokens may have the following values of Case:
Ade(15; 7% of non-emptyCase): kolmannella, omalla, toisella, Uuvvella, enšimmäisellä, kanšainvälisellä, kovalla, nuorilla, omilla, virallisillaEla(1; 0% of non-emptyCase): pahaštaEss(9; 4% of non-emptyCase): enšimmäisinä, Eryähänä, pienenä, rehellisenä, viimesenä, viimesinä, šeuruavana, šuurenaGen(39; 18% of non-emptyCase): kanšallisien, eeppisien, nuorien, oman, toisen, uuvven, armenijalaisien, azerbaidžanilaisien, eeppisen, enšimmäisenIll(5; 2% of non-emptyCase): henkelliseh, kymmenenteh, pikkaraiseh, tarkkah, terväsehIne(7; 3% of non-emptyCase): enšimmäiseššä, kanšainvälisistä, kuulusimmissa, oikiešša, toisissa, šamašša, šuurimmistaNom(69; 32% of non-emptyCase): 2., toini, 28., Eeppini, mukava, omat, toiset, uuši, 1., 19.Par(63; 30% of non-emptyCase): omie, omua, šemmosie, toisie, erilaisie, kypšie, šuurie, Viimesie, alkuperaistä, epävirallistaTra(5; 2% of non-emptyCase): parahakši, kannettavakši, šiliekši, šuurimmakšiEMPTY(3): 21., 23., 25.
| Paradigm šuuri | Gen | Par | Ess | Tra | Ine | Ade |
|---|---|---|---|---|---|---|
| Degree=Cmp|Number=Sing | šuuremman | |||||
| Degree=Sup|Number=Sing | šuurimmakši | |||||
| Degree=Sup|Number=Plur | šuurimpie | šuurimmista | ||||
| Number=Sing | šuurie | šuurena | šuurella | |||
| Number=Plur | šuurie |
PROPN
181 PROPN tokens (100% of all PROPN tokens) have a non-empty value of Case.
The most frequent other feature values with which PROPN and Case co-occurred: Number=Sing (178; 98%).
PROPN tokens may have the following values of Case:
Ade(7; 4% of non-emptyCase): Venäjällä, Arbatilla, Kirilällä, PolenovillaEla(7; 4% of non-emptyCase): Moskovašta, Kalevalašta, Karjalašta, Murmanskista, Piiteristä, TulaštaGen(77; 43% of non-emptyCase): Karjalan, Kalevalan, Venäjän, Kiestinkin, Petroskoin, Art-teltan, Kižin, Pohjolan, WWF:n, AinonIll(4; 2% of non-emptyCase): Manalah, KarjalahIne(14; 8% of non-emptyCase): Petroskoissa, Petroskoissaki, Aunukšešša, Australijašša, Eremitaašissa, Hristossa, Kalevalašša, Karjalašša, Moskovašša, PariisissaNom(67; 37% of non-emptyCase): Kalevala, Anna, Irina, WWF, Art-teltta, Lemminkäini, L’udmila, Mugačeva, Tatjana, AkropolisPar(5; 3% of non-emptyCase): Annua, Joukahaista, Kalevala-, Vlasovua, Šeinua
| Paradigm Kalevala | Nom | Gen | Ine | Ela |
|---|---|---|---|---|
| Kalevala | Kalevalan | Kalevalašša | Kalevalašta |
NUM
42 NUM tokens (89% of all NUM tokens) have a non-empty value of Case.
The most frequent other feature values with which NUM and Case co-occurred: Number=Sing (37; 88%), NumType=EMPTY (29; 69%).
NUM tokens may have the following values of Case:
Gen(3; 7% of non-emptyCase): kahekšan, puolenIne(2; 5% of non-emptyCase): Yheššä, šuaššaNom(33; 79% of non-emptyCase): kakši, nellä, Yhet, kolme, pari, viisi, 14, 150, 175, 184Par(4; 10% of non-emptyCase): miljonie, kuutta, miljardieEMPTY(5): 2017, 185035, 2, puolitoista
| Paradigm yksi | Nom | Ine |
|---|---|---|
| Number=Sing | yksi | Yheššä |
| Number=Plur | Yhet |
Case seems to be lexical feature of NUM. 92% lemmas (23) occur only with one value of Case.
VERB
20 VERB tokens (5% of all VERB tokens) have a non-empty value of Case.
The most frequent other feature values with which VERB and Case co-occurred: Mood=EMPTY (20; 100%), Person=EMPTY (20; 100%), Tense=EMPTY (12; 60%), Voice=EMPTY (11; 55%).
VERB tokens may have the following values of Case:
Abe(1; 5% of non-emptyCase): ajattelomattaAde(2; 10% of non-emptyCase): Kieltämällä, šalpuamallaIll(2; 10% of non-emptyCase): ruatamah, šyömähIne(5; 25% of non-emptyCase): kaččomašša, olomašša, vaihtuas’s’aNom(10; 50% of non-emptyCase): järješšetty, kirjutettu, käyty, lašettu, peitetty, pietty, valettu, šanottu, šuunnattuEMPTY(359): tuli, pitäy, otettih, ošallistu, paissa, kiinnoššuttua, leväheltih, luati, lähettih, löytyä
Case seems to be lexical feature of VERB. 100% lemmas (17) occur only with one value of Case.
ADP
3 ADP tokens (6% of all ADP tokens) have a non-empty value of Case.
The most frequent other feature values with which ADP and Case co-occurred: Number=Sing (3; 100%), Voice=Pass (3; 100%).
ADP tokens may have the following values of Case:
Nom(2; 67% of non-emptyCase): keritty, vaivuttuPar(1; 33% of non-emptyCase): tultuohEMPTY(45): kera, jälkeh, kešen, vaštah, lisäkši, luo, luona, Ilman, alla, alta
AUX
2 AUX tokens (1% of all AUX tokens) have a non-empty value of Case.
The most frequent other feature values with which AUX and Case co-occurred: Mood=EMPTY (2; 100%), Person=EMPTY (2; 100%), Voice=EMPTY (2; 100%).
AUX tokens may have the following values of Case:
Gen(1; 50% of non-emptyCase): ollunIne(1; 50% of non-emptyCase): olleššahEMPTY(132): on, oli, ei, voit, ois, olet, ollah, oltih, pitäy, en
| Paradigm olla | Gen | Ine |
|---|---|---|
| Number=Sing|Tense=Past|VerbForm=Part | ollun | |
| Person[psor]=3|VerbForm=Inf | olleššah |
Relations with Agreement in Case
The 10 most frequent relations where parent and child node agree in Case:
NOUN –[amod]–> ADJ (136; 91%),
NOUN –[conj]–> NOUN (69; 85%),
NOUN –[det]–> PRON (30; 94%),
PROPN –[flat:name]–> PROPN (14; 67%),
PROPN –[conj]–> PROPN (11; 100%),
ADJ –[conj]–> ADJ (10; 100%),
NOUN –[conj]–> ADJ (6; 75%),
NOUN –[nsubj:cop]–> PRON (6; 86%),
PROPN –[parataxis]–> NOUN (6; 100%),
NOUN –[appos]–> NOUN (5; 100%).