Treebank Statistics: UD_Finnish-FTB: Features: Clitic
This feature is language-specific.
It occurs with 7 different values: Han, Ka, Kaan, Kin, Ko, Pa, S.
Some words have combined values of the feature; 9 combinations have been observed: Han|Ka, Han|Kin, Han|Ko, Han|Pa, Ka|S, Kaan|Ko, Kin|Ko, Ko|S, Pa|S.
2944 tokens (2%) have a non-empty value of Clitic.
1726 types (4%) occur at least once with a non-empty value of Clitic.
759 lemmas (4%) occur at least once with a non-empty value of Clitic.
The feature is used with 11 part-of-speech tags: VERB (959; 1% instances), AUX (708; 0% instances), NOUN (354; 0% instances), PRON (317; 0% instances), ADV (292; 0% instances), ADJ (110; 0% instances), DET (73; 0% instances), PROPN (57; 0% instances), PART (45; 0% instances), NUM (21; 0% instances), ADP (8; 0% instances).
VERB
959 VERB tokens (4% of all VERB tokens) have a non-empty value of Clitic.
The most frequent other feature values with which VERB and Clitic co-occurred: PartForm=EMPTY (918; 96%), InfForm=EMPTY (904; 94%), Voice=Act (882; 92%), Case=EMPTY (863; 90%), VerbForm=Fin (862; 90%), Mood=Ind (691; 72%), Number=Sing (683; 71%), Tense=Pres (500; 52%).
VERB tokens may have the following values of Clitic:
Han(63; 7% of non-emptyClitic): onhan, Antakaahan, saanhan, Kuulkaahan, Olithan, eihän, katohan, Haluammehan, Jäihän, KävinhänHan,Ko(19; 2% of non-emptyClitic): Onkohan, Uskaltaisikohan, haluaakohan, olikohan, Enköhän, Kokeilisikohan, Oiskohan, Saaraankohan, Tietääköhän, TulenookohanKa(5; 1% of non-emptyClitic): eikäKaan(107; 11% of non-emptyClitic): olekaan, ollutkaan, puhuakaan, pääsekään, huomaatkaan, ilmestynytkään, luullutkaan, menikään, nauratakaan, puhumattakaanKaan,Ko(1; 0% of non-emptyClitic): luenkokaanKin(151; 16% of non-emptyClitic): Menenkin, onkin, olikin, tulekin, löytyikin, maksaakin, olekin, olisikin, ryhtyikin, saikinKo(471; 49% of non-emptyClitic): onko, oliko, onks, tuleeko, saako, Muistatko, ootko, tuletko, Näyttääkö, TunnetkoKo,S(19; 2% of non-emptyClitic): onkos, menetkös, Kuulitkos, Käytitkös, Luvattiinkos, Meinaakos, Muistatkos, Nukkuukos, Olitkos, PainatkosPa(64; 7% of non-emptyClitic): arvatkaapa, Päästäpä, Tekipä, lukekaapa, menepä, menkääpä, tulepa, Ajatelkaapa, Ajatellaanpa, AnnetaanpaPa,S(27; 3% of non-emptyClitic): Eipäs, kuulkaapas, meeppäs, otapas, Arvaappas, Autapas, Katsopas, Kysypäs, Käydäänpäs, MuistappasS(32; 3% of non-emptyClitic): Annas, Katotaas, Kuulkaas, Odotas, Sanos, ootas, tules, Alas, Katsokaas, Katsotaas
| Paradigm olla | Han | Han,Ko | Kaan | Kin | Ko | Ko,S | Pa | Pa,S | S |
|---|---|---|---|---|---|---|---|---|---|
| Case=Gen|Number=Sing|PartForm=Past|VerbForm=Part|Voice=Act | olleenkaan | ||||||||
| Case=Gen|Number=Sing|PartForm=Pres|VerbForm=Part|Voice=Act | olevankaan | ||||||||
| Case=Ine|InfForm=2|VerbForm=Inf|Voice=Act | ollessakaan | ||||||||
| Case=Lat|InfForm=1|VerbForm=Inf|Voice=Act | ollakaan | Ollako | Ollapa | ||||||
| Case=Nom|Number=Sing|PartForm=Past|Style=Coll|VerbForm=Part|Voice=Act | ollukki | ollukko | |||||||
| Case=Nom|Number=Sing|PartForm=Past|VerbForm=Part|Voice=Act | ollutkaan | ||||||||
| Case=Nom|Number=Plur|PartForm=Past|VerbForm=Part|Voice=Act | olleetkin | ||||||||
| Connegative=Yes|Mood=Ind|Number=Sing|Tense=Past|VerbForm=Fin|Voice=Act | ollutkaan | ||||||||
| Connegative=Yes|Mood=Ind|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | ookin | ||||||||
| Connegative=Yes|Mood=Ind|Tense=Pres|VerbForm=Fin|Voice=Act | olekaan | ||||||||
| Mood=Cnd|Number=Sing|Person=3|Style=Coll|VerbForm=Fin|Voice=Act | Oiskohan | oliskin | oisko, Olisko | ||||||
| Mood=Cnd|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | olisikin | olisiko | Olisipa | ||||||
| Mood=Imp|Number=Sing|Person=2|VerbForm=Fin|Voice=Act | olekin | ||||||||
| Mood=Ind|Number=Sing|Person=1|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | Oonksmä, ooks, oonko | ||||||||
| Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin|Voice=Act | Olenko | ||||||||
| Mood=Ind|Number=Sing|Person=2|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | ootko, Ookkonää, oleks | ||||||||
| Mood=Ind|Number=Sing|Person=2|Tense=Past|VerbForm=Fin|Voice=Act | Olithan | Olitkos | |||||||
| Mood=Ind|Number=Sing|Person=2|Tense=Pres|VerbForm=Fin|Voice=Act | oletkaan | Oletko | |||||||
| Mood=Ind|Number=Sing|Person=3|Style=Coll|Tense=Past|VerbForm=Fin|Voice=Act | olikii | Oliks | |||||||
| Mood=Ind|Number=Sing|Person=3|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Act | onki | onks, onk | |||||||
| Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin|Voice=Act | olikohan | olikaan | olikin | oliko | |||||
| Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | onhan | Onkohan | onkaan | onkin | onko | onkos | Onpa | ||
| Mood=Ind|Number=Plur|Person=1|Tense=Pres|VerbForm=Fin|Voice=Act | olemmeko | ||||||||
| Mood=Ind|Number=Plur|Person=2|Style=Coll|Tense=Past|VerbForm=Fin|Voice=Act | Olitteks | ||||||||
| Mood=Ind|Number=Plur|Person=2|Tense=Pres|VerbForm=Fin|Voice=Act | Oletteko | ||||||||
| Mood=Ind|Number=Plur|Person=3|Tense=Past|VerbForm=Fin|Voice=Act | olivatkaan | ||||||||
| Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | ovatkin | ovatko | |||||||
| Mood=Ind|Style=Coll|Tense=Pres|VerbForm=Fin|Voice=Pass | Ollaas | ||||||||
| Mood=Ind|Tense=Pres|VerbForm=Fin|Voice=Pass | Ollaanpas | ||||||||
| Mood=Pot|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | Liekö |
AUX
708 AUX tokens (7% of all AUX tokens) have a non-empty value of Clitic.
The most frequent other feature values with which AUX and Clitic co-occurred: VerbForm=Fin (703; 99%), Voice=Act (697; 98%), Mood=Ind (633; 89%), Number=Sing (624; 88%), Person=3 (520; 73%), Tense=EMPTY (404; 57%), Polarity=EMPTY (370; 52%).
AUX tokens may have the following values of Clitic:
Han(59; 8% of non-emptyClitic): eihän, onhan, enhän, Älähän, ethän, olihan, ovathan, voidaanhan, Olenhan, OlisihanHan,Ko(28; 4% of non-emptyClitic): eiköhän, Onkohan, Olisikohan, Eivätköhän, Enköhän, Mahdatkohan, Mahtaakohan, Oletkohan, Voisikohan, onkohaHan,Pa(1; 0% of non-emptyClitic): EipähänKa(178; 25% of non-emptyClitic): eikä, enkä, eivätkä, emmekä, äläkä, etkä, ettekäKaan(24; 3% of non-emptyClitic): olekaan, ollutkaan, olikaan, pitikään, lieneekään, mahtaakaan, oletkaan, olisikaan, olleetkaan, ollukkaanKin(60; 8% of non-emptyClitic): onkin, olikin, ovatkin, olisikin, Taidatkin, olekin, olenkin, olinkin, Oltiinkin, TaidankinKo(294; 42% of non-emptyClitic): onko, eikö, oliko, onks, oletko, olisiko, pitäisikö, voiko, olenko, pitääköKo,S(15; 2% of non-emptyClitic): Eikös, Oletkos, enkös, Olikos, Onkos, Tartteekos, pitääkösPa(38; 5% of non-emptyClitic): eipä, onpa, oletpa, olipa, ollapa, Enpä, Olinpa, Olisitpa, Pitipä, TaidanpaPa,S(9; 1% of non-emptyClitic): ollaanpas, Olipas, eipäs, Enpäs, OnpasS(2; 0% of non-emptyClitic): Älkääs, Äläs
| Paradigm ei | Han | Han,Ko | Han,Pa | Ka | Ko | Ko,S | Pa | Pa,S | S |
|---|---|---|---|---|---|---|---|---|---|
| Mood=Imp|Number=Sing|Person=2 | Älähän | äläkä | Äläs | ||||||
| Mood=Imp|Number=Plur|Person=2 | Älkääs | ||||||||
| Mood=Ind|Number=Sing|Person=1|Style=Coll | enhä | ||||||||
| Mood=Ind|Number=Sing|Person=1 | enhän | Enköhän | enkä | enkö | enkös | Enpä | Enpäs | ||
| Mood=Ind|Number=Sing|Person=2|Style=Coll | Eksää, Et, eks | ||||||||
| Mood=Ind|Number=Sing|Person=2 | ethän | etkä | etkö | ||||||
| Mood=Ind|Number=Sing|Person=3|Style=Coll | eihä | eiks, eiks' | eipa | ||||||
| Mood=Ind|Number=Sing|Person=3 | eihän | eiköhän | Eipähän | eikä | eikö | Eikös | eipä | eipäs | |
| Mood=Ind|Number=Plur|Person=1 | emmekä | ||||||||
| Mood=Ind|Number=Plur|Person=2 | ettekä | Ettekö | |||||||
| Mood=Ind|Number=Plur|Person=3 | Eivätköhän | eivätkä | eivätkö | eivätpä |
NOUN
354 NOUN tokens (1% of all NOUN tokens) have a non-empty value of Clitic.
The most frequent other feature values with which NOUN and Clitic co-occurred: Number=Sing (263; 74%).
NOUN tokens may have the following values of Clitic:
Han(38; 11% of non-emptyClitic): teoshan, Hermothan, Karttaagohan, Lapsiinhan, Levyähän, Mieshän, Ohrahan, Oopperahan, Vaarojahan, autothanHan,Kin(2; 1% of non-emptyClitic): lapsijakkiihan, rahatkinhanKaan(72; 20% of non-emptyClitic): kertaakaan, hetkeäkään, sanaakaan, arkisuudellekaan, elettäkään, kuukkautteenkaa, merkkiäkään, metriäkään, rahaakaan, tippaakaanKaan,Ko(1; 0% of non-emptyClitic): kesälläkäänköKin(203; 57% of non-emptyClitic): jatkossakin, loputkin, ajatuskin, housutkin, lapsetkin, lapsikin, olosuhteetkin, tottakin, yölläkin, äidillekinKin,Ko(2; 1% of non-emptyClitic): kesälläkinkö, ongellakinkoKo(31; 9% of non-emptyClitic): Veturillako, Vittuako, piruako, tavallako, Hittoako, Kampanjointiako, Kateusko, Kotivideotko, Mediako, SairaaloitakoKo,S(4; 1% of non-emptyClitic): Kerrankos, Ukkoskos, väliäkösPa(1; 0% of non-emptyClitic): Insinöörinpä
| Paradigm lapsi | Han | Han,Kin | Kaan | Kin |
|---|---|---|---|---|
| Case=Ade|Number=Plur | lapsillakin | |||
| Case=Ela|Number=Sing | Lapsestakin | |||
| Case=Ill|Number=Plur | Lapsiinhan | |||
| Case=Nom|Number=Sing | lapsikaan | lapsikin | ||
| Case=Nom|Number=Plur | lapsetkin | |||
| Case=Par|Number=Plur|Style=Coll | lapsijakkiihan |
Clitic seems to be lexical feature of NOUN. 92% lemmas (249) occur only with one value of Clitic.
PRON
317 PRON tokens (3% of all PRON tokens) have a non-empty value of Clitic.
The most frequent other feature values with which PRON and Clitic co-occurred: Number=Sing (242; 76%), Person=EMPTY (206; 65%), Case=Nom (178; 56%).
PRON tokens may have the following values of Clitic:
Han(62; 20% of non-emptyClitic): sehän, Mitähän, Minähän, sinähän, Kaikkihan, Kukahan, Mehän, Miltähän, Tuostahan, minunhanHan,Kin(1; 0% of non-emptyClitic): nekinhänHan,Ko(2; 1% of non-emptyClitic): Kukakohan, MitäköhänKaan(29; 9% of non-emptyClitic): muukaan, sekään, siitäkään, minäkään, muutkaan, sitäkään, Yhtäkään, itsekään, itsestänikään, minäkäKaan,Ko(1; 0% of non-emptyClitic): sitäkäänköKin(143; 45% of non-emptyClitic): itsekin, minäkin, sekin, sinäkin, muutakin, meilläkin, hänkin, minullekin, minunkin, hekinKo(25; 8% of non-emptyClitic): tekö, sekö, Minäkö, Sitäkö, Tuoko, Tämäkö, sinäkö, Heistäkö, Kaikkiko, KukakoKo,S(3; 1% of non-emptyClitic): Moneltakos, Sinäkös, minäkösPa(22; 7% of non-emptyClitic): kukapa, siinäpä, Mitäpä, minäpä, sinäpä, Sepä, Siitäpä, TästäpäPa,S(4; 1% of non-emptyClitic): Hänpäs, Minäpäs, Sepäs, miäpäsS(25; 8% of non-emptyClitic): mitäs, mikäs, kukas
| Paradigm se | Han | Kaan | Kaan,Ko | Kin | Ko | Pa | Pa,S |
|---|---|---|---|---|---|---|---|
| Case=Ade | silläkin | ||||||
| Case=Ela | siitähän | siitäkään | Siitäkin | Siitäpä | |||
| Case=Gen | senhän | senkään | |||||
| Case=Ill | siihenkin | Siihenkö | |||||
| Case=Ine | siinäkin | siinäpä | |||||
| Case=Ine|Style=Coll | siinähä | ||||||
| Case=Nom | sehän | sekään | sekin | sekö | Sepä | Sepäs | |
| Case=Nom|Style=Coll | seki | ||||||
| Case=Par | Sitähän | sitäkään | sitäkäänkö | sitäkin | Sitäkö |
ADV
292 ADV tokens (2% of all ADV tokens) have a non-empty value of Clitic.
The most frequent other feature values with which ADV and Clitic co-occurred: PronType=EMPTY (207; 71%).
ADV tokens may have the following values of Clitic:
Han(38; 13% of non-emptyClitic): ainahan, kyllähän, Johan, niinhän, nythän, kuinkahan, Nykyäänhän, Täällähän, Vastahan, huomennahanHan,Ka(3; 1% of non-emptyClitic): Mihinkähä, Miksikähän, mihinkähänHan,Ko(3; 1% of non-emptyClitic): Miksiköhän, Näinköhän, noinkohanKa(4; 1% of non-emptyClitic): mitenkä, minnekkäKa,S(3; 1% of non-emptyClitic): mitenkäs, MillonkasKaan(44; 15% of non-emptyClitic): myöskään, vieläkään, olemassakaan, varmaankaan, ennenkään, kylläkään, muutenkaan, paljonkaan, puoliakaan, puoliksikaanKin(139; 48% of non-emptyClitic): hyvinkin, vieläkin, varmaankin, ennenkin, muutenkin, nytkin, pikemminkin, edelleenkin, myöskin, paljonkinKo(28; 10% of non-emptyClitic): paljonko, vieläkö, Joko, kauanko, Ihanko, Näinkö, Eilenkö, Taasko, Ihanks, MiksiköKo,S(6; 2% of non-emptyClitic): Jokos, Vähänkös, Äkkiäkös, harvoinkosPa(12; 4% of non-emptyClitic): Tuskinpa, ehkäpä, Kylläpä, korkeallepa, melkeinpä, miksipä, Siinäpä, tässäpäPa,S(2; 1% of non-emptyClitic): kylläpäs, JopasS(10; 3% of non-emptyClitic): kuinkas, Koskas, missäs, mitäs
| Paradigm kyllä | Han | Kaan | Kin | Pa | Pa,S |
|---|---|---|---|---|---|
| _ | kyllähän | kylläkään | kylläkin | Kylläpä | kylläpäs |
| Style=Coll | kylhän |
ADJ
110 ADJ tokens (1% of all ADJ tokens) have a non-empty value of Clitic.
The most frequent other feature values with which ADJ and Clitic co-occurred: Number=Sing (70; 64%).
ADJ tokens may have the following values of Clitic:
Han(3; 3% of non-emptyClitic): Rehelliseltähän, Ujohan, olennaistahanKaan(14; 13% of non-emptyClitic): ainoatakaan, ainuttakaan, Ensimmäistäkään, edellisestäkään, huonokaan, kummoistakaan, surkeinkaan, syksyisillekään, tämänkertainenkaan, uudetkaanKin(84; 76% of non-emptyClitic): eriäviäkin, hienompikin, lyhytkin, pienetkin, isokin, isompikin, kansallisiakin, nykyistenkin, yrityskohtaisiakin, HyvälläkinKo(7; 6% of non-emptyClitic): Kuusivuotiaanako, Luonnonsuojelullisistako, Pitkäkö, Suuriko, Vanhako, metalliseltako, tällaistakoPa(1; 1% of non-emptyClitic): OmapaS(1; 1% of non-emptyClitic): minkäslaista
| Paradigm oma | Kin | Pa |
|---|---|---|
| Case=Ela|Number=Plur|Style=Coll | omistaki | |
| Case=Nom|Number=Sing | Omapa | |
| Case=Nom|Number=Plur | omatkin |
Clitic seems to be lexical feature of ADJ. 95% lemmas (73) occur only with one value of Clitic.
DET
73 DET tokens (2% of all DET tokens) have a non-empty value of Clitic.
The most frequent other feature values with which DET and Clitic co-occurred: Number=Sing (43; 59%).
DET tokens may have the following values of Clitic:
Han(4; 5% of non-emptyClitic): Jokainenhan, Minkähän, Mitähän, TämähänKa,S(1; 1% of non-emptyClitic): mihinkäsKaan(7; 10% of non-emptyClitic): Tämäkään, Tänäkään, muidenkaan, sittään, tämänkään, tätäkä, yhtäkäänKin(45; 62% of non-emptyClitic): muitakin, muutakin, muutkin, tänäkin, niidenkin, senkin, tämänkin, tässäkin, Muissakin, NekinKo(8; 11% of non-emptyClitic): montako, Tämäkö, kumpaanko, tuonkoKo,S(1; 1% of non-emptyClitic): monesS(7; 10% of non-emptyClitic): mitäs, Mikäs, kukas, milläs
| Paradigm tämä | Han | Kaan | Kin | Ko |
|---|---|---|---|---|
| Case=Ess | Tänäkään | tänäkin | ||
| Case=Gen | tämänkään | tämänkin | ||
| Case=Ine | tässäkin | |||
| Case=Nom | Tämähän | Tämäkään | Tämäkö | |
| Case=Par|Style=Coll | tätäkä |
PROPN
57 PROPN tokens (1% of all PROPN tokens) have a non-empty value of Clitic.
The most frequent other feature values with which PROPN and Clitic co-occurred: Number=Sing (56; 98%).
PROPN tokens may have the following values of Clitic:
Han(7; 12% of non-emptyClitic): Kallellahan, Kreikassahan, Mattihan, Mikkohan, Moonahan, Pekkahan, VenäjänhänKaan(5; 9% of non-emptyClitic): Kaisukaan, Leenastakaan, Paavokaa, Petsamonkaan, TelelläkäänKin(39; 68% of non-emptyClitic): Englannissakin, Kirsikin, Liisakin, Soiliki, Suomenkin, Suomessakin, Suomikin, Brysselissäkin, Emuunkin, EnglanninkinKo(6; 11% of non-emptyClitic): Ansallako, Hakalaltako, Museokadullako, Porvoostako, Ristoko, Suomessako
| Paradigm suomi | Kin | Ko |
|---|---|---|
| Case=Ela | Suomestakin | |
| Case=Gen | Suomenkin | |
| Case=Ine | Suomessakin | Suomessako |
| Case=Nom | Suomikin |
Clitic seems to be lexical feature of PROPN. 98% lemmas (44) occur only with one value of Clitic.
PART
45 PART tokens (2% of all PART tokens) have a non-empty value of Clitic.
The most frequent other feature values with which PART and Clitic co-occurred: Style=EMPTY (43; 96%).
PART tokens may have the following values of Clitic:
Kaan(8; 18% of non-emptyClitic): kovinkaan, todellakaan, tietystikään, tosiaankaanKin(9; 20% of non-emptyClitic): vihdoinkin, todellakinKo(3; 7% of non-emptyClitic): Ettäkö, Liekö, yhäköPa(12; 27% of non-emptyClitic): vaikkapa, koskapaS(13; 29% of non-emptyClitic): entäs, kuules, Ettäs, Katos, katsos
| Paradigm todella | Kaan | Kin |
|---|---|---|
| todellakaan | todellakin |
NUM
21 NUM tokens (1% of all NUM tokens) have a non-empty value of Clitic.
The most frequent other feature values with which NUM and Clitic co-occurred: NumType=Card (21; 100%), Number=Sing (20; 95%), Case=Nom (15; 71%).
NUM tokens may have the following values of Clitic:
Kaan(10; 48% of non-emptyClitic): yksikään, viittäkään, yhtenäkäänKin(11; 52% of non-emptyClitic): yksikin, kaksikin, yhdenkin, kolmenkin, puolikin, tuhansienkin, viisikin
| Paradigm yksi | Kaan | Kin |
|---|---|---|
| Case=Ess | yhtenäkään | |
| Case=Gen | yhdenkin | |
| Case=Nom | yksikään | yksikin |
ADP
8 ADP tokens (0% of all ADP tokens) have a non-empty value of Clitic.
ADP tokens may have the following values of Clitic:
Han(2; 25% of non-emptyClitic): mukaanhan, puolellahanKaan(1; 13% of non-emptyClitic): lähelläkäänKin(5; 63% of non-emptyClitic): sisälläkin, alussakin, jälkeenkin, keskelläkin