home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Finnish-FTB: POS Tags: VERB

There are 2561 VERB lemmas (12%), 10426 VERB types (23%) and 33813 VERB tokens (21%). Out of 17 observed tags, the rank of VERB is: 3 in number of lemmas, 2 in number of types and 2 in number of tokens.

The 10 most frequent VERB lemmas: olla, ei, tulla, saada, voida, tehdä, pitää, sanoa, mennä, ottaa

The 10 most frequent VERB types: on, ei, oli, en, ole, voi, ovat, olla, olisi, ollut

The 10 most frequent ambiguous lemmas: olla (VERB 5791, AUX 3561), ei (VERB 3116, AUX 22), tulla (VERB 940, AUX 146), saada (VERB 730, AUX 4), tehdä (VERB 574, AUX 30), päästä (VERB 160, ADP 10), alkaa (VERB 147, AUX 1), uskoa (VERB 112, NOUN 1), odottaa (VERB 109, AUX 2), istua (VERB 95, NOUN 1)

The 10 most frequent ambiguous types: on (VERB 2131, AUX 1538), ei (VERB 1685, AUX 16), oli (VERB 824, AUX 462), en (VERB 249, AUX 1), ole (VERB 409, AUX 196), voi (VERB 308, INTJ 16), ovat (AUX 307, VERB 266), olla (VERB 253, AUX 136), olisi (VERB 233, AUX 76), ollut (VERB 215, AUX 103)

Morphology

The form / lemma ratio of VERB is 4.071066 (the average of all parts of speech is 2.048675).

The 1st highest number of forms (178) was observed with the lemma “olla”: Liekö, Oiskohan, Olenhan, Oletkohan, Oletkos, Oletpa, Oliks, Olimma, Olisihan, Olisikohan, Olisipa, Olisitteko, Olithan, Olitko, Olitkos, Olitteks, Olkaa, Ollaanpas, Ollaas, Ollako, Ollapa, Oltiinhan, Oltiinkin, Onkohan, Ookkonää, Ooksää, Oom, Oommä, Oonksmä, Oottekste, Ous, lie, liene, lienee, lieneekään, lieneekö, lienen, lienevät, o, ois, oisi, oisin, oisko, oj, ol, ole, olekaan, olekin, oleks, olemaan, olemalla, olemme, olemmeko, olen, olenk, olenko, olet, oletkaan, oletko, olette, oletteko, oleva, olevaa, olevaan, olevalle, olevan, olevana, olevani, olevankaan, olevansa, olevassa, olevat, olevia, olevien, oleviin, olevilla, olevilta, olevinaan, olevissa, olevista, oli, olihan, olii, olija, olikaan, olikii, olikin, oliko, olikohan, olimme, olin, olinkin, olinko, olis, olisi, olisikin, olisiko, olisimme, olisin, olisit, olisitte, olisivat, olisivatko, oliskin, olisko, olit, olitte, olivat, olivatkaan, olkoon, olkoot, olla, ollaa, ollaan, ollakaan, olleelta, olleen, olleeni, olleenkaan, olleensa, olleet, olleetkin, olleilta, olleita, ollen, ollessa, ollessaan, ollessakaan, ollu, olluj, olluk, ollukkaan, ollukki, ollukko, ollum, ollun, ollut, ollutkaan, ollutta, olluv, oltaessa, oltais, oltaisi, oltas, oltava, oltavan, oltii, oltiin, oltu, oltuk, ol´, om, on, onhan, onk, onkaan, onki, onkin, onko, onkos, onks, onpa, oo, ook, ookin, ooks, ool, oon, oonko, oot, ootko, ootsä, ootteko, oovat, os, ovat, ovatkin, ovatko.

The 2nd highest number of forms (99) was observed with the lemma “tulla”: Tuleek, Tulehan, Tulenookohan, Tuletteko, Tulevathan, Tulevatko, Tulkaapa, Tulkoon, Tullessani, Tuutteko, tul, tule, tulee, tuleekaan, tuleeko, tuleekohan, tuleeks, tulekaan, tulekin, tulemaan, tulemasta, tulematta, tulemme, tulen, tulene, tulepa, tules, tulet, tuletko, tulette, tuleva, tulevan, tulevana, tulevansa, tulevasta, tulevat, tulevia, tuli, tuliki, tulikin, tuliko, tulimme, tulin, tulipas, tulis, tulisi, tulisiks, tulisimme, tulisin, tulisit, tulisivat, tulispa, tulit, tulitte, tulivat, tulkaa, tulkaahan, tulko, tulkoot, tulla, tullaan, tullakin, tullakseen, tullee, tulleen, tulleena, tulleensa, tulleessa, tulleet, tulleetkin, tulleilla, tulleille, tullen, tullesas, tullessa, tullessaan, tullessaankin, tullu, tullut, tullutkaan, tullutkin, tulna, tultaessa, tultaisiinkin, tultava, tulthin, tultii, tultiin, tultti, tultu, tultua, tultuaan, tultuani, tulukaa, tul´, tuu, tuuhan, tuun, tuut.

The 3rd highest number of forms (93) was observed with the lemma “tehdä”: Teetpä, Tehdäänkö, Teitkö, Tekeepä, Tekemämme, Tekipä, Tekisitkö, Tekisitte, tee, teemme, teen, teenkö, teet, teette, teettekö, tehden, tehdessään, tehdyissä, tehdyistä, tehdyksi, tehdylle, tehdyn, tehdyt, tehdä, tehdäkin, tehdäkseen, tehdään, teheny, tehkää, tehkääpä, tehköön, tehneelle, tehneen, tehneensä, tehneet, tehny, tehnyt, tehnyttä, tehr, tehrä, tehtiin, tehtiinhän, tehtiinpä, tehty, tehtyihin, tehtyjen, tehtyjä, tehtyk, tehtyä, tehtäis, tehtäisiin, tehtäköön, tehtävissä, tehtävä, tehtävälle, tehtävän, tehä, teimme, tein, teit, tekee, tekeekö, tekemillä, tekemistä, tekemiä, tekemiämme, tekemiäni, tekemiään, tekemäisillään, tekemällä, tekemänsä, tekemäsi, tekemässä, tekemästä, tekemästään, tekemät, tekemättä, tekemää, tekemään, tekevä, tekevän, tekevänsä, tekevät, teki, tekikin, tekis, tekisi, tekisikin, tekisin, tekisit, tekisivät, tekivät, tekköö.

VERB occurs with 16 features: VerbForm (33813; 100% instances), Voice (33510; 99% instances), Number (25061; 74% instances), Mood (20692; 61% instances), Person (19639; 58% instances), Tense (18357; 54% instances), Case (10100; 30% instances), InfForm (5140; 15% instances), PartForm (4960; 15% instances), Polarity (3116; 9% instances), Connegative (2456; 7% instances), Clitic (1497; 4% instances), Style (1062; 3% instances), Person[psor] (499; 1% instances), Number[psor] (144; 0% instances), Degree (1; 0% instances)

VERB occurs with 60 feature-value pairs: Case=Abe, Case=Abl, Case=Ade, Case=All, Case=Com, Case=Ela, Case=Ess, Case=Gen, Case=Ill, Case=Ine, Case=Ins, Case=Lat, Case=Nom, Case=Par, Case=Tra, Clitic=Han, Clitic=Han,Ko, Clitic=Han,Pa, Clitic=Ka, Clitic=Kaan, Clitic=Kaan,Ko, Clitic=Kin, Clitic=Ko, Clitic=Ko,S, Clitic=Pa, Clitic=Pa,S, Clitic=S, Connegative=Yes, Degree=Cmp, InfForm=1, InfForm=2, InfForm=3, Mood=Cnd, Mood=Imp, Mood=Ind, Mood=Opt, Mood=Pot, Number=Plur, Number=Sing, Number[psor]=Plur, Number[psor]=Sing, PartForm=Agt, PartForm=Neg, PartForm=Past, PartForm=Pres, Person=1, Person=2, Person=3, Person[psor]=1, Person[psor]=2, Person[psor]=3, Polarity=Neg, Style=Coll, Tense=Past, Tense=Pres, VerbForm=Fin, VerbForm=Inf, VerbForm=Part, Voice=Act, Voice=Pass

VERB occurs with 486 feature combinations. The most frequent feature combination is Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act (5822 tokens). Examples: on, voi, tulee, pitää, saa, täytyy, sanoo, kuuluu, haluaa, tuntuu

Relations

VERB nodes are attached to their parents using 21 different relations: root (14082; 42% instances), aux (7577; 22% instances), acl (2818; 8% instances), conj (2799; 8% instances), advcl (2772; 8% instances), ccomp (1538; 5% instances), xcomp (1243; 4% instances), xcomp:ds (366; 1% instances), csubj (267; 1% instances), csubj:cop (211; 1% instances), dep (51; 0% instances), fixed (37; 0% instances), obj (22; 0% instances), advmod (9; 0% instances), nsubj (9; 0% instances), nmod (4; 0% instances), nmod:own (4; 0% instances), compound (1; 0% instances), mark (1; 0% instances), nmod:gsubj (1; 0% instances), vocative (1; 0% instances)

Parents of VERB nodes belong to 15 different parts of speech: VERB (14946; 44% instances), (14082; 42% instances), NOUN (2904; 9% instances), ADJ (1306; 4% instances), ADV (184; 1% instances), PRON (154; 0% instances), PROPN (153; 0% instances), NUM (25; 0% instances), DET (17; 0% instances), X (15; 0% instances), INTJ (13; 0% instances), PART (10; 0% instances), SCONJ (2; 0% instances), ADP (1; 0% instances), PUNCT (1; 0% instances)

8473 (25%) VERB nodes are leaves.

3962 (12%) VERB nodes have one child.

6886 (20%) VERB nodes have two children.

14492 (43%) VERB nodes have three or more children.

The highest child degree of a VERB node is 15.

Children of VERB nodes are attached using 30 different relations: nmod (13761; 19% instances), nsubj (12985; 18% instances), advmod (9613; 13% instances), obj (8630; 12% instances), aux (6897; 9% instances), punct (4677; 6% instances), mark (3382; 5% instances), conj (2623; 4% instances), advcl (2617; 4% instances), cc (2070; 3% instances), ccomp (1781; 2% instances), xcomp (1266; 2% instances), nmod:own (562; 1% instances), expl (447; 1% instances), compound:prt (376; 1% instances), csubj (267; 0% instances), nsubj:cop (197; 0% instances), discourse (187; 0% instances), cop (170; 0% instances), xcomp:ds (165; 0% instances), vocative (132; 0% instances), dep (73; 0% instances), acl (35; 0% instances), det (34; 0% instances), amod (26; 0% instances), fixed (17; 0% instances), case (12; 0% instances), nummod (6; 0% instances), csubj:cop (4; 0% instances), reparandum (1; 0% instances)

Children of VERB nodes belong to 17 different parts of speech: NOUN (24146; 33% instances), VERB (14946; 20% instances), PRON (8544; 12% instances), ADV (7595; 10% instances), PUNCT (4677; 6% instances), PROPN (3151; 4% instances), SCONJ (3012; 4% instances), PART (2590; 4% instances), CCONJ (2088; 3% instances), ADJ (1530; 2% instances), NUM (308; 0% instances), AUX (170; 0% instances), INTJ (170; 0% instances), DET (35; 0% instances), X (29; 0% instances), ADP (18; 0% instances), SYM (4; 0% instances)