Treebank Statistics: UD_Finnish-PUD: POS Tags: NUM
There are 203 NUM
lemmas (4%), 234 NUM
types (3%) and 387 NUM
tokens (2%).
Out of 15 observed tags, the rank of NUM
is: 6 in number of lemmas, 6 in number of types and 10 in number of tokens.
The 10 most frequent NUM
lemmas: kaksi, yksi, kolme, neljä, kymmenen, miljoona, kuusi, 10, 3, miljardi
The 10 most frequent NUM
types: kaksi, kolme, kahden, yksi, neljä, miljoonaa, 10, 3, 1492, 2010
The 10 most frequent ambiguous lemmas: yksi (NUM 18, PRON 7), miljoona (NUM 8, NOUN 3), miljardi (NUM 5, NOUN 1), pari (NOUN 1, NUM 1), puoli (NOUN 5, NUM 1)
The 10 most frequent ambiguous types: yksi (NUM 7, PRON 4), miljoonaa (NUM 6, NOUN 2), yhdessä (ADV 6, NUM 1, PRON 1), miljardeja (NOUN 1, NUM 1), miljoonan (NOUN 1, NUM 1), yhteen (ADV 3, NUM 1)
- yksi
- miljoonaa
- yhdessä
- ADV 6: Ei tiedetä , millä tavalla molemmat näytelmäkirjailijat olisivat voineet työskennellä yhdessä .
- NUM 1: Kunnioitusta osoitti myös Isner , joka pelasi tennistä parhaimmalla tasollaan , kun hän tasoitti yhdessä erässä kaikki pelit ja pakotti ratkaisupisteen .
- PRON 1: Voidakseen välttää samanlaisen ongelman Jasminen kanssa , elokuvantekijät lopulta päättivät , että prinsessa animoitiin kokonaan yhdessä studiossa .
- miljardeja
- NOUN 1: Öljy , kulta ja elintarvikkeet kuten vehnä , ovat luonnonvaroja , joihin sijoittajat ympäri maailmaa investoivat miljardeja .
- NUM 1: Uutiset yhtiön vuosia kestäneestä petoksesta pyyhkivät pois kymmeniä miljardeja VW:n arvosta sekä maksoivat pääjohtaja Martin Winterkornille hänen työpaikkansa .
- miljoonan
- NOUN 1: Japanilaiset miehittäjäjoukot tappoivat Aasiassa ja Tyynenmeren alueella siviilejä määrän , joka on 3 ja yli 10 miljoonan välillä . Suuri osa näistä oli kiinalaisia ( arvion mukaan 7,5 miljoonaa ) .
- NUM 1: Johtotaso myös sai niin kutsutun ” kannustepalkkion ” odotusten saavuttamisesta tai ylittämisestä , ja he jakoivat keskenään 1,5 miljoonan dollarin potin , eli arvion mukaan jokainen sai keskimäärin 15 000 dollaria .
- yhteen
Morphology
The form / lemma ratio of NUM
is 1.152709 (the average of all parts of speech is 1.526180).
The 1st highest number of forms (7) was observed with the lemma “kaksi”: kahden, kahdessa, kahdesta, kahta, kahteen, kaksi, kaksine.
The 2nd highest number of forms (7) was observed with the lemma “yksi”: Yhdellä, yhden, yhdessä, yhdestä, yhteen, yhtäkään, yksi.
The 3rd highest number of forms (4) was observed with the lemma “kuusi”: kuuden, kuudessa, kuusi, kuuteen.
NUM
occurs with 5 features: NumType (385; 99% instances), Case (124; 32% instances), Number (123; 32% instances), Abbr (1; 0% instances), Clitic (1; 0% instances)
NUM
occurs with 15 feature-value pairs: Abbr=Yes
, Case=Ade
, Case=Com
, Case=Ela
, Case=Ess
, Case=Gen
, Case=Ill
, Case=Ine
, Case=Nom
, Case=Par
, Clitic=Kaan
, NumType=Card
, NumType=Ord
, Number=Plur
, Number=Sing
NUM
occurs with 17 feature combinations.
The most frequent feature combination is NumType=Card
(261 tokens).
Examples: kaksi, kolme, 10, 3, kahden, yksi, 1492, 2010, 2012, 2014
Relations
NUM
nodes are attached to their parents using 15 different relations: nummod (311; 80% instances), compound (22; 6% instances), flat (15; 4% instances), conj (8; 2% instances), nmod (7; 2% instances), nsubj (5; 1% instances), obl (5; 1% instances), nsubj:cop (3; 1% instances), appos (2; 1% instances), flat:name (2; 1% instances), obj (2; 1% instances), root (2; 1% instances), advcl (1; 0% instances), compound:nn (1; 0% instances), flat:foreign (1; 0% instances)
Parents of NUM
nodes belong to 8 different parts of speech: NOUN (305; 79% instances), NUM (29; 7% instances), ADJ (19; 5% instances), SYM (14; 4% instances), VERB (14; 4% instances), PRON (2; 1% instances), PROPN (2; 1% instances), (2; 1% instances)
296 (76%) NUM
nodes are leaves.
61 (16%) NUM
nodes have one child.
20 (5%) NUM
nodes have two children.
10 (3%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 7.
Children of NUM
nodes are attached using 16 different relations: advmod (45; 32% instances), punct (27; 19% instances), compound (22; 15% instances), nmod (13; 9% instances), cc (7; 5% instances), conj (7; 5% instances), cop (4; 3% instances), nsubj:cop (4; 3% instances), det (3; 2% instances), flat:name (3; 2% instances), obl (2; 1% instances), acl:relcl (1; 1% instances), amod (1; 1% instances), appos (1; 1% instances), mark (1; 1% instances), orphan (1; 1% instances)
Children of NUM
nodes belong to 11 different parts of speech: ADV (45; 32% instances), NUM (29; 20% instances), PUNCT (27; 19% instances), NOUN (16; 11% instances), CCONJ (7; 5% instances), PRON (6; 4% instances), AUX (4; 3% instances), PROPN (4; 3% instances), ADJ (2; 1% instances), SCONJ (1; 1% instances), VERB (1; 1% instances)