Statistics of NUM in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Finnish-PUD: POS Tags: `NUM`

There are 203 NUM lemmas (4%), 234 NUM types (3%) and 387 NUM tokens (2%). Out of 15 observed tags, the rank of NUM is: 6 in number of lemmas, 6 in number of types and 10 in number of tokens.

The 10 most frequent NUM lemmas: kaksi, yksi, kolme, neljä, kymmenen, miljoona, kuusi, 10, 3, miljardi

The 10 most frequent NUM types: kaksi, kolme, kahden, yksi, neljä, miljoonaa, 10, 3, 1492, 2010

The 10 most frequent ambiguous lemmas: yksi (NUM 18, PRON 7), miljoona (NUM 8, NOUN 3), miljardi (NUM 5, NOUN 1), pari (NOUN 1, NUM 1), puoli (NOUN 5, NUM 1)

The 10 most frequent ambiguous types: yksi (NUM 7, PRON 4), miljoonaa (NUM 6, NOUN 2), yhdessä (ADV 6, NUM 1, PRON 1), miljardeja (NOUN 1, NUM 1), miljoonan (NOUN 1, NUM 1), yhteen (ADV 3, NUM 1)

yksi
- NUM 7: Heillä on yksi yritys pelastua , Englannin voittaminen .
- PRON 4: Ensin yksi jesidinaisista alkoi itkeä , sen jälkeen yksi hänen ystävistään .
miljoonaa
- NUM 6: Yli 5,7 miljoonaa floridalaista on jo käynyt äänestämässä kahden viikon henkilökohtaisen ennakkoäänestyksen jälkeen .
- NOUN 2: Le Figaron mukaan tämä hallituksen suunnitelma voisi vapauttaa 42 miljoonaa euroa , joista 15,5 miljoonaa käytettäisiin turvallisuuteen .
yhdessä
- ADV 6: Ei tiedetä , millä tavalla molemmat näytelmäkirjailijat olisivat voineet työskennellä yhdessä .
- NUM 1: Kunnioitusta osoitti myös Isner , joka pelasi tennistä parhaimmalla tasollaan , kun hän tasoitti yhdessä erässä kaikki pelit ja pakotti ratkaisupisteen .
- PRON 1: Voidakseen välttää samanlaisen ongelman Jasminen kanssa , elokuvantekijät lopulta päättivät , että prinsessa animoitiin kokonaan yhdessä studiossa .
miljardeja
- NOUN 1: Öljy , kulta ja elintarvikkeet kuten vehnä , ovat luonnonvaroja , joihin sijoittajat ympäri maailmaa investoivat miljardeja .
- NUM 1: Uutiset yhtiön vuosia kestäneestä petoksesta pyyhkivät pois kymmeniä miljardeja VW:n arvosta sekä maksoivat pääjohtaja Martin Winterkornille hänen työpaikkansa .
miljoonan
- NOUN 1: Japanilaiset miehittäjäjoukot tappoivat Aasiassa ja Tyynenmeren alueella siviilejä määrän , joka on 3 ja yli 10 miljoonan välillä . Suuri osa näistä oli kiinalaisia ( arvion mukaan 7,5 miljoonaa ) .
- NUM 1: Johtotaso myös sai niin kutsutun ” kannustepalkkion ” odotusten saavuttamisesta tai ylittämisestä , ja he jakoivat keskenään 1,5 miljoonan dollarin potin , eli arvion mukaan jokainen sai keskimäärin 15 000 dollaria .
yhteen
- ADV 3: Jäännös muodosti kehän Maan päiväntasaajan ympärille , ja lopulta painovoima veti sen yhteen muodostaen kuun .
- NUM 1: Ilmakehä on kaoottinen järjestelmä , joten pienillä muutoksilla yhteen järjestelmän osaan voi olla suuria vaikutuksia järjestelmään kokonaisuutena .

Morphology

The form / lemma ratio of NUM is 1.152709 (the average of all parts of speech is 1.526180).

The 1st highest number of forms (7) was observed with the lemma “kaksi”: kahden, kahdessa, kahdesta, kahta, kahteen, kaksi, kaksine.

The 2nd highest number of forms (7) was observed with the lemma “yksi”: Yhdellä, yhden, yhdessä, yhdestä, yhteen, yhtäkään, yksi.

The 3rd highest number of forms (4) was observed with the lemma “kuusi”: kuuden, kuudessa, kuusi, kuuteen.

NUM occurs with 5 features: NumType (385; 99% instances), Case (124; 32% instances), Number (123; 32% instances), Abbr (1; 0% instances), Clitic (1; 0% instances)

NUM occurs with 15 feature-value pairs: Abbr=Yes, Case=Ade, Case=Com, Case=Ela, Case=Ess, Case=Gen, Case=Ill, Case=Ine, Case=Nom, Case=Par, Clitic=Kaan, NumType=Card, NumType=Ord, Number=Plur, Number=Sing

NUM occurs with 17 feature combinations. The most frequent feature combination is NumType=Card (261 tokens). Examples: kaksi, kolme, 10, 3, kahden, yksi, 1492, 2010, 2012, 2014

Relations

NUM nodes are attached to their parents using 15 different relations: nummod (311; 80% instances), compound (22; 6% instances), flat (15; 4% instances), conj (8; 2% instances), nmod (7; 2% instances), nsubj (5; 1% instances), obl (5; 1% instances), nsubj:cop (3; 1% instances), appos (2; 1% instances), flat:name (2; 1% instances), obj (2; 1% instances), root (2; 1% instances), advcl (1; 0% instances), compound:nn (1; 0% instances), flat:foreign (1; 0% instances)

Parents of NUM nodes belong to 8 different parts of speech: NOUN (305; 79% instances), NUM (29; 7% instances), ADJ (19; 5% instances), SYM (14; 4% instances), VERB (14; 4% instances), PRON (2; 1% instances), PROPN (2; 1% instances), (2; 1% instances)

296 (76%) NUM nodes are leaves.

61 (16%) NUM nodes have one child.

20 (5%) NUM nodes have two children.

10 (3%) NUM nodes have three or more children.

The highest child degree of a NUM node is 7.

Children of NUM nodes are attached using 16 different relations: advmod (45; 32% instances), punct (27; 19% instances), compound (22; 15% instances), nmod (13; 9% instances), cc (7; 5% instances), conj (7; 5% instances), cop (4; 3% instances), nsubj:cop (4; 3% instances), det (3; 2% instances), flat:name (3; 2% instances), obl (2; 1% instances), acl:relcl (1; 1% instances), amod (1; 1% instances), appos (1; 1% instances), mark (1; 1% instances), orphan (1; 1% instances)

Children of NUM nodes belong to 11 different parts of speech: ADV (45; 32% instances), NUM (29; 20% instances), PUNCT (27; 19% instances), NOUN (16; 11% instances), CCONJ (7; 5% instances), PRON (6; 4% instances), AUX (4; 3% instances), PROPN (4; 3% instances), ADJ (2; 1% instances), SCONJ (1; 1% instances), VERB (1; 1% instances)

Treebank Statistics: UD_Finnish-PUD: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_Finnish-PUD: POS Tags: `NUM`