Statistics of NUM in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Latvian-LVTB: POS Tags: `NUM`

There are 675 NUM lemmas (3%), 746 NUM types (1%) and 4177 NUM tokens (1%). Out of 17 observed tags, the rank of NUM is: 7 in number of lemmas, 7 in number of types and 14 in number of tokens.

The 10 most frequent NUM lemmas: viens, divi, trīs, otrs, pieci, četri, seši, desmit, 20, septiņi

The 10 most frequent NUM types: viens, trīs, vienu, viena, divas, vienā, divi, otru, desmit, 20

The 10 most frequent ambiguous lemmas: otrs (NUM 195, ADJ 2), i (PART 6, CCONJ 2, NUM 1, PROPN 1), V (PROPN 7, NUM 2), XVIII (NUM 1, X 1), otrais (ADJ 177, NUM 1)

The 10 most frequent ambiguous types: vienu (NUM 168, X 1), otrā (ADJ 31, NUM 19), 8 (NUM 18, X 1), I (NUM 12, CCONJ 2, X 1), 2008 (NUM 7, ADJ 1), V (PROPN 7, NUM 2), XVIII (NUM 1, X 1), l (NOUN 1, NUM 1), otrās (ADJ 23, NUM 1)

vienu
- NUM 168: Es tev vienu daļu iedevu .
- X 1: Tāpat komanda neaizvadīs ne vienu treniņu Latvijā - 21. martā dosies uz Slovākiju , kur gatavosies Senecas pilsētā , bet dienu pirms 25. martā gaidāmās spēles pārbrauks uz Čehiju .
otrā
- ADJ 31: Man atņēma drosmi mana pirmā un otrā zīmējuma neveiksme .
- NUM 19: Virsmāsa , viņu pazinusi , pāriet otrā ielas pusē .
8
- NUM 18: Sajūtot stiepšanu , notur 5 - 8 sekundes .
- X 1: Ja salīdzina akcīzes nodokļa likmju starpību starp dīzeļdegvielu un biodīzeļdegvielu , tad šī starpība ir nodokļa pamatlikmes apmērā , līdz ar to nodokļa likmju starpība par vienu litru produkta 2007. gadā ir ,17 8 santīmi , 2008. gadā – 19,2 santīmi , 2011. gadā 21,1 santīmi un 2013. gadā – 23,1 santīms .
I
- NUM 12: 2. Direktīvas I iedaļu aizstāj ar šādu :
- CCONJ 2: A viņa pati izturēja , piedzīvoja savu nāvi I svētumu piedzīvoja , I visu izcieta .
- X 1: Piedzīvojumu tūrisma filmu kategorijā balva tika taizemiešu videofilmai « Es nīstu Taizemi » ( « I Hate Thailand » ) , eko tūrisma filmu kategorijā vispārliecinošākā bija arī « Grand Prix » nopelnījusī somu « Baltās nakts maģija » , bet komerciālā tūrisma kategorijā uzvarēja britu iesūtītā videofilma « Lielbritānijas skaņas » ( « Sounds of Great Britain » ) , kur Apvienotā Karaliste reklamēta kā pievilcīgs tūrisma galamērķis cilvēkiem ar netradicionālu seksuālo orientāciju .
2008
- NUM 7: Fragments no Ingas Žoludes romāna “ Materia botanica “ , kas iznāks oktobrī apgādā “ Dienas Grāmata “ , un ir romāna “ Silta zeme “ ( “ Dienas Grāmata “ , 2008 ) turpinājums .
- ADJ 1: 2008 gada I ceturkšņa dati liecina , ka dzimstības un mirstības tendences varētu saglabāties arī šogad .
V
- PROPN 7: Ar lielo V , protams .
- NUM 2: Šodien aprit gads , kopš 12. Saeima sāka savu darbu , savukārt Ministru prezidentes Laimdotas Straujumas ( V ) vadītā valdība parlamentā tika apstiprināta 2014. gada 5. novembrī .
XVIII
- NUM 1: Telpā nebija scenogrāfijas uzbūves vai rekvizītu , izņemot zālē iebūvētās kolonas , ap kurām riņķoja V. Varslavānes efektīgajos XVIII gs. modi imitējošajos tērpos ģērbtās , balti pūderētās aktrises .
- X 1: LNB direktors vēstniekam bija sarūpējis pārsteigumu : rādot 1809. gadā izdoto Luidži Lanzi darbu “ Storia pittorica della Italia dal risorgimento delle Belle Arti fin presso al fine del XVIII secolo “ un stāstot , kā šis izdevums nokļuvis Nacionālajā bibliotēkā , noslēgumā Andris Vilks atšķīra grāmatas pēdējās lappuses , kuras rotāja unikāls fakts - Stendāla oriģinālajā rokrakstā lasāmi viņa pieraksti .
l
- NOUN 1: Nenoskaidrota persona Limbažos no veikala Supernetto nozagusi 0,7 l tilpuma degvīna pudeli Vodočka 5,99 eiro vērtībā .
- NUM 1: Zīmējums Nr. l .
otrās
- ADJ 23: Bija reiz laiks , kad Mēness otrās puses izskats bija liela mīkla .
- NUM 1: Vienās attiecībās pagaršoju ābolu , otrās banānu , no trešajām tagad gaidu apelsīnu …

Morphology

The form / lemma ratio of NUM is 1.105185 (the average of all parts of speech is 2.342815).

The 1st highest number of forms (12) was observed with the lemma “viens”: Vienās, viena, vienai, vienam, vienas, vieni, vieniem, vienos, viens, vienu, vienā, vienām.

The 2nd highest number of forms (10) was observed with the lemma “otrs”: otra, otrai, otram, otras, otriem, otrs, otru, otrā, otrām, otrās.

The 3rd highest number of forms (8) was observed with the lemma “divi”: divas, divi, diviem, divos, divu, divus, divām, divās.

NUM occurs with 5 features: NumType (4177; 100% instances), Number (2143; 51% instances), Case (1902; 46% instances), Gender (1900; 45% instances), Typo (5; 0% instances)

NUM occurs with 12 feature-value pairs: Case=Acc, Case=Dat, Case=Gen, Case=Loc, Case=Nom, Gender=Fem, Gender=Masc, NumType=Card, NumType=Frac, Number=Plur, Number=Sing, Typo=Yes

NUM occurs with 32 feature combinations. The most frequent feature combination is NumType=Card (2031 tokens). Examples: viens, trīs, vienu, viena, 20, divas, 3, 10, 30, 2

Relations

NUM nodes are attached to their parents using 24 different relations: nummod (3018; 72% instances), conj (226; 5% instances), parataxis (128; 3% instances), nsubj (109; 3% instances), root (100; 2% instances), nmod (87; 2% instances), dep (85; 2% instances), flat:name (77; 2% instances), compound (67; 2% instances), iobj (52; 1% instances), obj (47; 1% instances), obl (46; 1% instances), xcomp (38; 1% instances), flat (31; 1% instances), discourse (12; 0% instances), acl (9; 0% instances), ccomp (9; 0% instances), advcl (8; 0% instances), nsubj:pass (8; 0% instances), orphan (7; 0% instances), appos (6; 0% instances), amod (3; 0% instances), csubj (2; 0% instances), flat:foreign (2; 0% instances)

Parents of NUM nodes belong to 13 different parts of speech: NOUN (2790; 67% instances), VERB (531; 13% instances), NUM (314; 8% instances), SYM (227; 5% instances), PROPN (101; 2% instances), (100; 2% instances), X (50; 1% instances), ADJ (41; 1% instances), ADV (13; 0% instances), DET (4; 0% instances), PRON (4; 0% instances), AUX (1; 0% instances), CCONJ (1; 0% instances)

2707 (65%) NUM nodes are leaves.

943 (23%) NUM nodes have one child.

294 (7%) NUM nodes have two children.

233 (6%) NUM nodes have three or more children.

The highest child degree of a NUM node is 11.

Children of NUM nodes are attached using 28 different relations: punct (659; 26% instances), nmod (295; 12% instances), advmod (294; 11% instances), conj (244; 10% instances), case (198; 8% instances), cop (106; 4% instances), cc (105; 4% instances), discourse (97; 4% instances), nsubj (88; 3% instances), advcl (70; 3% instances), compound (67; 3% instances), flat:name (48; 2% instances), dep (42; 2% instances), flat (42; 2% instances), det (37; 1% instances), amod (31; 1% instances), acl (26; 1% instances), obl (23; 1% instances), orphan (21; 1% instances), mark (19; 1% instances), parataxis (16; 1% instances), csubj (10; 0% instances), advmod:neg (7; 0% instances), advmod:emph (5; 0% instances), appos (5; 0% instances), nummod (4; 0% instances), iobj (3; 0% instances), goeswith (1; 0% instances)

Children of NUM nodes belong to 16 different parts of speech: PUNCT (659; 26% instances), NOUN (398; 16% instances), ADV (378; 15% instances), NUM (314; 12% instances), ADP (201; 8% instances), AUX (106; 4% instances), DET (97; 4% instances), PART (96; 4% instances), CCONJ (92; 4% instances), VERB (63; 2% instances), PROPN (48; 2% instances), ADJ (42; 2% instances), SCONJ (28; 1% instances), PRON (22; 1% instances), SYM (14; 1% instances), X (5; 0% instances)

Treebank Statistics: UD_Latvian-LVTB: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_Latvian-LVTB: POS Tags: `NUM`