Statistics of NUM in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Ukrainian-IU: POS Tags: `NUM`

There are 318 NUM lemmas (2%), 376 NUM types (1%) and 1765 NUM tokens (1%). Out of 17 observed tags, the rank of NUM is: 7 in number of lemmas, 7 in number of types and 13 in number of tokens.

The 10 most frequent NUM lemmas: два, 1, 2, один, 5, три, 3, 7, 4, 6

The 10 most frequent NUM types: 1, 2, 5, 3, 7, три, 4, двох, 6, 10

The 10 most frequent ambiguous lemmas: 1 (NUM 100, ADJ 13, NOUN 1), 2 (NUM 88, ADJ 7), один (DET 222, NUM 84, ADJ 8), 5 (NUM 60, ADJ 5, NOUN 1), 3 (NUM 56, ADJ 11), 7 (NUM 48, ADJ 8), 4 (NUM 46, ADJ 5, NOUN 1), 6 (NUM 38, ADJ 2), 10 (NUM 37, ADJ 5), 8 (NUM 34, ADJ 6, NOUN 1)

The 10 most frequent ambiguous types: 1 (NUM 99, ADJ 13, NOUN 1), 2 (NUM 84, ADJ 7), 5 (NUM 59, ADJ 5, NOUN 1), 3 (NUM 55, ADJ 11), 7 (NUM 48, ADJ 8), 4 (NUM 46, ADJ 5, NOUN 1), двох (NUM 38, ADJ 1), 6 (NUM 38, ADJ 2), 10 (NUM 37, ADJ 5), 8 (NUM 34, ADJ 6, NOUN 1)

1
- NUM 99: 1 .
- ADJ 13: 1 .
- NOUN 1: ( І це вперше цьогоріч я виспалася , бо спала до 1 юху )
2
- NUM 84: 2 .
- ADJ 7: ОПЗ запускається та інші головні економічні новини за 2 березня .
5
- NUM 59: 5 .
- ADJ 5: В суботу , 5 серпня Приймальна комісія НаУКМА працюватиме до 18 - 00 !
- NOUN 1: Сьогодні , в суботу , директор хотів , щоб замість того пропущеного часу учились по обіді тепер ( тут тричі на тиждень учаться ще й по обіді від 4 до 5 , одну годину , а ранішня наука іде 3½ год . , від 8½ до 12 ) , але учитель італьянської мови сказав , що нехай директор « ловить » , коли хоче , математика , а він ( італ . ) на урок не прийде , бо й сам хоче в суботу гуляти .
3
- NUM 55: 3 .
- ADJ 11: Депутат Верховної Ради УРСР 3 - 4-го скликань .
7
- NUM 48: 7 .
- ADJ 8: 7 вересня 1919 року вінчаються у Свято - Андріївській церкві .
4
- NUM 46: 4 .
- ADJ 5: 4 лютого почалася битва за Манілу .
- NOUN 1: Сьогодні , в суботу , директор хотів , щоб замість того пропущеного часу учились по обіді тепер ( тут тричі на тиждень учаться ще й по обіді від 4 до 5 , одну годину , а ранішня наука іде 3½ год . , від 8½ до 12 ) , але учитель італьянської мови сказав , що нехай директор « ловить » , коли хоче , математика , а він ( італ . ) на урок не прийде , бо й сам хоче в суботу гуляти .
двох
- NUM 38: Вона визначила собою коло двох десятиріч нашої духовости .
- ADJ 1: Плоди миють у холодній воді , відділяють домішки , витримують у двох відсотковому розчині солі , щоб позбутися личинок малинового жука , і використовують для варення , консервування з цукром , приготування сиропів , соків , желе .
6
- NUM 38: 6 .
- ADJ 2: Що більш немає чим прикритись , з переляку буде давати 6 квітня якісь прожекти .
10
- NUM 37: 10 .
- ADJ 5: Перший ролик про куріння відтоді показали 10 листопада 2014 року .
8
- NUM 34: У 2015-му продали 400 електрокарів і це становило 0 , 8 % .
- ADJ 6: 8 лютого 1965-го парламент Великої Британії заборонив рекламу сигарет на телебаченні .
- NOUN 1: Крім того , 20 - 23 лютого , у зв’язку з відлигою й сніготаненням , на річках басейнів Сяну , Дністра ( Львівська , Івано-Франківська області ) , Західного Бугу ( Львівська , Волинська області ) очікується підйом рівнів води на 0 , 5 - 1 , 5 м над рівнями , які були 8 ранку 17 лютого .

Morphology

The form / lemma ratio of NUM is 1.182390 (the average of all parts of speech is 1.738999).

The 1st highest number of forms (11) was observed with the lemma “один”: Одно, один, одна, одне, одним, одного, одному, одної, одну, одній, однієї.

The 2nd highest number of forms (5) was observed with the lemma “мільйон”: мільйон, мільйона, мільйонах, мільйони, мільйонів.

The 3rd highest number of forms (4) was observed with the lemma “два”: два, двома, двох, дві.

NUM occurs with 8 features: Case (1765; 100% instances), NumType (1765; 100% instances), Uninflect (1232; 70% instances), Gender (406; 23% instances), Number (114; 6% instances), Abbr (62; 4% instances), Orth (24; 1% instances), Animacy (14; 1% instances)

NUM occurs with 16 feature-value pairs: Abbr=Yes, Animacy=Anim, Animacy=Inan, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Gender=Fem, Gender=Masc, Gender=Neut, NumType=Card, Number=Plur, Orth=Alt, Uninflect=Yes

NUM occurs with 56 feature combinations. The most frequent feature combination is Case=Nom|NumType=Card|Uninflect=Yes (468 tokens). Examples: 3, 7, 5, 4, 6, 8, 10, 00, 15, 2017

Relations

NUM nodes are attached to their parents using 22 different relations: nummod:gov (521; 30% instances), nummod (509; 29% instances), compound (216; 12% instances), flat:title (190; 11% instances), root (97; 5% instances), flat:range (56; 3% instances), conj (43; 2% instances), nsubj (20; 1% instances), obl (20; 1% instances), flat (18; 1% instances), obj (17; 1% instances), nmod (16; 1% instances), parataxis (13; 1% instances), appos (7; 0% instances), list (7; 0% instances), discourse (4; 0% instances), orphan (4; 0% instances), advcl:pred (2; 0% instances), flat:abs (2; 0% instances), ccomp (1; 0% instances), dislocated (1; 0% instances), fixed (1; 0% instances)

Parents of NUM nodes belong to 9 different parts of speech: NOUN (1106; 63% instances), NUM (396; 22% instances), (97; 5% instances), VERB (61; 3% instances), PROPN (39; 2% instances), ADJ (34; 2% instances), X (25; 1% instances), PRON (4; 0% instances), DET (3; 0% instances)

881 (50%) NUM nodes are leaves.

717 (41%) NUM nodes have one child.

118 (7%) NUM nodes have two children.

49 (3%) NUM nodes have three or more children.

The highest child degree of a NUM node is 11.

Children of NUM nodes are attached using 28 different relations: punct (511; 45% instances), compound (202; 18% instances), case (74; 7% instances), nummod:gov (57; 5% instances), flat:range (53; 5% instances), conj (49; 4% instances), advmod (39; 3% instances), nummod (35; 3% instances), nmod (26; 2% instances), discourse (24; 2% instances), cc (16; 1% instances), flat (15; 1% instances), appos (6; 1% instances), cop (3; 0% instances), det (3; 0% instances), nsubj (3; 0% instances), obj (3; 0% instances), orphan (3; 0% instances), acl:relcl (2; 0% instances), csubj (2; 0% instances), flat:abs (2; 0% instances), parataxis (2; 0% instances), amod (1; 0% instances), det:numgov (1; 0% instances), expl (1; 0% instances), flat:title (1; 0% instances), list (1; 0% instances), mark (1; 0% instances)

Children of NUM nodes belong to 16 different parts of speech: PUNCT (511; 45% instances), NUM (396; 35% instances), ADP (74; 7% instances), ADV (38; 3% instances), NOUN (32; 3% instances), PART (25; 2% instances), CCONJ (16; 1% instances), PROPN (9; 1% instances), DET (8; 1% instances), SYM (7; 1% instances), VERB (7; 1% instances), PRON (5; 0% instances), AUX (3; 0% instances), ADJ (2; 0% instances), SCONJ (2; 0% instances), X (1; 0% instances)

Treebank Statistics: UD_Ukrainian-IU: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_Ukrainian-IU: POS Tags: `NUM`