Statistics of NUM in UD

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Russian: POS Tags: `NUM`

There are 683 NUM lemmas (4%), 728 NUM types (2%) and 2028 NUM tokens (2%). Out of 16 observed tags, the rank of NUM is: 6 in number of lemmas, 6 in number of types and 9 in number of tokens.

The 10 most frequent NUM lemmas: ОДИН, ДВА, НЕСКОЛЬКО, ТРИ, 2, 1, 10, ЧЕТЫРЕ, 4, 3

The 10 most frequent NUM types: 2, два, один, несколько, 1, двух, 10, 4, три, 3

The 10 most frequent ambiguous lemmas: ОДИН (NUM 185, ADV 1), НЕСКОЛЬКО (NUM 68, ADV 5), ТРИ (NUM 58, ADV 1), 2 (NUM 55, ADV 23, ADJ 9), 1 (NUM 43, ADJ 33, ADV 19), 10 (NUM 40, ADJ 14, ADV 8), 4 (NUM 35, ADJ 14, ADV 13), 3 (NUM 31, ADV 13, ADJ 8), 5 (NUM 29, ADJ 9, ADV 5), МНОГО (NUM 29, ADV 9)

The 10 most frequent ambiguous types: 2 (NUM 55, ADV 23, ADJ 9), один (NUM 42, ADV 1), несколько (NUM 41, ADV 5), 1 (NUM 43, ADJ 33, ADV 19), 10 (NUM 40, ADJ 14, ADV 8), 4 (NUM 35, ADJ 14, ADV 13), три (NUM 29, ADV 1), 3 (NUM 30, ADV 13, ADJ 8), 5 (NUM 29, ADJ 9, ADV 5), 20 (NUM 24, ADJ 12, ADV 11)

2
- NUM 55: Мощность – 2 МВт .
- ADV 23: Население Новогригоровки составляет более 2 - х тысяч человек .
- ADJ 9: Он умер в Каннах 2 февраля 1886 года .
один
- NUM 42: Годиноция – один из самых ранних известных полуобезьян .
- ADV 1: Астольф один вызывает на бой все войско татарского царя 2 миллиона 200 тысяч .
несколько
- NUM 41: В городе имеется несколько университетов , музеев , картинных галерей .
- ADV 5: Естественная реакция на несколько медлительную стратегию черных – 3. е4 .
1
- NUM 43: На расстоянии в 1 км расположено село Поповка .
- ADJ 33: 1 декабря 1923 произведен в лейтенанты 3 - го артиллерийского полка .
- ADV 19: Награждён орденом Святой Анны 1 - й степени .
10
- NUM 40: Готовая фигурка покрывается золотом 999,9 - й пробы толщиной 10 микрон .
- ADJ 14: 10 декабря в Перми прошла несогласованная акция против итогов выборов .
- ADV 8: С 10 июня по 29 ноября 1940 года командовал учебной подлодкой U - 10 .
4
- NUM 35: За сборную Аргентины он провёл 4 матча и забил 2 гола .
- ADJ 14: Первый эпизод вышел 4 августа 2012 .
- ADV 13: В свою очередь , это выражение восходит к тексту 4 - го псалма .
три
- NUM 29: Сериал продержался три сезона и транслировался каналом Sat. 1 .
- ADV 1: Иногда применяется , в неофициальной обстановке , сокращённое название `` кап - три '' .
3
- NUM 30: Мы потратили на это 2 или 3 года .
- ADV 13: 1 декабря 1923 произведен в лейтенанты 3 - го артиллерийского полка .
- ADJ 8: Один из главных организаторов переворота 3 апреля 1984 года , член Военного комитета национального возрождения .
5
- NUM 29: Фильмы на канале KkcTebou TV Channel выделяют 5 направлений :
- ADJ 9: 5 июля германские войска атаковали советские войска в НОВУРе , но успеха не имели .
- ADV 5: Остальные модификации предлагались с 5 - ступенчатыми ручными или 4 - ступенчатыми автоматическими коробками передач .
20
- NUM 24: Вторая глава в сборнике `` Воспоминания '' , 20 страниц .
- ADJ 12: Томас Стюарт Бейкер ( род. 20 января 1934 ) – английский актёр .
- ADV 11: Весна 20 - го года .

Morphology

The form / lemma ratio of NUM is 1.065886 (the average of all parts of speech is 1.591329).

The 1st highest number of forms (10) was observed with the lemma “ОДИН”: один, одна, одним, одних, одно, одного, одной, одном, одному, одну.

The 2nd highest number of forms (5) was observed with the lemma “ДВА”: два, две, двум, двумя, двух.

The 3rd highest number of forms (5) was observed with the lemma “МНОГО”: более, больше, многим, многих, много.

NUM occurs with 6 features: NumType (2028; 100% instances), Case (2026; 100% instances), Animacy (1013; 50% instances), Gender (601; 30% instances), Number (316; 16% instances), Degree (2; 0% instances)

NUM occurs with 15 feature-value pairs: Animacy=Anim, Animacy=Inan, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Degree=Cmp, Gender=Fem, Gender=Masc, Gender=Neut, NumType=Card, Number=Plur, Number=Sing

NUM occurs with 82 feature combinations. The most frequent feature combination is Case=Nom|NumType=Card (470 tokens). Examples: 10, 5, 0, 16, 15, 20, 6, 11, 12, 13

Relations

NUM nodes are attached to their parents using 21 different relations: nummod:gov (856; 42% instances), nummod (641; 32% instances), root (76; 4% instances), appos (74; 4% instances), conj (61; 3% instances), compound (50; 2% instances), list (49; 2% instances), nmod (44; 2% instances), obl (42; 2% instances), amod (26; 1% instances), obj (25; 1% instances), nsubj (22; 1% instances), goeswith (19; 1% instances), parataxis (19; 1% instances), advmod (11; 1% instances), nsubj:pass (5; 0% instances), iobj (2; 0% instances), orphan (2; 0% instances), xcomp (2; 0% instances), acl (1; 0% instances), ccomp (1; 0% instances)

Parents of NUM nodes belong to 11 different parts of speech: NOUN (1534; 76% instances), VERB (113; 6% instances), NUM (106; 5% instances), SYM (84; 4% instances), (76; 4% instances), PROPN (61; 3% instances), ADJ (29; 1% instances), ADV (19; 1% instances), PRON (3; 0% instances), PUNCT (2; 0% instances), ADP (1; 0% instances)

1532 (76%) NUM nodes are leaves.

286 (14%) NUM nodes have one child.

82 (4%) NUM nodes have two children.

128 (6%) NUM nodes have three or more children.

The highest child degree of a NUM node is 7.

Children of NUM nodes are attached using 21 different relations: punct (340; 37% instances), nmod (152; 16% instances), nsubj (75; 8% instances), case (74; 8% instances), advmod (61; 7% instances), conj (52; 6% instances), list (36; 4% instances), cc (31; 3% instances), discourse (27; 3% instances), cop (19; 2% instances), appos (14; 2% instances), goeswith (9; 1% instances), orphan (9; 1% instances), parataxis (8; 1% instances), nummod (7; 1% instances), amod (4; 0% instances), compound (4; 0% instances), nummod:gov (3; 0% instances), det (2; 0% instances), acl (1; 0% instances), advcl (1; 0% instances)

Children of NUM nodes belong to 14 different parts of speech: PUNCT (335; 36% instances), NOUN (216; 23% instances), NUM (106; 11% instances), ADP (74; 8% instances), ADV (63; 7% instances), CCONJ (29; 3% instances), PART (27; 3% instances), AUX (19; 2% instances), PROPN (13; 1% instances), SYM (12; 1% instances), PRON (10; 1% instances), VERB (10; 1% instances), ADJ (9; 1% instances), DET (6; 1% instances)

Treebank Statistics: UD_Russian: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_Russian: POS Tags: `NUM`