Statistics of NUM in UD_Russian-SynTagRus

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: `NUM`

There are 1022 NUM lemmas (2%), 1119 NUM types (1%) and 17916 NUM tokens (1%). Out of 17 observed tags, the rank of NUM is: 7 in number of lemmas, 7 in number of types and 13 in number of tokens.

The 10 most frequent NUM lemmas: один, два, несколько, три, 1, 10, четыре, 20, 2, много

The 10 most frequent NUM types: один, несколько, два, три, одной, 1, 10, двух, две, 20

The 10 most frequent ambiguous lemmas: один (NUM 2706, DET 984, NOUN 3), несколько (NUM 1037, ADV 112), 1 (NUM 417, ADJ 26), 10 (NUM 407, ADJ 20), 20 (NUM 323, ADJ 15), 2 (NUM 309, ADJ 14), много (ADV 721, NUM 306), 15 (NUM 280, ADJ 17), 5 (NUM 257, ADJ 12), 3 (NUM 242, ADJ 11)

The 10 most frequent ambiguous types: один (NUM 697, DET 179), несколько (NUM 743, ADV 104), одной (NUM 409, DET 139), 1 (NUM 417, ADJ 26), 10 (NUM 407, ADJ 21), 20 (NUM 322, ADJ 15), 2 (NUM 309, ADJ 14), одного (NUM 278, DET 91), одна (NUM 242, DET 94), 15 (NUM 276, ADJ 17)

один
- NUM 697: Соревнования могут проводиться очные и заочные , в один или два тура .
- DET 179: ( А вдруг именно он один и был “ к чему “ ? . . )
несколько
- NUM 743: Хотел написать несколько песен о полетах .
- ADV 104: А последние новшества даже несколько ухудшили ситуацию .
одной
- NUM 409: Траверс одной вершины не классифицируется .
- DET 139: Но ведь коррупция - удел не одной лишь госбюрократии .
1
- NUM 417: - Единица ускорения “ Гал “ ( Gal ) в системе СГС , равная 1 см/сек ? .
- ADJ 26: Заморозка цен на социально значимые продукты продлена до 1 мая .
10
- NUM 407: Их сократили сначала на 10 % , опубликовав эти данные .
- ADJ 21: 10 июня 1940 года капитулируют последние части норвежской армии .
20
- NUM 322: Ей , думаю , лет 20 , а это срок немалый .
- ADJ 15: 20 апреля капитулирует Эпирская армия .
2
- NUM 309: 2 . Ногти царя сломаны , и по лицу его ползают мокрицы .
- ADJ 14: 2 марта в Греции начинают высадку английские и австралийские войска .
одного
- NUM 278: - Вы редактор одного из самых авторитетных наших научных журналов .
- DET 91: Из-за одного процента мы подозреваем все сто .
одна
- NUM 242: И тут еще одна его неразгаданная тайна .
- DET 94: А там одна слава “ удобства “ - вода сегодня идет , завтра нет .
15
- NUM 276: Он не может подставлять под пресс больше 7 - 15 деталей в минуту .
- ADJ 17: Гитлер назначил нападение на 15 мая .

Morphology

The form / lemma ratio of NUM is 1.094912 (the average of all parts of speech is 2.668831).

The 1st highest number of forms (12) was observed with the lemma “один”: один, одна, одни, одним, одними, одно, одного, одной, одном, одному, одною, одну.

The 2nd highest number of forms (9) was observed with the lemma “оба”: оба, обе, обеим, обеими, обеих, обоего, обоим, обоими, обоих.

The 3rd highest number of forms (6) was observed with the lemma “три”: трем, тремя, трех, три, трём, трёх.

NUM occurs with 8 features: NumForm (17915; 100% instances), NumType (17915; 100% instances), Case (9378; 52% instances), Gender (4591; 26% instances), Number (2706; 15% instances), Animacy (2023; 11% instances), Degree (100; 1% instances), ExtPos (23; 0% instances)

NUM occurs with 24 feature-value pairs: Animacy=Anim, Animacy=Inan, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Degree=Cmp, ExtPos=ADV, ExtPos=NUM, ExtPos=PRON, Gender=Fem, Gender=Masc, Gender=Neut, NumForm=Combi, NumForm=Digit, NumForm=Roman, NumForm=Word, NumType=Card, NumType=Frac, NumType=Sets, Number=Plur, Number=Sing

NUM occurs with 92 feature combinations. The most frequent feature combination is NumForm=Digit|NumType=Card (8430 tokens). Examples: 1, 10, 20, 2, 15, 5, 3, 30, 4, 100

Relations

NUM nodes are attached to their parents using 32 different relations: nummod (8965; 50% instances), nummod:gov (3477; 19% instances), nmod (1278; 7% instances), appos (727; 4% instances), obl:tmod (664; 4% instances), nsubj (567; 3% instances), conj (398; 2% instances), root (339; 2% instances), obl (324; 2% instances), parataxis (231; 1% instances), compound (216; 1% instances), obj (190; 1% instances), xcomp (157; 1% instances), nsubj:pass (70; 0% instances), obl:pronmod (65; 0% instances), advcl (40; 0% instances), list (33; 0% instances), ccomp (31; 0% instances), orphan (31; 0% instances), iobj (29; 0% instances), obl:float (21; 0% instances), amod (17; 0% instances), acl (12; 0% instances), acl:relcl (11; 0% instances), flat (5; 0% instances), advmod (4; 0% instances), csubj (3; 0% instances), fixed (3; 0% instances), obl:agent (3; 0% instances), obl:depict (3; 0% instances), flat:foreign (1; 0% instances), flat:name (1; 0% instances)

Parents of NUM nodes belong to 13 different parts of speech: NOUN (12364; 69% instances), VERB (2011; 11% instances), NUM (1234; 7% instances), SYM (1061; 6% instances), PROPN (362; 2% instances), (339; 2% instances), ADJ (275; 2% instances), PRON (128; 1% instances), ADV (61; 0% instances), X (54; 0% instances), DET (23; 0% instances), PART (3; 0% instances), ADP (1; 0% instances)

10894 (61%) NUM nodes are leaves.

4693 (26%) NUM nodes have one child.

1407 (8%) NUM nodes have two children.

922 (5%) NUM nodes have three or more children.

The highest child degree of a NUM node is 12.

Children of NUM nodes are attached using 33 different relations: punct (2633; 24% instances), nmod (2579; 23% instances), advmod (1596; 14% instances), case (950; 9% instances), flat (736; 7% instances), nsubj (388; 4% instances), conj (376; 3% instances), cc (265; 2% instances), amod (225; 2% instances), obl (189; 2% instances), compound (182; 2% instances), det (147; 1% instances), parataxis (140; 1% instances), cop (115; 1% instances), mark (101; 1% instances), appos (82; 1% instances), parataxis:discourse (63; 1% instances), orphan (44; 0% instances), advcl (43; 0% instances), acl (42; 0% instances), obl:tmod (32; 0% instances), fixed (28; 0% instances), list (25; 0% instances), acl:relcl (24; 0% instances), iobj (16; 0% instances), obl:pronmod (7; 0% instances), csubj (6; 0% instances), expl (3; 0% instances), nummod (3; 0% instances), flat:name (2; 0% instances), discourse (1; 0% instances), flat:foreign (1; 0% instances), obj (1; 0% instances)

Children of NUM nodes belong to 17 different parts of speech: NOUN (2791; 25% instances), PUNCT (2633; 24% instances), NUM (1234; 11% instances), ADP (975; 9% instances), ADV (824; 7% instances), PART (814; 7% instances), ADJ (412; 4% instances), CCONJ (260; 2% instances), PRON (255; 2% instances), VERB (234; 2% instances), DET (204; 2% instances), SCONJ (124; 1% instances), AUX (115; 1% instances), PROPN (84; 1% instances), SYM (67; 1% instances), X (18; 0% instances), INTJ (1; 0% instances)

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: `NUM`