Treebank Statistics: UD_Old_East_Slavic-RNC: POS Tags: NUM
There are 182 NUM
lemmas (3%), 282 NUM
types (2%) and 1598 NUM
tokens (3%).
Out of 17 observed tags, the rank of NUM
is: 6 in number of lemmas, 7 in number of types and 10 in number of tokens.
The 10 most frequent NUM
lemmas: два, 3, одинъ, 2, 4, 5, 10, 6, оба, полтора
The 10 most frequent NUM
types: 3, два, 2, 4, один, две, 5, 10, 6, три
The 10 most frequent ambiguous lemmas: 3 (NUM 164, ADJ 7), одинъ (NUM 99, DET 3), 2 (NUM 76, ADJ 6), 4 (NUM 75, ADJ 6), 5 (NUM 48, ADJ 4), 10 (NUM 47, ADJ 7), 6 (NUM 43, ADJ 4), 8 (NUM 28, ADJ 5), 12 (NUM 25, ADJ 9), 20 (NUM 25, ADJ 9)
The 10 most frequent ambiguous types: 3 (NUM 157, ADJ 5, ADV 1, X 1), 2 (NUM 76, ADJ 6), 4 (NUM 75, ADJ 6), 5 (NUM 47, ADJ 4), 10 (NUM 45, ADJ 7, X 1), 6 (NUM 43, ADJ 4, X 1), 8 (NUM 28, ADJ 5, X 1), 12 (NUM 25, ADJ 9, X 1), 20 (NUM 24, ADJ 9), 9 (NUM 22, X 1)
- 3
- NUM 157: И в тои меди зделал два ведра , весу в них в обеих 19 фунтов 3 чети .
- ADJ 5: 148-го , ноября въ 3 день , з Донскою станицею , съ атаманомъ съ Сидоромъ Олѳимовымъ .
- ADV 1: … фимиян и на … глаголи 3 ж молитву Божую да после тое оборонную глаголи на воскь , а воскь лепи на мешени , а спаси , Господи , се молитву глаголи особь , когда хочеш[ь] , да воду пропушай скроз[ь] дуло , а какь первие молитву глаголешь , и ты дми на порох и на ладан , и на всю ту сподобу , и порох емли и сподобу в рот , и дми в дуло .
- X 1: { л. 3 } Написано в доклад .
- 2
- 4
- 5
- 10
- NUM 45: И всеи недаходнаи меди у Сидара теперва 10 гривенок .
- ADJ 7: {л._222} 178-г(о) году генваря в 10 де[нь] .
- X 1: { л. 10 } И 148 г[оду] сентября в 3 де[нь] по государеву [ титул ] указу боярин Иван Петрович Шереметев да дьяки Василей Прокофьев да Михайло Неверов немчина Петра Фалька , по какому он умышленью или по чьему наученью немчина Григорья Томосова убил до смерти , у пытки роспрашивали .
- 6
- NUM 43: Ендова медная бол(ь)шая , весу в неи 6 гривенок .
- ADJ 4: 160-го году маия в 6 день .
- X 1: Да он же немчин Фальк роспрашиван : сказали на нево в роспросе в Иноземском приказе нового выезду немцы Михайло Цыпр с товарищи , что он убил саржанта Григорья до смерти за то , заложил де он у него Григорья карабин в дву рублех , и тот де Григорей учал у него просить по закладу денги , и он Петр за то ево Григорья пьян поколол шпагою до смерти ? { л. 6 }
- 8
- NUM 28: И всеи мед(и) в худых судах 2 пуда пол 8 гривенки .
- ADJ 5: 160-го маия в 8 день подал Никонко Садовник .
- X 1: { л. 8 } В обыску один человек переводчик сказал , слышал он от сторонних людей , и от Ындрика серебрянника , у ково та драка на дворе учинилась , что де пришел тот саржант Григорей Томосов к Петру Фальку просить долгу , и промеж де ими у того Индрика учинилась драка , и как де Григорей Томосов пошел от него Петра с двора , и Петр де Фальк , вышед за ним Григорьем с шпагою , и поколол ево у ворот до смерти .
- 12
- NUM 25: [В]сего весом в тех судах меди 12 пуд … гривенок с полугривенкаю .
- ADJ 9: {л._103} 178-г(о) году ноября в 12 де[нь] .
- X 1: И боярин Иван Петрович Шереметев да дьяки Василей Прокофьев да Михайло Неверов велели роспросные и пыточные речи ево записать , а его Петра до государева указу велели приставу Офонасью Степанову держать у себя за приставом . { л. 12 }
- 20
- 9
Morphology
The form / lemma ratio of NUM
is 1.549451 (the average of all parts of speech is 1.988362).
The 1st highest number of forms (17) was observed with the lemma “одинъ”: адин, адна, аднꙋ, один, одиного, одна, однем, одно, однова, одново, однои, одном, одною, одну, отнех, ъднои, ѡдинъ.
The 2nd highest number of forms (11) was observed with the lemma “два”: [д]ве, д[ва], дв[а], дв[е], два, две, двема, двома, дву, двух, двѣ.
The 3rd highest number of forms (8) was observed with the lemma “оба”: [о]беих, оба, обе, обеих, обоеꙗ, обу, обѣ, обѣих.
NUM
occurs with 7 features: Case (1595; 100% instances), NumForm (1342; 84% instances), NumType (1206; 75% instances), Gender (558; 35% instances), Number (140; 9% instances), Degree (5; 0% instances), Animacy (2; 0% instances)
NUM
occurs with 22 feature-value pairs: Animacy=Anim
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Degree=Cmp
, Degree=Pos
, Gender=Fem
, Gender=Masc
, Gender=Neut
, NumForm=Cyril
, NumForm=Digit
, NumForm=Roman
, NumForm=Word
, NumType=Card
, NumType=Frac
, NumType=Sets
, Number=Dual
, Number=Plur
, Number=Sing
NUM
occurs with 105 feature combinations.
The most frequent feature combination is Case=Nom|NumForm=Digit|NumType=Card
(641 tokens).
Examples: 3, 4, 2, 10, 6, 5, 12, 35, 9, 20
Relations
NUM
nodes are attached to their parents using 16 different relations: nummod:gov (1255; 79% instances), nummod (216; 14% instances), compound (40; 3% instances), appos (15; 1% instances), obl (13; 1% instances), root (12; 1% instances), conj (10; 1% instances), obj (9; 1% instances), nsubj:pass (7; 0% instances), nsubj (6; 0% instances), amod (5; 0% instances), nmod (4; 0% instances), acl (3; 0% instances), dep (1; 0% instances), flat (1; 0% instances), parataxis (1; 0% instances)
Parents of NUM
nodes belong to 9 different parts of speech: NOUN (1483; 93% instances), NUM (38; 2% instances), VERB (31; 2% instances), ADJ (20; 1% instances), (12; 1% instances), PRON (11; 1% instances), ADV (1; 0% instances), DET (1; 0% instances), PROPN (1; 0% instances)
1477 (92%) NUM
nodes are leaves.
91 (6%) NUM
nodes have one child.
19 (1%) NUM
nodes have two children.
11 (1%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 6.
Children of NUM
nodes are attached using 20 different relations: punct (39; 23% instances), compound (35; 20% instances), case (29; 17% instances), nmod (14; 8% instances), advmod (10; 6% instances), nsubj (9; 5% instances), cc (6; 3% instances), conj (6; 3% instances), obl (4; 2% instances), parataxis (3; 2% instances), amod (2; 1% instances), appos (2; 1% instances), cop (2; 1% instances), det (2; 1% instances), iobj (2; 1% instances), list (2; 1% instances), nummod:gov (2; 1% instances), acl:relcl (1; 1% instances), dep (1; 1% instances), flat (1; 1% instances)
Children of NUM
nodes belong to 14 different parts of speech: PUNCT (39; 23% instances), NUM (38; 22% instances), ADP (29; 17% instances), NOUN (29; 17% instances), PART (8; 5% instances), ADJ (6; 3% instances), CCONJ (6; 3% instances), PRON (4; 2% instances), DET (3; 2% instances), PROPN (3; 2% instances), ADV (2; 1% instances), AUX (2; 1% instances), VERB (2; 1% instances), X (1; 1% instances)