Treebank Statistics: UD_Old_East_Slavic-TOROT: POS Tags: NUM
There are 74 NUM
lemmas (1%), 484 NUM
types (1%) and 5060 NUM
tokens (2%).
Out of 14 observed tags, the rank of NUM
is: 7 in number of lemmas, 8 in number of types and 11 in number of tokens.
The 10 most frequent NUM
lemmas: шесть.тысячь, единъ, дъва, трие, дъвадесяти, шестьсътъ, четыре, пять, тридесяте, шесть
The 10 most frequent NUM
types: ҂ѕ҃, к҃, х҃, ѕ҃, г҃, ф҃, в҃, л҃, м҃, единъ
The 10 most frequent ambiguous lemmas: съто (NUM 72, NOUN 1), пятьнадесять (NUM 47, ADJ 1), тысяща (NUM 34, ADJ 1), осмьсътъ (NUM 30, ADP 5), четырьнадесять (NUM 28, ADJ 2), осмьнадесять (NUM 22, ADJ 2), седмьнадесять (NUM 22, ADJ 1), шестьнадесять (NUM 19, ADJ 1), сорокъ (NUM 7, ADJ 1), другыи (ADJ 303, NUM 1)
The 10 most frequent ambiguous types: х҃ (NUM 195, PROPN 1), три (NUM 76, ADV 2), и҃ (NUM 67, CCONJ 1, PRON 1), а (CCONJ 3651, NUM 63, SCONJ 7, ADP 3, NOUN 3, PRON 2, ADV 1, VERB 1), и (CCONJ 16366, ADV 1250, PRON 569, NUM 60, ADP 38, VERB 4, ADJ 2, DET 1, NOUN 1), д (NUM 56, NOUN 5, CCONJ 3, ADP 1, ADV 1), е (NUM 56, PRON 40, AUX 6, NOUN 2), г (NUM 55, ADP 52), з (ADP 133, NUM 53), ѕ (NUM 53, ADP 2)
- х҃
- NUM 195: се же быс исходѧщю лѣту ҂ѕ҃ х҃ д҃ индикта д҃ на полы
- PROPN 1: бол҃юбивыи же кънѧзь изѧславъ иже по истинѣ бѣ теплъ на вѣрѹ ꙗже къ г҃ѹ нашемѹ іс҃у х҃ къ прѣст҃ѣи мт҃ри ѥ же послѣже положи дш҃ю свою за брата своѥго по гн҃ю гласѹ сь любъвь имѣꙗ ꙗкоже рече сѧ не простѹ къ оц҃ю нашемѹ ѳеѡдосию и часто приходѧ къ немȣ и дх҃овьныихъ тѣхъ словесъ насыщаꙗ сѧ ѿ нѥго
- три
- и҃
- а
- CCONJ 3651: а по бесерменьскыи мѧгъкат дѣ их бѹтхана
- NUM 63: мсца маиѧ вʼ к҃ а д грѣх ради н҃ших Быс знаменїе страшно во градѣ
- SCONJ 7: аже хоцьши ополош дворѧно а бꙑша нь пакостил
- ADP 3: а ко мнѣ не вошел
- NOUN 3: маметь дени іаріа а растъ дени хѹдо доносит
- PRON 2: аще ли и се требѣ есть достоѧше паче роусскаа готова соущи грамота юже предати имъ и наоучитї а
- ADV 1: а то молвита си мужа лесть черниговских кнѧзии
- VERB 1: а илѧгѧїлѧ їл꙽лел꙽ло
- и
- CCONJ 16366: и свѣщах꙽ сѧ съ индѣꙗны поити к первоти
- ADV 1250: тꙑ же мѧ и потени не зерѧ на ѳедора
- PRON 569: и съкрꙑ и кн҃зь въ насаде ѹ себе
- NUM 60: В лѣт ѕ҃ х҃ н҃ и Гюрги кнѧзь поваби вѧчеслава на столъ кыеву
- ADP 38: а и смолиньска тои же зимѣ та к новугороду
- VERB 4: послѣдѣ же андрѣянъ кесарь ѡбновивы и въ свое имѧ нареч андрѣянъ
- ADJ 2: и сговорихъ ѡ налонѣ дати золото и ѿ своеа головы до кафы
- DET 1: и ны гондѹстанци тѣх имают
- NOUN 1: но се имена словомъ азбоукы пермьскїа а боуръ гаи дои е жои зата ѕита и кѡке леи мено нено во пѣи реи сїи таи цю черы шоуѧ е ю о
- д
- NUM 56: к҃ д
- NOUN 5: мсца маиѧ вʼ к҃ а д грѣх ради н҃ших Быс знаменїе страшно во градѣ
- CCONJ 3: и тако б҃жїею помощью в тъ д҃нь д избави градʼ
- ADP 1: а и щернигова вышед и д о лѣта по сту оуганива и имь даром всею силою кромѣ иного лова кромѣ турова иже со ѡц҃мь ловилъ ѥсмъ всѧкъ звѣрь
- ADV 1: и ничтож д не ѹсладит ми мирьских красот на слабость
- е
- NUM 56: всѧ пѧтьнадесѧт главъ и прочаѧ главы книги сеѧ такоже к҃ е глав внимати
- PRON 40: и нѹжницы восхищаютъ е
- AUX 6: оце е тобе н[е] годена а попровади ко моне сестрѹ
- NOUN 2: но се имена словомъ азбоукы пермьскїа а боуръ гаи дои е жои зата ѕита и кѡке леи мено нено во пѣи реи сїи таи цю черы шоуѧ е ю о
- г
- з
- ѕ
Morphology
The form / lemma ratio of NUM
is 6.540541 (the average of all parts of speech is 3.947827).
The 1st highest number of forms (68) was observed with the lemma “единъ”: а, а҃, дино, еди, един, едина, единаго, единаго], едине, единем, единема, единемъ, едино, единого, единои, едином, единомоу, единому, единомъ, единомь, единомѹ, единомꙋ, единою, единоѧ, едину, единъ, единым, единымъ, единыхъ, единыя, единыѧ, единѣ, единѣмъ, единѣм꙽, единѣхъ, единѹ, единꙋ, един꙽, едіному, едіномѹ, едінъ, едїнаго, едїне, едїного, едїнъ, єдино, єдинъ, ѥдин, ѥдина, ѥдини, ѥдино, ѥдиного, ѥдинои, ѥдином, ѥдиномȣ, ѥдиному, ѥдиномь, ѥдиномѹ, ѥдиноꙗ, ѥдину, ѥдинъ, ѥдины, ѥдиныи, ѥдинѣмъ, ѥдинѣмь, ѥдинѣхъ, ѥдинѹ, ѥдін.
The 2nd highest number of forms (47) was observed with the lemma “одинъ”: а, а҃, дним, одиного, одинои, одиномь, одиноѣ, одинъ, одинѡ, одинѹ, одно, одново, одного, однои, одномъ, одны, однѹ, одого, одїного, одїнъ, ѡдин, ѡдина, ѡдини, ѡдино, ѡдинова, ѡдиного, ѡдинои, ѡдином, ѡдиномоу, ѡдиною, ѡдинъ, ѡдинѣхъ, ѡдна, ѡднемь, ѡдно, ѡдново, ѡдного, ѡдное, ѡдному, ѡдну, ѡдны, ѡдным, ѡднѣ, ѡднѹ, ѡдіными, ѡдїну, ҃а.
The 3rd highest number of forms (25) was observed with the lemma “дъва”: .в҃, в, в҃, два, две, двем, двема, двоих, двоихъ, двоу, двою, дву, двух, двухъ, двѣ, двѣма, двѹ, двꙋ, дова, довѣ, дъва, дъвою, дъвѣ, дъвѣма, дъвѹ.
NUM
occurs with 3 features: Case (1311; 26% instances), Gender (1311; 26% instances), Number (1311; 26% instances)
NUM
occurs with 13 feature-value pairs: Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Gender=Fem
, Gender=Fem,Masc
, Gender=Masc
, Gender=Neut
, Number=Dual
, Number=Plur
, Number=Sing
NUM
occurs with 54 feature combinations.
The most frequent feature combination is _
(3749 tokens).
Examples: ҂ѕ҃, к҃, х҃, ѕ҃, г҃, ф҃, в҃, л҃, м҃, у҃
Relations
NUM
nodes are attached to their parents using 21 different relations: conj (1882; 37% instances), nummod (1715; 34% instances), obl (455; 9% instances), root (259; 5% instances), nsubj (223; 4% instances), obj (176; 3% instances), nmod (107; 2% instances), appos (81; 2% instances), orphan (61; 1% instances), xcomp (50; 1% instances), dislocated (15; 0% instances), obl:arg (11; 0% instances), nsubj:pass (8; 0% instances), advcl (5; 0% instances), ccomp (3; 0% instances), parataxis (3; 0% instances), advcl:cmp (2; 0% instances), dep (1; 0% instances), fixed (1; 0% instances), obl:agent (1; 0% instances), vocative (1; 0% instances)
Parents of NUM
nodes belong to 11 different parts of speech: NUM (1950; 39% instances), NOUN (1763; 35% instances), VERB (864; 17% instances), (259; 5% instances), PROPN (67; 1% instances), PRON (50; 1% instances), AUX (49; 1% instances), ADJ (42; 1% instances), ADV (11; 0% instances), ADP (4; 0% instances), DET (1; 0% instances)
2938 (58%) NUM
nodes are leaves.
721 (14%) NUM
nodes have one child.
647 (13%) NUM
nodes have two children.
754 (15%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 14.
Children of NUM
nodes are attached using 19 different relations: conj (1897; 42% instances), nmod (1230; 27% instances), case (411; 9% instances), cc (326; 7% instances), orphan (190; 4% instances), appos (131; 3% instances), advmod (90; 2% instances), obl (35; 1% instances), discourse (33; 1% instances), dislocated (33; 1% instances), nummod (29; 1% instances), nsubj (22; 0% instances), acl (20; 0% instances), cop (18; 0% instances), amod (15; 0% instances), det (11; 0% instances), mark (8; 0% instances), advcl (4; 0% instances), fixed (1; 0% instances)
Children of NUM
nodes belong to 12 different parts of speech: NUM (1950; 43% instances), NOUN (1352; 30% instances), ADP (420; 9% instances), CCONJ (327; 7% instances), ADV (159; 4% instances), PROPN (88; 2% instances), ADJ (68; 2% instances), PRON (64; 1% instances), VERB (42; 1% instances), AUX (21; 0% instances), DET (10; 0% instances), SCONJ (3; 0% instances)