Statistics of DET in UD_Old_East

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Old_East_Slavic-Ruthenian: POS Tags: `DET`

There are 63 DET lemmas (1%), 1010 DET types (4%) and 9805 DET tokens (7%). Out of 17 observed tags, the rank of DET is: 10 in number of lemmas, 5 in number of types and 7 in number of tokens.

The 10 most frequent DET lemmas: нашъ, той, свой, весь, который, вашъ, тый, тотъ, сей, оный

The 10 most frequent DET types: того, нашим, тыи, тых, нашого, тую, тотъ, ваша, свои, тое

The 10 most frequent ambiguous lemmas: весь (DET 948, ADV 2), который (DET 717, PRON 11), тотъ (DET 456, PRON 3), оный (DET 280, PRON 2), самъ (DET 270, PRON 1), другий (DET 68, ADJ 13), твой (DET 44, PRON 1), кождый (DET 37, ADJ 7), сесь (DET 35, ADV 1), многий (DET 25, ADJ 5)

The 10 most frequent ambiguous types: того (PRON 289, DET 271), тое (DET 149, PRON 29), сами (DET 112, PRON 1), тому (PRON 77, DET 76), все (DET 68, ADV 2, PRON 1), тым (DET 55, PRON 48), тымъ (DET 55, PRON 44), симъ (DET 60, PRON 1), томъ (PRON 115, DET 58), том (PRON 131, DET 54)

того
- PRON 289: И мы оуже болши того не можем терпети .
- DET 271: Ино того збродна Зубца выдаитѣ тому , хто вамъ сию грамоту принѣсѣть .
тое
- DET 149: С вашим ли вѣдомомъ будет(ь) тое оучинил ?
- PRON 29: И мы подле тых листов ѡтца нашого тое им потвержаемо нашым листом .
сами
- DET 112: Ино сами свои записы ломите , а правых людеи грабите .
- PRON 1: А не давши имъ , сами собѣ возмутъ , какъ и дотулъ брали — жоны и дѣти братеи нашихъ .
тому
- PRON 77: Еску Прибытъковичу село Черняховъ с тымъ , што к тому слухаеть .
- DET 76: Ино того збродна Зубца выдаитѣ тому , хто вамъ сию грамоту принѣсѣть .
все
- DET 68: А на то на все дали есмо сию грамот(у) и печѧт(ь) свою велѣли привѣсити .
- ADV 2: Потом полочаном немечьким купьцем съ всем одиночьством за себе и за последнихъ будущихъ доброю волею ихъ пускати оу Полочьку торговат(и) и с гостемь , и съ полоч(а)ны все сполу , то будь мало или велико , во всѧкои торговли , какыи ли ни былъ товаръ , никакого чего выложено , безъ всѧкоѧ хитрости .
- PRON 1: Тогды тотъ монъштукъ або удило на погамованъе кождого зуфальцу есть вынайдено , абы , се боячы права , от кожъдого кгвалъту и збытку погамовалъ , а надъ слабшимъ и худъшимъ не паствилъсе и утискати его не могъ , бо для того права суть постановлены , абы можному и потужному не все было вольно чынити .
тым
- DET 55: А за тым пишем вашеи м(и)л(о)сти .
- PRON 48: И ѡнъ всим тым клеплет(ь) .
тымъ
- DET 55: Еску Прибытъковичу село Черняховъ с тымъ , што к тому слухаеть .
- PRON 44: И ѡнъ тымъ ц(е)рк(о)вь ѡбрѧдит(ь) .
симъ
- DET 60: И мы то им потвержаем симъ нашим листом .
- PRON 1: А што есми пѣред симъ писалъ до вашѣе м(и)л(о)сти ѡ своем слоузѣ ѡ Якуши , виноват был емꙋ ваш немѣць небожчикъ Симонъ 15 грош(е)и да рубль .
томъ
- PRON 115: Нѧлъсѧ ты мне прислати с низу , а при томъ были оу насъ люди » .
- DET 58: И вы бы ѡ томъ росмотрели .
том
- PRON 131: И вы бы и ѡ том кн(я)зю своему мештерю говорили .
- DET 54: Чому мнѣ доли нетъ оу том ѡзерѣ ?

Morphology

The form / lemma ratio of DET is 16.031746 (the average of all parts of speech is 2.698737).

The 1st highest number of forms (112) was observed with the lemma “весь”: (в)се(м)ъ, (в)семъ, (в)сѣ, (в)сѣмъ, (в)сѣхъ, в(в)сѣми, в(ъ)сємъ, вве(с), ввесь, вес(ь), весь, вс[ѣ], вс]ими, все, все(и), все(й), всег(о), всего, всее, всеи, всей, всем, всем(и), всеми, всемоу, всему, всемъ, всемь, всемꙋ, всех, всехъ, всею, всея, всеѧ, вси, вси(м̑), всим, всими, всимъ, всих, всихъ, всьмъ, всю, вся, всями, всє(и), всєє(и), всѣ, всѣ(м), всѣ(х), всѣг(о), всѣго, всѣе, всѣи, всѣм, всѣми, всѣмоу, всѣму, всѣмъ, всѣмь, всѣмꙋ, всѣх, всѣхъ, всѣю, всѧ, всѧѧ, въсе, въсе(м), въсе(м)ъ, въсего, въсеи, въсему, въсемъ, въсею, въсея, въси, въсим, въсими, въсимъ, въсихъ, въсѣми, въсѣмъ, въсѣмь, въсѣхь, въсѣю, вьсимъ, вѣсь, оусее, оусем, оусеми, оусемъ, оусехъ, оусею, оуси, оусимъ, оусихь, оусю, оусѣхъ, оусѧ, увє(с), увєсъ, уси, усими, усимъ, усих, усихъ, усы, усю, ꙋсе, ꙋсее, ꙋси, ꙋсих.

The 2nd highest number of forms (108) was observed with the lemma “нашъ”: н(а)ш(е)му, н(а)ш(и)мъ, н(а)ш(о)г(о), н(а)ш(о)го, н(а)ш(о)му, н(а)ша, н(а)ше, н(а)шее, н(а)ши, н(а)шим, н(а)шими, н(а)шимъ, н(а)ших, н(а)шихъ, н(а)шо, н(а)шог(о), н(а)шого, н(а)шое, н(а)шои, н(а)шому, н(а)шомъ, н(а)шомꙋ, н(а)шою, н(а)шу, н(а)шъ, н(а)шым, н(а)шымъ, н(а)шь, н(а)шꙋ, на[ш]их, на[шим, наш, наш(а), наш[ими], наша, нашго, наше, нашег(о), нашего, нашее, нашеи, нашей, нашем, нашем(у), нашеми, нашемоу, нашему, нашемъ, нашемь, нашемѹ, нашемꙋ, нашею, нашея, нашеѧ, наши, наши(м), наши(м)ъ, наши(х), нашим, нашими, нашимъ, нашимь, наших, нашихъ, нашихь, нашо, нашо(и), нашо(м), нашог(о), нашого, нашое, нашои, нашой, нашом, нашому, нашомъ, нашомꙋ, нашою, нашоі, нашу, нашъ, нашы, нашые, нашым, нашыми, нашымъ, нашых, нашыхъ, нашь, нашю, нашєго, нашіимъ, нашѣ, нашѣг(о), нашѣго, нашѣи, нашѣм, нашѣмоу, нашѣю, нашѹ, нашꙋ, наща, нш̃ꙋ, нш҃и, нш҃и(м), н҃шим, ши, шыми.

The 3rd highest number of forms (62) was observed with the lemma “который”: Коториє, Которіе, каждый, ко(т)орую, комоу, кот(о)рого, кот(о)рыи, кот(о)рых, кото[2]ри(й), котор[ы]м, котора, котораа, которая, котораѧ, котори(и), котори(й), котори(м), котори(х), которие, котории, которий, которимъ, которо(г)[о], которо(и), которо(й), которо(м), которо(м)ъ, которог(о), которого, которое, которои, которой, котором, которому, которомъ, которомꙋ, которою, котороє, котороѝ, котороѣ, которую, которъ, которы, которы(и), которы(й), которы(м), которы(х), которые, которыи, который, которым, которыми, которымъ, которых, которыхъ, которыє, которіи, которій, которіє, которꙋю, котрая, котри(и).

DET occurs with 10 features: Case (9805; 100% instances), Number (9805; 100% instances), PronType (9805; 100% instances), Gender (9802; 100% instances), Poss (3758; 38% instances), Reflex (1028; 10% instances), Animacy (259; 3% instances), Person (9; 0% instances), Variant (9; 0% instances), Typo (2; 0% instances)

DET occurs with 27 feature-value pairs: Animacy=Anim, Case=Acc, Case=Dat, Case=Gen, Case=Ins, Case=Loc, Case=Nom, Gender=Fem, Gender=Masc, Gender=Neut, Number=Dual, Number=Plur, Number=Sing, Person=3, Poss=Yes, PronType=Dem, PronType=Emp, PronType=Exc, PronType=Ind, PronType=Int, PronType=Neg, PronType=Prs, PronType=Rel, PronType=Tot, Reflex=Yes, Typo=Yes, Variant=Short

DET occurs with 284 feature combinations. The most frequent feature combination is Case=Nom|Gender=Masc|Number=Sing|PronType=Dem (292 tokens). Examples: тотъ, тот, то(т), тоть, ѡны(и), ѡны(й), сесь, то(и), то(т)ъ, той

Relations

DET nodes are attached to their parents using 23 different relations: det (8439; 86% instances), nsubj (388; 4% instances), obl (342; 3% instances), obj (194; 2% instances), conj (132; 1% instances), iobj (103; 1% instances), nmod (64; 1% instances), amod (43; 0% instances), nsubj:pass (29; 0% instances), obl:float (19; 0% instances), orphan (11; 0% instances), appos (7; 0% instances), root (7; 0% instances), advcl (6; 0% instances), reparandum (6; 0% instances), parataxis (4; 0% instances), acl (2; 0% instances), advmod (2; 0% instances), fixed (2; 0% instances), xcomp (2; 0% instances), ccomp (1; 0% instances), dislocated (1; 0% instances), expl (1; 0% instances)

Parents of DET nodes belong to 11 different parts of speech: NOUN (7884; 80% instances), VERB (993; 10% instances), PROPN (479; 5% instances), PRON (192; 2% instances), ADJ (158; 2% instances), DET (65; 1% instances), ADV (13; 0% instances), NUM (10; 0% instances), (7; 0% instances), PART (2; 0% instances), X (2; 0% instances)

8995 (92%) DET nodes are leaves.

648 (7%) DET nodes have one child.

96 (1%) DET nodes have two children.

66 (1%) DET nodes have three or more children.

The highest child degree of a DET node is 8.

Children of DET nodes are attached using 28 different relations: advmod (315; 29% instances), case (253; 23% instances), cc (131; 12% instances), punct (103; 9% instances), acl:relcl (62; 6% instances), conj (52; 5% instances), nmod (38; 4% instances), det (27; 2% instances), appos (18; 2% instances), nsubj (13; 1% instances), cop (12; 1% instances), orphan (11; 1% instances), acl (9; 1% instances), fixed (6; 1% instances), dislocated (5; 0% instances), obl (5; 0% instances), reparandum (5; 0% instances), amod (4; 0% instances), discourse (3; 0% instances), mark (3; 0% instances), csubj (2; 0% instances), expl (2; 0% instances), advcl (1; 0% instances), aux (1; 0% instances), dep (1; 0% instances), nsubj:pass (1; 0% instances), nummod:gov (1; 0% instances), parataxis:discourse (1; 0% instances)

Children of DET nodes belong to 15 different parts of speech: PART (294; 27% instances), ADP (247; 23% instances), CCONJ (132; 12% instances), PUNCT (103; 9% instances), DET (65; 6% instances), VERB (65; 6% instances), NOUN (59; 5% instances), PRON (33; 3% instances), ADJ (26; 2% instances), ADV (26; 2% instances), AUX (15; 1% instances), PROPN (9; 1% instances), SCONJ (8; 1% instances), X (2; 0% instances), NUM (1; 0% instances)

Treebank Statistics: UD_Old_East_Slavic-Ruthenian: POS Tags: DET

Morphology

Relations

Treebank Statistics: UD_Old_East_Slavic-Ruthenian: POS Tags: `DET`