home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Chukchi-HSE: POS Tags: X

There are 1 X lemmas (6%), 240 X types (10%) and 380 X tokens (6%). Out of 16 observed tags, the rank of X is: 16 in number of lemmas, 3 in number of types and 7 in number of tokens.

The 10 most frequent X lemmas: _

The 10 most frequent X types: нрзб, это, и, а, ну, я, потом, ӄы, же, как

The 10 most frequent ambiguous lemmas: _ (VERB 1183, PUNCT 1004, PART 856, NOUN 842, ADV 790, PRON 394, X 380, PROPN 208, AUX 134, CCONJ 112, ADJ 96, DET 44, INTJ 35, ADP 23, NUM 20, SCONJ 3)

The 10 most frequent ambiguous types: это (X 12, PART 2), и (CCONJ 18, X 6), а (PART 51, X 8, CCONJ 2), эт (ADV 3, X 2), аммытԓыӈ (NUM 1, X 1), ва (ADV 1, PART 1, X 1), йъа (ADV 2, X 1), тит (ADV 1, X 1), ӈэ (PART 36, X 1)

Morphology

The form / lemma ratio of X is 240.000000 (the average of all parts of speech is 146.312500).

The 1st highest number of forms (240) was observed with the lemma “_”: Аʼйыӈ, В, Вы, Гамачквантат, Гыргоԓят, Йъэ, Йынрысӄ, Мач, Мыг, Мэсӄымавыч, Не, Ниви, Нинэтиӈэӈӈу, Тан, Тивымкэ, Тиԓмытириԓ, Тыч, Тэӈъинкэԓи, Тэԓиӈ, Урааа, Чапаянни, Чёрное, Ытԓьэ, а, ааӄъым, аг, агтывэ, аммытԓыӈ, блиска, бличка, ва, ваԓв, виг, вот, вслед, въэ, вык, вэриву, г, га, гав, гагты, гарыч, гаԓгэ, ги, гинив, говорю, грэм, гын, гыр, гыргочаткын, гыръоӈ, гытга, гэ, гэмэч, гэԓ, гэԓи, допустим, ег, егтэ, ещё, еэ, же, занятия, и, иʼнничгэ, ив, имыръэнук, иран, итэй, йи, йиӈ, йъа, йъотъра, йынрытчигэ, йыӈачыкогт, как, ковԓёрвоо, конечно, короче, кто, купи, ли, майны, марэгына, ми, мимԓечы, миӈкэк, миӈкэки, море, мы, мык, мын, мынги, мыт, мытивыт, мытрай, мытръэт, мытэ, мытԓе, мэ, мэй, мэм, н, найвы, нано, наноно, нанэ, нарайъотԓяты, нас, ни, никут, нин, нинэ, нинэт, нотач, нрзб, ну, нуй, нут, нъаԓегы, ны, ныви, нык, нымэч, нын, ныний, ныр, ныръэӄин, ныч, ныӄор, ныԓгиным, нэ, нэна, нэнайпа, нэнан, нэнаёпат, нэнъиръиԓемйигӈы, нэплички, нэран, нэԓ, нэԓгинуюркыни, нэԓӄыричыӄи, о, оʼ, оʼм, оʼо, оʼравэт, оʼро, общем, она, оп, опэт, плиска, пличка, по-русски, потом, прих, пропустит, пыԓвынты, пэ, пэԓг, пятьдесят, пԓеэн, раёвынвыԓ, ро, роч, рублей, ръа, ры, рэ, рэн, рэнэ, рэпы, с, сказать, сколько, та, так, такая, там, тит, то, трэ, тут, ты, тынык, тыпки, тыр, тыта, тэ, тэӈыннин, ура, хочется, ч, через, чеԓг, что, ым, ын, ыннаны, ынпыччакит, ыны, ытԓонъымыт, эмӈинӄэгԓ, эн, эна, энаркып, энаръэнан, эни, энтк, эну, эт, эти, это, эчг, я, яа, ям, ямганымгынымгыпы, ямна, ян, яԓгыт, ӄанарайъо, ӄора, ӄоратыр, ӄри, ӄы, ӄыӄорагыркэ, Ӈу, ӈай, ӈач, ӈиръэӄи, ӈыро, ӈэ, ӈэв, ӈэвъэнйы, ԓм, ԓым, ԓьэԓьэнры.

X does not occur with any features.

Relations

X nodes are attached to their parents using 10 different relations: reparandum (250; 66% instances), discourse (72; 19% instances), flat:foreign (37; 10% instances), parataxis (5; 1% instances), dep (4; 1% instances), root (4; 1% instances), cc (3; 1% instances), obj (3; 1% instances), flat:name (1; 0% instances), nsubj (1; 0% instances)

Parents of X nodes belong to 12 different parts of speech: VERB (180; 47% instances), NOUN (70; 18% instances), X (49; 13% instances), ADV (29; 8% instances), PRON (21; 6% instances), PROPN (9; 2% instances), ADJ (8; 2% instances), PART (5; 1% instances), (4; 1% instances), CCONJ (2; 1% instances), NUM (2; 1% instances), AUX (1; 0% instances)

349 (92%) X nodes are leaves.

16 (4%) X nodes have one child.

4 (1%) X nodes have two children.

11 (3%) X nodes have three or more children.

The highest child degree of a X node is 7.

Children of X nodes are attached using 11 different relations: flat:foreign (37; 56% instances), reparandum (9; 14% instances), discourse (4; 6% instances), nsubj (4; 6% instances), punct (4; 6% instances), cc (2; 3% instances), parataxis (2; 3% instances), dislocated (1; 2% instances), flat:name (1; 2% instances), obj (1; 2% instances), parataxis:rep (1; 2% instances)

Children of X nodes belong to 8 different parts of speech: X (49; 74% instances), NOUN (5; 8% instances), PUNCT (4; 6% instances), VERB (3; 5% instances), CCONJ (2; 3% instances), ADV (1; 2% instances), DET (1; 2% instances), PART (1; 2% instances)