Statistics of X in UD_Russian-SynTagRus

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: `X`

There are 1891 X lemmas (4%), 1890 X types (1%) and 3543 X tokens (0%). Out of 17 observed tags, the rank of X is: 6 in number of lemmas, 6 in number of types and 15 in number of tokens.

The 10 most frequent X lemmas: MBA, the, of, ButtKicker, Facebook, FIA, Iridium, and, RoboCup, Apple

The 10 most frequent X types: MBA, the, of, ButtKicker, Facebook, FIA, Iridium, and, RoboCup, Apple

The 10 most frequent ambiguous lemmas: x (SYM 4, X 1), daily (X 3, ADJ 1), 3D (X 4, PROPN 3), а (CCONJ 8348, INTJ 15, NOUN 6, PART 6, X 4), б (NOUN 4, X 3), и (CCONJ 35007, PART 6265, NOUN 4, X 3, VERB 1), * (X 2, PUNCT 1), С (PROPN 116, NOUN 2, X 2), Х (PROPN 8, X 2), аль (PART 10, X 2)

The 10 most frequent ambiguous types: X (X 12, ADJ 11, NUM 1), daily (X 3, ADJ 1), 3D (X 4, PROPN 3), а (CCONJ 5759, INTJ 5, X 4, NOUN 3, PART 2), б (AUX 23, X 3), и (CCONJ 31847, PART 6206, NOUN 4, X 3), * (X 2, PUNCT 1), С (ADP 813, NOUN 2, X 2), Х (PROPN 3, X 2), аль (PART 9, X 2)

X
- X 12: Поэтому в ожидании “ дня X “ сразу начала формироваться очередь .
- ADJ 11: X .
- NUM 1: Угловая скорость цели , тем более вблизи перигея траектории , была настолько большой , что на нее не могли навестись не только 70 - метровые антенны дальней космической связи , но и доработанные специально для этого пуска 12 - метровые антенны “ Спектр - X “ на Байконуре и в Медвежьих Озерах , которые должны были использоваться на расстоянии до нескольких миллионов километров от Земли .
daily
- X 3: Митинги оценивали не по лозунгам и идеям , а по числу пришедших , констатирует “ РБК daily “ .
- ADJ 1: В подмосковной ГИБДД РБК daily рассказали , что опасаются отдельных водителей - экстремалов , которые ради острых ощущений специально готовы выезжать на шоссе , чтобы прокатиться с ветерком в рядах военной техники .
3D
- X 4: В 3D .
- PROPN 3: Тут все что угодно - и 3D , и инфографика .
а
- CCONJ 5759: Длина острова составляла 14 , а ширина - 5 километров “ .
- INTJ 5: - Как он нас , а ? . .
- X 4: Для Перельмана его “ а идише маме “ , видимо тоже поважнее гипотезы Пуанкаре .
- NOUN 3: Отсюда следует начинать изучение азбуки Кавказа - здесь каждое слово начинается на “ а “ .
- PART 2: - И с чего это тебя разносит , а ?
б
- AUX 23: Связываться не хотелось , а то б я тебя , такого храброго ! . .
- X 3: Добиться , чтобы твои решения выполнялись а ) в ТВ - эфире и б ) хотя бы в пределах Садового кольца .
и
- CCONJ 31847: Наличие исходных данных и некоторого результата .
- PART 6206: Соответственно и алгоритмы ни разу не упоминаются на её страницах .
- NOUN 4: В первом слове ударный звук “ и “ и перед ним смягчённый “ в “ - здесь твёрдого быть и не может .
- X 3: Яка страна - такый и теракт ! . .
*
- X 2: Кроме того , мы брали на себя обязательство поддерживать в порядке “ моржатник “ ( прямоугольник 4 м * 6 м ) и дорожку к нему из сауны .
- PUNCT 1: Ее разрешение ( 2000 * 2000 точек ) полностью “ покрывает “ любые современные мониторы и проекторы .
С
- ADP 813: С каждым годом увеличивалось число команд - участниц первенства .
- NOUN 2: Ее нагрели до 550 С , выдержали 1,5 часа и медленно охладили до комнатной температуры .
- X 2: В зависимости от концентрации соли температура замерзания воды изменяется от 0 до 31 С .
Х
- PROPN 3: Чтобы не настал “ час Х “ и не возник сакраментальный вопрос : “ веревку свою приносить или профсоюз обеспечит ? “ .
- X 2: В результате , к примеру , утверждение “ Мы проголосовали за политика Х , потому что он хороший “ замещается нами в ходе избавления от когнитивного диссонанса другим : “ Политик Х хороший , потому что мы за него проголосовали “ .
аль
- PART 9: В первой половине XII века книга аль - Хорезми в латинском переводе проникла в Европу .
- X 2: Из оригинального названия книги происходит слово Алгебра ( алгебра - аль - джебр - сложение ) .

Morphology

The form / lemma ratio of X is 0.999471 (the average of all parts of speech is 2.668831).

The 1st highest number of forms (1) was observed with the lemma “&”: &.

The 2nd highest number of forms (1) was observed with the lemma “*”: *.

The 3rd highest number of forms (1) was observed with the lemma “+7°C”: +7°C.

X occurs with 2 features: Foreign (3518; 99% instances), Abbr (4; 0% instances)

X occurs with 2 feature-value pairs: Abbr=Yes, Foreign=Yes

X occurs with 4 feature combinations. The most frequent feature combination is Foreign=Yes (3515 tokens). Examples: MBA, the, of, ButtKicker, Facebook, FIA, Iridium, and, RoboCup, Apple

Relations

X nodes are attached to their parents using 23 different relations: flat:foreign (1157; 33% instances), appos (893; 25% instances), nmod (388; 11% instances), parataxis (279; 8% instances), nsubj (257; 7% instances), conj (165; 5% instances), obl (124; 3% instances), compound (66; 2% instances), obj (59; 2% instances), root (56; 2% instances), nsubj:pass (19; 1% instances), iobj (18; 1% instances), xcomp (16; 0% instances), obl:agent (12; 0% instances), flat:name (8; 0% instances), list (5; 0% instances), vocative (5; 0% instances), flat (4; 0% instances), orphan (4; 0% instances), amod (3; 0% instances), case (3; 0% instances), acl (1; 0% instances), ccomp (1; 0% instances)

Parents of X nodes belong to 13 different parts of speech: NOUN (1419; 40% instances), X (1367; 39% instances), VERB (461; 13% instances), PROPN (135; 4% instances), (56; 2% instances), ADJ (52; 1% instances), NUM (18; 1% instances), DET (13; 0% instances), ADV (9; 0% instances), PRON (6; 0% instances), SYM (3; 0% instances), CCONJ (2; 0% instances), PART (2; 0% instances)

1950 (55%) X nodes are leaves.

692 (20%) X nodes have one child.

392 (11%) X nodes have two children.

509 (14%) X nodes have three or more children.

The highest child degree of a X node is 24.

Children of X nodes are attached using 29 different relations: punct (1422; 39% instances), flat:foreign (1140; 32% instances), case (216; 6% instances), conj (150; 4% instances), appos (126; 3% instances), amod (110; 3% instances), cc (100; 3% instances), parataxis (83; 2% instances), nmod (47; 1% instances), advmod (34; 1% instances), list (32; 1% instances), nsubj (27; 1% instances), det (18; 0% instances), parataxis:discourse (16; 0% instances), acl:relcl (14; 0% instances), acl (13; 0% instances), flat (9; 0% instances), nummod:gov (8; 0% instances), orphan (7; 0% instances), nummod (6; 0% instances), mark (5; 0% instances), cop (4; 0% instances), advcl (3; 0% instances), flat:name (3; 0% instances), obl (3; 0% instances), compound (2; 0% instances), expl (1; 0% instances), iobj (1; 0% instances), obj (1; 0% instances)

Children of X nodes belong to 16 different parts of speech: PUNCT (1422; 39% instances), X (1367; 38% instances), ADP (206; 6% instances), ADJ (132; 4% instances), NOUN (125; 3% instances), CCONJ (97; 3% instances), NUM (54; 1% instances), VERB (50; 1% instances), ADV (36; 1% instances), PROPN (25; 1% instances), DET (22; 1% instances), SCONJ (21; 1% instances), PART (15; 0% instances), PRON (15; 0% instances), SYM (10; 0% instances), AUX (4; 0% instances)

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: X

Morphology

Relations

Treebank Statistics: UD_Russian-SynTagRus: POS Tags: `X`