Treebank Statistics: UD_Russian-Taiga: POS Tags: X
There are 808 X
lemmas (4%), 859 X
types (2%) and 1312 X
tokens (1%).
Out of 17 observed tags, the rank of X
is: 6 in number of lemmas, 6 in number of types and 15 in number of tokens.
The 10 most frequent X
lemmas: _, rt, http://xxxxxx, https://xxxxxx, *, p.s, п, p., p.s., iphone
The 10 most frequent X
types: то, RT, бы, http://xxxxxx, нибудь, https://xxxxxx, *, же, либо, п
The 10 most frequent ambiguous lemmas: _ (X 252, PUNCT 1), * (PUNCT 28, SYM 10, X 9, CCONJ 1), с (ADP 1802, X 3, NOUN 2, PART 1), goeswith (NOUN 4, X 4, ADJ 1), и (CCONJ 4902, PART 547, X 4, NOUN 2), е (NOUN 1, X 1), а (CCONJ 1095, INTJ 19, X 2, NOUN 1, PART 1, SCONJ 1), в (ADP 4644, X 2, NOUN 1), пост (NOUN 19, X 2), r (NOUN 1, X 1)
The 10 most frequent ambiguous types: то (SCONJ 176, PRON 174, X 127, PART 65, CCONJ 49, DET 23, ADV 1), бы (AUX 247, PART 59, X 21), * (PUNCT 28, SYM 10, X 9, CCONJ 1), же (PART 337, X 9, CCONJ 1), либо (CCONJ 41, X 9), п (X 7, ADJ 2, ADP 2, ADV 1), с (ADP 1665, X 4, ADV 1, NOUN 1, PART 1), таки (PART 10, X 6), за (ADP 611, X 4, VERB 2, ADV 1), и (CCONJ 4395, PART 544, X 4, ADP 2, NOUN 2)
- то
- SCONJ 176: Кстати , вот если у детей разница в 5 - 6 лет , то вообще легко !
- PRON 174: А то , что культуры у нас нет , это да !!!
- X 127: Как- то так 😥
- PART 65: Да , наконец - то увидим солнце 🌤
- CCONJ 49: Напротив сидел парень , то поднимал глаза на меня , то опускал .
- DET 23: Каждый год он отмечается в одно и то же время — 19 января .
- ADV 1: Могила императора то же не вскрыта , а современники говорили , что там – « Несметные сокровища , коварные ловушки , реки жидкой ртути » .
- бы
- *
- же
- PART 337: Бухта халонг конечно же
- X 9: Да же педали су..ки отпилили !!!
- CCONJ 1: Общаемся с парнем уже полтора года , узнала что есть другая , ей она дарит цветы и тд , со мной в хорошем общении гуляет берет к своим друзьям , всем про меня рассказывает , помогает если нужно , ей той девушке дарит цветы с ней он общается больше меня , она была и до меня , мне говорит что она ему по работе с документами помогала и вообще сделала для него многое , недавно когда он предложил мне встречаться я отказалась не восприняла это в серьез , вскоре он начал встречаться с ней потом расстался и мы снова начали общение и уже встречаться официально сейчас же так получилось что у нас опять просто общение и секс , недавно увидела как он подарил ей цветы опять , , при этом оправдывается передо мной говорит что так нужно и это ничего не значит , мне ни разу не дарил цветы , в телефоне она у него была записана любимая где то год назад это было , со мной связь не теряет всегда сам звонит пишет и мирится после ссор , говорит что она просто знакомая и что ей благодарен за помощь и что должен денег поэтому цветы дарит , я запуталась ему 29 той девушке 27 мне 22 мне кажется я просто запасной вариант , когда говорю ему что все знаю и про то что недавно он ей опять подарил цветы на день рождения он оправдывается я заблокировала его везде он звонит с другого номера и просит об возобновлении общения и что это все бред и не стоит из за этого ссориться Что мне делать , как себя вести , верить ему или нет ?
- либо
- п
- с
- ADP 1665: Насчитал , что с начала года всего три дня были солнечными .
- X 4: Поместить в нагретую до 180 с духовку и выпекать 20 - 30 мин .
- ADV 1: Конечно третий сорт - не брак , но с высока смотреть на других ….
- NOUN 1: А знают ли в англоязычных странах , что их “ h “ это наша “ с “ ( heart сердце , haulm солома , him сему , home семья , horn серна и т. д. ) ?
- PART 1: Зато торгуем “ с …
- таки
- за
- и
- CCONJ 4395: Мы собираем свой #Топ100 - что увидеть и попробовать во Вьетнаме .
- PART 544: @screened-200 спасибо и Вам за прекрасный отдых 👌🏻🌸
- X 4: На одном пики точеные , на другом ху .. и дрочёные .
- ADP 2: Это одна и величайших тайн и трагедий советской ( полярной ) авиации …
- NOUN 2: Запишите буквенные обозначения звука [ и ] в кириллице .
Morphology
The form / lemma ratio of X
is 1.063119 (the average of all parts of speech is 1.879397).
The 1st highest number of forms (63) was observed with the lemma “_”: ntynoginsk, Виллу, а, ааа, б, больше, бы, высока, где, давно, до, долго, же, живание, за, их, йца, как, какого, капельным, когда, кому, либо, м, мало, место, ми, мимо, много, моему, на, небудь, нибудь, нибуть, ник, но, ном, ось, охота, очти, плохо, под, позна, помнить, прежнему, приятно, прочь, ранее, розки, российские, руководители, с, счет, счёт, та, таки, то, тойный, чего, чем, четом, что, яземски.
The 2nd highest number of forms (4) was observed with the lemma “goeswith”: дру, лов, орасов, шийся.
The 3rd highest number of forms (2) was observed with the lemma “P.S”: P.S, P.s.
X
occurs with 2 features: Foreign (588; 45% instances), Abbr (20; 2% instances)
X
occurs with 2 feature-value pairs: Abbr=Yes
, Foreign=Yes
X
occurs with 4 feature combinations.
The most frequent feature combination is _
(713 tokens).
Examples: то, бы, http://xxxxxx, нибудь, https://xxxxxx, *, либо, же, п, таки
Relations
X
nodes are attached to their parents using 24 different relations: conj (317; 24% instances), goeswith (252; 19% instances), flat:foreign (205; 16% instances), parataxis (109; 8% instances), root (99; 8% instances), appos (87; 7% instances), nmod (52; 4% instances), nsubj (43; 3% instances), list (38; 3% instances), obl (28; 2% instances), compound (22; 2% instances), flat (15; 1% instances), obj (13; 1% instances), dep (7; 1% instances), flat:name (5; 0% instances), fixed (4; 0% instances), vocative (4; 0% instances), xcomp (3; 0% instances), case (2; 0% instances), iobj (2; 0% instances), orphan (2; 0% instances), acl (1; 0% instances), amod (1; 0% instances), reparandum (1; 0% instances)
Parents of X
nodes belong to 16 different parts of speech: X (535; 41% instances), NOUN (229; 17% instances), VERB (139; 11% instances), (99; 8% instances), ADV (78; 6% instances), PRON (66; 5% instances), DET (43; 3% instances), PROPN (27; 2% instances), ADJ (23; 2% instances), SCONJ (22; 2% instances), NUM (15; 1% instances), PART (12; 1% instances), ADP (11; 1% instances), SYM (6; 0% instances), CCONJ (5; 0% instances), INTJ (2; 0% instances)
948 (72%) X
nodes are leaves.
149 (11%) X
nodes have one child.
111 (8%) X
nodes have two children.
104 (8%) X
nodes have three or more children.
The highest child degree of a X
node is 39.
Children of X
nodes are attached using 28 different relations: conj (329; 30% instances), punct (232; 21% instances), flat:foreign (203; 19% instances), parataxis (67; 6% instances), case (48; 4% instances), appos (40; 4% instances), list (27; 2% instances), flat (25; 2% instances), cc (20; 2% instances), nmod (16; 1% instances), nsubj (14; 1% instances), amod (12; 1% instances), discourse (7; 1% instances), advmod (6; 1% instances), nummod:gov (6; 1% instances), det (5; 0% instances), flat:name (5; 0% instances), fixed (4; 0% instances), orphan (4; 0% instances), compound (3; 0% instances), mark (3; 0% instances), acl:relcl (2; 0% instances), vocative (2; 0% instances), acl (1; 0% instances), advcl (1; 0% instances), ccomp (1; 0% instances), obj (1; 0% instances), obl (1; 0% instances)
Children of X
nodes belong to 16 different parts of speech: X (535; 49% instances), PUNCT (232; 21% instances), NUM (47; 4% instances), PROPN (46; 4% instances), VERB (46; 4% instances), ADP (45; 4% instances), NOUN (42; 4% instances), SYM (22; 2% instances), CCONJ (17; 2% instances), ADJ (16; 1% instances), ADV (10; 1% instances), PRON (8; 1% instances), DET (6; 1% instances), PART (5; 0% instances), SCONJ (5; 0% instances), INTJ (3; 0% instances)