Treebank Statistics: UD_Ukrainian-ParlaMint: POS Tags: PROPN
There are 530 PROPN
lemmas (8%), 799 PROPN
types (6%) and 3025 PROPN
tokens (4%).
Out of 16 observed tags, the rank of PROPN
is: 4 in number of lemmas, 4 in number of types and 9 in number of tokens.
The 10 most frequent PROPN
lemmas: Україна, Крим, Росія, Олександр, Іванович, Володимир, Михайлович, Сергій, Батьківщина, Михайло
The 10 most frequent PROPN
types: України, Україні, Криму, Україна, Росії, Іванович, Батьківщина, Крим, Михайловичу, Олександр
The 10 most frequent ambiguous lemmas: Рада (PROPN 9, NOUN 1), СБУ (PROPN 3, NOUN 1), Держдума (PROPN 2, NOUN 1), ПДЧ (NOUN 1, PROPN 1), ТСК (NOUN 3, PROPN 1), луганський (ADJ 3, PROPN 1)
The 10 most frequent ambiguous types: Батьківщина (PROPN 34, NOUN 3), Рада (NOUN 48, PROPN 9), СБУ (PROPN 3, NOUN 1), Держдуми (NOUN 2, PROPN 2), Коса (PROPN 2, NOUN 1), Батьківщини (NOUN 1, PROPN 1), Дружба (NOUN 1, PROPN 1), Заходу (NOUN 1, PROPN 1), Кремль (NOUN 1, PROPN 1), Луганської (ADJ 1, PROPN 1)
- Батьківщина
- Рада
- СБУ
- Держдуми
- Коса
- PROPN 2: Як ми вже інформували , з 29 вересня цього року Російською Федерацією розпочато широкомасштабні односторонні дії по будівництву у Керченській протоці дамби з метою , як зазначали російські ЗМІ , сполучення території української території , острова Коса Тузла , з російським берегом Таманського півострова .
- NOUN 1: Коса Тузла розташована в Керченській протоці , раніше вона була з’єднана з суходолом , з Таманським півостровом .
- Батьківщини
- NOUN 1: Так сталося , що якраз народний депутат України Яценюк Арсеній Петрович склав повноваження народного депутата , тобто в списку “ Батьківщини “ якраз виникла вакансія , яку Сергій Власенко зараз і заповнює .
- PROPN 1: Насправді команда “ Батьківщини “ підтримує в цілому цей законопроект , але ми маємо казати , чи відбулася взагалі суддівська реформа .
- Дружба
- NOUN 1: Я пропоную провести розширене засідання групи “ Дружба міжпарламентська “ між Україною і Російською Федерацією .
- PROPN 1: Згадайте питання транзиту газу , транзиту нафти через нафтопровід “ Дружба “ , докапіталізацію банків , відповідних дочок в Україні , перекази коштів трудових мігрантів .
- Заходу
- Кремль
- Луганської
- ADJ 1: Для ліквідації надзвичайних ситуацій , які мали місце у минулому році , урядом приймалися рішення щодо фінансування невідкладних заходів у місті Щолкіно та селищі Янтарне в Автономній Республіці Крим , Суходольську Луганської області , в місті Полтаві та ряду інших населених пунктах .
- PROPN 1: І ми просимо сьогодні виправити помилку - і як виконуючий обов’язки Президента України скасувати Указ про призначення пана Болотських губернатором Луганської області .
Morphology
The form / lemma ratio of PROPN
is 1.507547 (the average of all parts of speech is 1.887689).
The 1st highest number of forms (5) was observed with the lemma “Віктор”: Віктор, Віктора, Вікторе, Віктором, Віктору.
The 2nd highest number of forms (5) was observed with the lemma “Україна”: Україна, України, Україною, Україну, Україні.
The 3rd highest number of forms (4) was observed with the lemma “Євген”: Євген, Євгена, Євгене, Євгену.
PROPN
occurs with 10 features: Case (3025; 100% instances), Number (3025; 100% instances), Animacy (3020; 100% instances), Gender (3013; 100% instances), NameType (2845; 94% instances), InflClass (136; 4% instances), Abbr (79; 3% instances), Typo (4; 0% instances), Orth (2; 0% instances), Uninflect (1; 0% instances)
PROPN
occurs with 24 feature-value pairs: Abbr=Yes
, Animacy=Anim
, Animacy=Inan
, Case=Acc
, Case=Dat
, Case=Gen
, Case=Ins
, Case=Loc
, Case=Nom
, Case=Voc
, Gender=Fem
, Gender=Masc
, Gender=Neut
, InflClass=Ind
, NameType=Geo
, NameType=Giv
, NameType=Pat
, NameType=Sur
, Number=Plur
, Number=Ptan
, Number=Sing
, Orth=Alt
, Typo=Yes
, Uninflect=Yes
PROPN
occurs with 111 feature combinations.
The most frequent feature combination is Animacy=Inan|Case=Gen|Gender=Fem|NameType=Geo|Number=Sing
(724 tokens).
Examples: України, Росії, Європи, Москви, Америки, Тузли, Білорусі, Білорусії, Одещини, Ірландії
Relations
PROPN
nodes are attached to their parents using 25 different relations: nmod (981; 32% instances), flat:name (738; 24% instances), appos (401; 13% instances), root (207; 7% instances), obl (157; 5% instances), vocative (122; 4% instances), nsubj (117; 4% instances), conj (87; 3% instances), parataxis (76; 3% instances), iobj (62; 2% instances), obj (37; 1% instances), flat:title (8; 0% instances), orphan (7; 0% instances), nsubj:pass (4; 0% instances), obl:arg (4; 0% instances), advcl (3; 0% instances), obl:agent (3; 0% instances), acl (2; 0% instances), acl:relcl (2; 0% instances), compound (2; 0% instances), amod (1; 0% instances), ccomp (1; 0% instances), dislocated (1; 0% instances), flat (1; 0% instances), xcomp (1; 0% instances)
Parents of PROPN
nodes belong to 12 different parts of speech: NOUN (1424; 47% instances), PROPN (834; 28% instances), VERB (464; 15% instances), (207; 7% instances), ADJ (59; 2% instances), ADV (15; 0% instances), PRON (8; 0% instances), NUM (5; 0% instances), AUX (4; 0% instances), INTJ (2; 0% instances), PART (2; 0% instances), DET (1; 0% instances)
1670 (55%) PROPN
nodes are leaves.
687 (23%) PROPN
nodes have one child.
361 (12%) PROPN
nodes have two children.
307 (10%) PROPN
nodes have three or more children.
The highest child degree of a PROPN
node is 9.
Children of PROPN
nodes are attached using 26 different relations: punct (791; 32% instances), flat:name (737; 30% instances), case (361; 15% instances), conj (126; 5% instances), nmod (125; 5% instances), amod (83; 3% instances), parataxis (57; 2% instances), cc (50; 2% instances), det (29; 1% instances), orphan (29; 1% instances), appos (26; 1% instances), acl:relcl (13; 1% instances), advmod (11; 0% instances), discourse (10; 0% instances), nsubj (9; 0% instances), advmod:emph (8; 0% instances), mark (6; 0% instances), vocative (4; 0% instances), advmod:neg (3; 0% instances), cop (3; 0% instances), compound (2; 0% instances), acl (1; 0% instances), advcl (1; 0% instances), expl (1; 0% instances), flat:foreign (1; 0% instances), obl (1; 0% instances)
Children of PROPN
nodes belong to 15 different parts of speech: PROPN (834; 34% instances), PUNCT (791; 32% instances), ADP (364; 15% instances), NOUN (192; 8% instances), ADJ (86; 3% instances), VERB (64; 3% instances), CCONJ (45; 2% instances), DET (34; 1% instances), ADV (29; 1% instances), PART (20; 1% instances), PRON (14; 1% instances), SCONJ (8; 0% instances), AUX (4; 0% instances), X (2; 0% instances), INTJ (1; 0% instances)