Treebank Statistics: UD_Armenian-BSUT: POS Tags: PROPN
There are 640 PROPN lemmas (9%), 910 PROPN types (8%) and 1940 PROPN tokens (4%).
Out of 17 observed tags, the rank of PROPN is: 4 in number of lemmas, 4 in number of types and 6 in number of tokens.
The 10 most frequent PROPN lemmas: Հայաստան, ՀՀ, Արցախ, Սարյան, Ռուբեն, Ռուսաստան, Նվարդ, Ջիվանի, Փաշինյան, Երևան
The 10 most frequent PROPN types: Հայաստանի, ՀՀ, Հայաստանում, Արցախի, Ջիվանին, Խոսրովի, Ռուսաստանի, Կարինե, Ադրբեջանի, Իրանի
The 10 most frequent ambiguous lemmas: Սարյան (PROPN 31, NOUN 18), Լիանկե (PROPN 4, NOUN 1), Լոս (PROPN 2, X 1), Ղազախստան (NOUN 6, PROPN 2), Ամերիկա (NOUN 2, PROPN 1), Այգուտ (NOUN 3, PROPN 1), Գոչունյան (NOUN 1, PROPN 1)
The 10 most frequent ambiguous types: Լ (ADJ 6, PROPN 4), Ա (PROPN 3, ADJ 2), Ազատ (PROPN 3, ADJ 1), Գ (ADJ 1, PROPN 1), Երկիրը (NOUN 2, PROPN 1), Ի (ADP 9, PROPN 1), Մայրիկ (NOUN 1, PROPN 1), Պատմությունը (NOUN 1, PROPN 1), երկիր (NOUN 5, PROPN 1)
- Լ
- Ա
- Ազատ
- Գ
- Երկիրը
- Ի
- ADP 9: Ի դեպ , գետից դուրս եկող այդ ձիավորից լավ դաջվածք կստացվի :
- PROPN 1: Այդ երեկո Ջոնիկը Պ . Ի . Չայկովսկու անվ . մեծ համերգասրահ մտավ որպես մայրաքաղաքային երաժշտասերին քիչ հայտնի հեղինակ և այնտեղից դուրս եկավ որպես համամիութենական ճանաչման արժանացած կոմպոզիտոր . վկա ՝ լսարանի հսկայական խանդավառությունը :
- Մայրիկ
- Պատմությունը
- երկիր
Morphology
The form / lemma ratio of PROPN is 1.421875 (the average of all parts of speech is 1.742993).
The 1st highest number of forms (7) was observed with the lemma “Հայաստան”: ՀԱՅԱՍՏԱՆԻ, Հայաստան, Հայաստանը, Հայաստանի, Հայաստանին, Հայաստանն, Հայաստանում.
The 2nd highest number of forms (7) was observed with the lemma “Պետրոսյան”: ՊԵՏՐՈՍՅԱՆ, Պետրոսյան, Պետրոսյանը, Պետրոսյանի, Պետրոսյանին, Պետրոսյանից, Պետրոսյանն.
The 3rd highest number of forms (7) was observed with the lemma “Սարյան”: Սարյան, Սարյանի, Սարյանին, Սարյանն, Սարյանների, Սարյաններին, Սարյանով.
PROPN occurs with 7 features: Animacy (1940; 100% instances), Case (1940; 100% instances), Definite (1940; 100% instances), NameType (1940; 100% instances), Number (1940; 100% instances), Abbr (117; 6% instances), Style (29; 1% instances)
PROPN occurs with 24 feature-value pairs: Abbr=Yes, Animacy=Hum, Animacy=Nhum, Case=Abl, Case=Dat, Case=Ins, Case=Loc, Case=Nom, Definite=Def, Definite=Ind, NameType=Com, NameType=Geo, NameType=Giv, NameType=Oth, NameType=Pat, NameType=Pro, NameType=Prs, NameType=Sur, Number=Assoc, Number=Plur, Number=Sing, Style=Coll, Style=Expr, Style=Rare
PROPN occurs with 60 feature combinations.
The most frequent feature combination is Animacy=Nhum|Case=Dat|Definite=Ind|NameType=Geo|Number=Sing (365 tokens).
Examples: Հայաստանի, Արցախի, Ռուսաստանի, Ադրբեջանի, Իրանի, Թուրքիայի, Ղարաբաղի, Երևանի, Չինաստանի, Արարատի
Relations
PROPN nodes are attached to their parents using 29 different relations: nmod:poss (511; 26% instances), nsubj (301; 16% instances), flat:name (287; 15% instances), obl (186; 10% instances), conj (162; 8% instances), nmod (161; 8% instances), obj (67; 3% instances), appos (56; 3% instances), nmod:npmod (54; 3% instances), root (52; 3% instances), iobj (19; 1% instances), parataxis (15; 1% instances), nsubj:pass (14; 1% instances), flat (10; 1% instances), vocative (9; 0% instances), orphan (7; 0% instances), xcomp (6; 0% instances), list (5; 0% instances), advcl (3; 0% instances), dislocated (3; 0% instances), acl (2; 0% instances), amod (2; 0% instances), ccomp (2; 0% instances), acl:relcl (1; 0% instances), compound (1; 0% instances), csubj (1; 0% instances), flat:range (1; 0% instances), nsubj:caus (1; 0% instances), obl:agent (1; 0% instances)
Parents of PROPN nodes belong to 10 different parts of speech: NOUN (869; 45% instances), VERB (560; 29% instances), PROPN (400; 21% instances), (52; 3% instances), ADJ (26; 1% instances), X (12; 1% instances), PRON (11; 1% instances), ADV (6; 0% instances), NUM (3; 0% instances), INTJ (1; 0% instances)
1119 (58%) PROPN nodes are leaves.
401 (21%) PROPN nodes have one child.
255 (13%) PROPN nodes have two children.
165 (9%) PROPN nodes have three or more children.
The highest child degree of a PROPN node is 9.
Children of PROPN nodes are attached using 32 different relations: punct (424; 27% instances), flat:name (300; 19% instances), conj (171; 11% instances), nmod (124; 8% instances), case (103; 7% instances), cc (102; 7% instances), amod (40; 3% instances), acl (32; 2% instances), list (30; 2% instances), dep (29; 2% instances), advmod:emph (25; 2% instances), cop (24; 2% instances), acl:relcl (23; 1% instances), nsubj (19; 1% instances), parataxis (16; 1% instances), nmod:npmod (14; 1% instances), nmod:poss (13; 1% instances), appos (11; 1% instances), orphan (11; 1% instances), flat (9; 1% instances), discourse (7; 0% instances), mark (7; 0% instances), det (4; 0% instances), advcl (3; 0% instances), obl (3; 0% instances), advmod (2; 0% instances), aux (2; 0% instances), case:loc (1; 0% instances), ccomp (1; 0% instances), compound (1; 0% instances), flat:range (1; 0% instances), nummod (1; 0% instances)
Children of PROPN nodes belong to 16 different parts of speech: PUNCT (424; 27% instances), PROPN (400; 26% instances), NOUN (314; 20% instances), ADP (96; 6% instances), CCONJ (92; 6% instances), VERB (57; 4% instances), ADJ (53; 3% instances), ADV (28; 2% instances), AUX (26; 2% instances), PART (18; 1% instances), NUM (13; 1% instances), X (11; 1% instances), PRON (8; 1% instances), DET (7; 0% instances), SCONJ (5; 0% instances), INTJ (1; 0% instances)