home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Hindi-PUD: POS Tags: PROPN

There are 1 PROPN lemmas (6%), 936 PROPN types (17%) and 1358 PROPN tokens (6%). Out of 16 observed tags, the rank of PROPN is: 11 in number of lemmas, 2 in number of types and 7 in number of tokens.

The 10 most frequent PROPN lemmas: _

The 10 most frequent PROPN types: अमेरिका, चीन, ब्रिटेन, ट्रम्प, फ्रांस, यूरोप, इटली, मिस्र, रूस, हांगकांग

The 10 most frequent ambiguous lemmas: _ (NOUN 5597, ADP 4849, PUNCT 2297, VERB 2058, ADJ 1995, AUX 1776, PROPN 1358, PRON 1128, DET 876, CCONJ 545, NUM 452, SCONJ 382, PART 316, ADV 159, SYM 30, X 11)

The 10 most frequent ambiguous types: डि (PROPN 6, ADP 1), स्पेनिश (PROPN 5, ADJ 1), भूमध्य (NOUN 7, PROPN 4), रोना (PROPN 4, VERB 1), एकेमेनिड (PROPN 3, ADJ 1), खान (PROPN 3, NOUN 1), लॉर्ड (PROPN 3, NOUN 1), सेंट (NOUN 3, PROPN 3), डेनिश (ADJ 2, PROPN 2), तुर्की (ADJ 2, PROPN 2)

Morphology

The form / lemma ratio of PROPN is 936.000000 (the average of all parts of speech is 345.375000).

The 1st highest number of forms (936) was observed with the lemma “_”: 2C, Aoun, Emicro, ExxonMobil, GEMA, GOP, Hariri, Huawei, IRENA, LUISS, NASCAR, NATO, NoMa, RECO, SPIEGEL, VW, अंटार्कटिक, अगोरा, अटलांटिक, अदनान, अनाया, अपुलिया, अफ्रीका, अबाकुमोव, अमीन, अमुरु, अमेजन, अमेरिका, अरबी, अर्नेस्ट, अल, अलास्का, अलेक्जेंडर, अलेक्सान्द्र, अलेजांद्रा, अल्जीरिया, अल्पाइन, अल्बानिया, अल्बानी, अवीवा, आंद्रे, आंशी, आइनर, आइसलैंड, आईएजी, आयरलैंड, आयरिश, आयर्स, आरएचएस, आरएसबीपी, आरएससी, आर्म, आल्पस, आस्ट्रिया, आस्ट्रेलिया, इंग्लैंड, इंटरनेशनल, इंडियाना, इंड्युरेंस, इज़राइल, इटली, इन, इबिंजेन, इयॉन, इरानी, इरीने, इलियट, इलैने, इवान, इवोले, इसाई, इसाबेला, इस्तांबुल, इस्लाम, ईगन, ईगल, ईटीए, ईरान, ईसीबी, उबेर, उलरिच, ऊबर, एंजेल, एंजेल्स, एंटिपस, एंटोनियो, एंडिनो, एंडी, एंडीज, एंड्र्यू, एंसेल्मी, एऔन, एकेपी, एकेमेनिड, एच, एटकिंसन, एडवर्ड, एडिडास, एडिनबर्ग, एडेनब्रूक, एड्गर्स, एड्रियाटिक, एड्स, एथिना, एथेंस, एनएचएस, एनरिक, एनियो, एनी, एपल, एपिस्कोपल, एफएसएलएन, एबी, एबॉट्सफोर्ड, एमजीबी, एमनेस्टी, एमिन्टास, एयरलिफ्ट, एरिक, एर्डोगन, एलिस, एल्ड्रिन, एल्वारेज, एवरी, एवरो, एशिया, एस्टी, एस्ते, एस्सेन, ऑगस्टस, ऑग्स्टस, ऑटोमन, ऑट्ज़ी, ऑड्रे, ऑफ, ऑसबोर्न, ऑस्कर, ऑस्टरलिट्ज, ऑस्ट्रिया, ओंटेरियो, ओटोमन, ओडी, ओडेसा, ओबरमार्सबर्ग, ओबामा, ओब्लास्ट, ओलम्पिक, ओलिविया, ओल्ने, ओसवाल्ड, ओहियो, कंबरलैंड, कंसास, कनाडा, कराकल्ला, कर्नाक, कर्बेर, कांगो, काउंटी, कादेश, कापुआ, कामचत्का, कार्टर, कार्लोस, कार्सन, काला, कासा, काहिरा, किंग, किएरा, किकी, किगाली, किपलिंग, किम, किरीमुइर, किलिमंजारो, किल्टर, कीरा, कुएरन, कुओ, कुन, कुमे, कुरिन्थ, कुरियो, केंटुकी, केएफसी, केनसेथ, केन्या, केपटाउन, केरकासोने, केरेनगी, केरोलिना, केशा, कैटेलेनो, कैथरिन, कैनानाइट, कैपिटल, कैप्लान, कैमरून, कैम्पबेल, कैम्ब्रिजशायर, कैरेल, कैरोलिना, कैस्टलफ्रांको, कॉकेशस, कॉटन, कॉड, कॉमन्स, कोड, कोमे, कोरिया, कोरी, कोरैडो, कोरोना, कोलम्बस, कोलोन, कोलोराडो, क्यूबा, क्यूरी, क्रस्टीना, क्राउच, क्रिस, क्रिस्चियन, क्रिस्टिन, क्रिस्टियनसैंड, क्रिस्टोफर, क्रीमिया, क्रेनाच, क्रेमर, क्रैट्शेमर, क्रैस्नोयार्स्क, क्लाइड, क्लिंटन, क्लेन, क्लेरेट, क्विंग, क्वेन, खान, खितान, गाउंट, गाउदी, गार्डन, गार्थ, गिओवान्नी, गिनी, गिलब्यूट, गिलार्ड, गीज़र, गुंटर, गुआंगझोऊ, गुआम, गूगल, गे, गेजिरा, गेयर, गेरार्ड, गेरी, गैम्सन, गैरोने, गॉडेंस, गॉर्डन, गॉल, गोंगमिन, गोंजालेज, गोंडोला, गोफ्रेडो, गोमेरी, गोल्ड, ग्रीक, ग्रीको, ग्रेट, ग्रेनविले, ग्रेनाइट, ग्रेविटी, ग्लासगो, ग्लिंडा, ग्लेंडा, ग्लोरिया, चर्चिल, चांडलर, चार्ल्स, चिलिया, चीन, चेक, चेकोस्लोवाकिया, चैपल, चैम्बरलिन, जटिंग, जदान, जर्मन, जर्मनी, जर्माइने, जहाज, ज़होरी, ज़ार, ज़ेइट, जापान, जिन, जिम, जिमर, जिमी, जीएम, जीओपी, जीसीएचक्यू, जुआन, जुकरबर्ग, जुलियन, जूलियट, जे, जेइऑन, जेक्सु, जेड, जेनिंग्स, जेफ, जेफरी, जेम्स, जेरोनिमो, जेवियर, जेसी, जैसन, जैस्मिन, जॉन, जॉनी, जॉन्सन, जॉर्ज, जॉर्जटाउन, जॉर्जेज, जो, जोआन, जोकोवी, जोलियट, जोसफ, जोसेफ, झील, टार्लो, टावर, टिकिनो, टिनटिन, टिपो, टिमोन, टी, टीना, टुल्सिया, टेक्सास, टेनेसी, टेपी, टेराटोमा, टेलेकॉम, टेस्ला, टैगा, टॉम, टोरी, टोले, ट्युनिप, ट्रम्प, ट्रांसकॉकेशस, ट्रिक्स, ट्रुडीउ, ट्रे, ट्विटर, डगलस, डफी, डर्नांड, डाई, डायट्रिच, डि, डिएस, डिज्नी, डिसिब़ॉंडनबर्ग, डी, डीएफबी, डीन, डीपीए, डुंडार, डुरान, डेनमार्क, डेनिश, डेनेवर, डेनेविर्के, डेन्यूब, डेरियस, डेव, डेविड, डेविडसन, डॉस, डोनाल्ड, डोमेनिको, डोर्सेट, तंजानिया, तिबेरियस, तियेनत्सिन, तुर्की, तोकुगावा, थटमोज, थर्मोपिले, थाईलैंड, थानोस, थुतमोज, थेसाली, थॉमस, थॉम्पसन, थ्रेस, दाती, दिल्ली, नटिंघम, नाटो, नानकिंग, निकोलस, निकोलाई, नितरा, नीदरलैंड, नीदरलैंड्स, नील, नेक्टार, नेगान, नेपोलियन, नेवादा, नेस्तस, नैपोलियन, नैशविले, नॉट, नॉर्थ, नॉर्थैम्पटन, नॉर्मन, नॉर्वे, नोर्मा, न्यूज, न्यूटन, न्यूयॉर्क, पनवलकर, पनामा, पर्मा, पसेरा, पाइरस, पाएओनियन्स, पापुआ, पामेर, पायफ, पार्कर, पाल, पालों, पाल्मा, पिंग, पिंटैडो, पिगी, पिथेकाउसे, पिलेट, पीकिंग, पीटर, पुंटा, पुग, पुर्तगाल, पूल, पेड्रो, पेतरास्सी, पेनिस्टन, पेबे, पेयरे, पेरिस, पेलुक्का, पेलोपोनेसस, पैकहम, पैटर्सन, पैपवर्थ, पॉम्पी, पॉल, पो, पोटोमैक, पोलक, पोलिटी, पोलैंट, पोलैंड, प्यूअर्टो, प्योंग्यांग, प्रशान्त, प्राइस, प्राबोवो, प्रोकाउंसल, प्रोटेस्टेंट, प्लांटाजेनेट, प्लेटो, प्लेनो, प्लेस, फराओ, फातिमा, फायोरेलो, फारस, फिगारो, फिनलैंड, फिनिश, फिनिशियन्स, फिलिप, फिलीपींस, फिल्म्स, फेडेरिको, फेलिनी, फेलॉन, फेसबुक, फॉंटविएली, फोर्ड, फ्योगुर, फ्योर्ड्स, फ्रांज़, फ्रांस, फ्रांसिस, फ्रांसिस्को, फ्रीमैन, फ्रैंक, फ्रैंको, फ्लेंसबर्ग, फ्लोरिडा, फ्लोरेंस, बदरपुर, बपतिस्मा, बरोसो, बर्गेरॉन, बर्गोयने, बर्नार्ड, बर्राट, बर्लिन, बांतु, बाइजेंटियम, बाइबिल, बाजा, बादशाह, बानेज, बारोसो, बाल्कन, बास, बासिलिकाटा, बियान, बिल, बिलबोर्ड, बी, बी., बीआईडी, बीए, बीजिंग, बीबीसी, बुएना, बुचर्ड, बुद्ध, बुश, बेउफ, बेनॉइत, बेरन, बेरिया, बेलग्रेड, बेलिंगशाउसेन, बेलिंघम, बेल्जियम, बेवर्ली, बैंकॉक, बैरी, बॉब, बोएमर, बोगार्ट, बोड, बोनापार्ट, बोनो, बोस्फोरस, ब्यूनस, ब्यूस्त, ब्रांट, ब्रांसफील्ड, ब्राइस, ब्राजील, ब्रिटेन, ब्रिसबेन, ब्रिस्बेन, ब्रुइन, ब्रुस, ब्रूक्स, ब्रूनो, ब्रेक्जिट, ब्रेक्सिट, ब्रेमेन, ब्रेस्टेड, ब्लंट, ब्लाइंडलिया, ब्लॉक, भारत, भूमध्य, मंगोलिया, मकदूनिया, मपेट्स, मर, मरात, मरीना, मरोतो, मर्फी, महानाखोन, महासागर, मांचू, मांट्रियल, माइकल, माइक्रोसॉफ्ट, माउन्टेन, माया, मारेंगो, मार्क, मार्को, मार्गरेट, मार्टिन, मार्ता, मार्वल, मार्सेली, मालदीव, मियामी, मिलान, मिलिकन, मिलेनिया, मिल्ड्रेड, मिशिमा, मिसिसिपी, मिस्र, मीजी, मीनकिएली, मुंडो, मेंटल, मेई, मेगरिम, मेगाबाजुस, मेगैरियन, मेजा, मेट, मेट्टी, मेयर, मेर्डिन्जेन, मेलिस, मेसिडोनिया, मेस्ता, मेस्त्रे, मैंडल, मैओरियम, मैकग्रेगर, मैकनेइली, मैक्सिको, मैग्मा, मैड्रिड, मैलियस, मॉर्गन, मॉस, मॉस्कोने, मोंटे, मोजमिर, मोटोक्रॉस, मोनेगास्क, मोनैको, मोमोने, मोरक्को, मोराविया, मोरिकोन, मोरिविया, मोलाइसे, मोहम्मद, म्युजेज, यमन, यरुशलम, यहूदी, यान्नी, यास, यीशु, यीशू, युआक्जाक्शन, युआन, युकाटन, युक्रेन, युधोयोने, युनिवर्सल, युरेशिया, यूट्यूब, यूनान, यूरोजोन, यूरोप, येर्बा, येवस, यॉर्क, रक्षागृह, राइट, राइन, राजकुमारी, राय, रायन, राशिदा, राशेल, रासा, रास्तिज़, रास्तिस्लाव, रिको, रिचर्ज, रिचर्ड, रियल, रीको, रीगन, रीच, रुडयार्ड, रूपर्ट्सबर्ग, रूस, रेडिट, रेफर्टी, रेमिस, रेवरेंड, रेशेनबाख, रैफर्टी, रैमसेस, रैम्बलर, रैम्बो, रॉकेट, रॉबिन्सन, रोक्को, रोजर्स, रोजेन, रोन, रोना, रोम, रोमा, रोमानिया, रोमानोव, रोमियो, रोस, रोसी, लंदन, लविंग, लविंग्स, ला, लाइन, लातियम, लाबेउफ, लाब्रोक्का, लामार, लाहौर, लिंकन, लिंडसे, लिन, लिनारेस, लियाओ, लिलेसैंड, लिवेट, ली, लीव, लुई, लुईस, लुकास, लुबुम्बाशी, लूथर, लूपर, ले, लेनी, लेनॉक्स, लेयासु, लेविट, लेसी, लैरी, लॉरेंट, लॉर्ड, लॉस, वर्टेमबर्ग, वर्साय, वांग, वांस, वाग्देवी, वाट, वाल, वाल्ट, वाल्टर, वाशिंगटन, विंटरकॉर्न, विंस्टन, विक्टोरियाज, विगुइए, विन्टुअर, विला, विलियम, विलियम्स, विलिस, विलेन्युव, विल्किस, वुड्स, वेइस, वेगा, वेटलैंड, वेनिस, वेनेटो, वेलर, वेल्स, वेस्टइंडीज, वैटिकन, वैलेंटिनो, वॉन, व्यू, व्लादिवोस्तक, व्हीलर, शंघाई, शिकाई, शिथिया, शुमैन, शेंक, शेन, शेनझेन, शेपार्ड, शैकल्टन, शोवा, श्लेई, संडरलैंड, सखालिन, सबरीना, सरकोजी, सराटोगा, सर्किट, सर्बिया, सलमान, सलास, सलेर्नो, सहारा, सांचेज, सांता, साइबेरिया, साइमन, साउथसी, साउल, साक़िब, सान, सामी, सारा, साल्जबर्ग, सास्केल, साहेल, सिगुर, सिफ्युएन्तेस, सिलिका, सिलिकॉन, सिसकॉकेशस, सिसली, सिसिली, सिसीलिया, सी, सी., सीआरटीसी, सीएनएन, सीगल, सीज़र, सीजीआई, सीटीवी, सीबीएस, सीबीसी, सुखोथाई, सुद्बादेन, सुबियांतो, सुल्ला, सेंट, सेड, सेरेना, सेल्टिक, सेशल्स, सेस्तो, सैक्रोकोसाइजील, सैन, सैमसंग, सैम्नियम, सैलिएन, सैल्मन, सोनी, सोमरसेट, सोल, सोल्हीम, स्काईलार्क, स्कॉट, स्कॉटलैंड, स्कॉट्समैन, स्क्रिटी, स्टर्नलीब, स्टर्लिन, स्टार्लिन, स्टालियन, स्टीफन, स्टॉलर, स्ट्रीट, स्ट्रेंजर, स्ट्रेथियर्न, स्तालिन, स्नैपचैट, स्नोमैन, स्पार्टा, स्पीजेल, स्पेन, स्पेनिश, स्पॉटिफाई, स्प्रिंगर, स्माराग्दिस, स्मिथ, स्लोवाकिया, स्विट्जरलैंड, स्वीडन, स्वेज, हंगरी, हडसन, हम्फ्रे, हम्बलबम्स, हरीरी, हर्जल, हर्बर्ट, हांगकांग, हाउते, हान्स, हार्ले, हार्वर्ड, हालस्ट्रॉम, हिचकॉक, हिचिकर्स, हिटलर, हिन्द, हिलेरी, हिल्सबोरो, हिस्पानिया, हुआवेई, हुनान, हुबेई, हुसुम, हेनरिख, हेनरी, हेपबर्न, हेरेड, हेरेडियस, हेलिफैक्स, हेलेना, हेशलर, हैब्सबर्ग, हैमरस्मिथ, हॉर्टेफ्यूक्स, हॉलीवुड, होपले, होमर, होर्टन, होल्डन, ह्यूज.

PROPN occurs with 4 features: Animacy (1343; 99% instances), Number (1343; 99% instances), Gender (1338; 99% instances), Case (983; 72% instances)

PROPN occurs with 8 feature-value pairs: Animacy=Anim, Animacy=Inan, Case=Acc, Case=Nom, Gender=Fem, Gender=Masc, Number=Plur, Number=Sing

PROPN occurs with 18 feature combinations. The most frequent feature combination is Animacy=Inan|Case=Acc|Gender=Masc|Number=Sing (369 tokens). Examples: अमेरिका, चीन, ब्रिटेन, यूरोप, रूस, अफ्रीका, अल्बानिया, फ्रांस, मिस्र, यूनान

Relations

PROPN nodes are attached to their parents using 18 different relations: nsubj (251; 18% instances), nmod:poss (230; 17% instances), flat:name (206; 15% instances), obl (201; 15% instances), compound (172; 13% instances), conj (83; 6% instances), obj (66; 5% instances), iobj (33; 2% instances), nmod (33; 2% instances), appos (28; 2% instances), nsubj:pass (20; 1% instances), obl:agent (14; 1% instances), amod (12; 1% instances), acl:relcl (3; 0% instances), flat (2; 0% instances), root (2; 0% instances), parataxis (1; 0% instances), xcomp (1; 0% instances)

Parents of PROPN nodes belong to 10 different parts of speech: VERB (508; 37% instances), NOUN (455; 34% instances), PROPN (323; 24% instances), ADJ (63; 5% instances), ADP (2; 0% instances), NUM (2; 0% instances), (2; 0% instances), DET (1; 0% instances), PART (1; 0% instances), PRON (1; 0% instances)

434 (32%) PROPN nodes are leaves.

533 (39%) PROPN nodes have one child.

231 (17%) PROPN nodes have two children.

160 (12%) PROPN nodes have three or more children.

The highest child degree of a PROPN node is 7.

Children of PROPN nodes are attached using 25 different relations: case (707; 46% instances), flat:name (206; 13% instances), compound (128; 8% instances), punct (122; 8% instances), conj (84; 5% instances), cc (70; 5% instances), amod (52; 3% instances), acl:relcl (47; 3% instances), appos (40; 3% instances), nmod:poss (27; 2% instances), discourse (18; 1% instances), det (11; 1% instances), nmod (7; 0% instances), acl (5; 0% instances), advmod (3; 0% instances), nummod (3; 0% instances), parataxis (3; 0% instances), cop (2; 0% instances), mark (2; 0% instances), nsubj (2; 0% instances), obj (2; 0% instances), ccomp (1; 0% instances), dep (1; 0% instances), obl (1; 0% instances), obl:tmod (1; 0% instances)

Children of PROPN nodes belong to 14 different parts of speech: ADP (707; 46% instances), PROPN (323; 21% instances), NOUN (160; 10% instances), PUNCT (122; 8% instances), ADJ (72; 5% instances), CCONJ (70; 5% instances), VERB (39; 3% instances), PART (19; 1% instances), DET (12; 1% instances), NUM (7; 0% instances), PRON (7; 0% instances), ADV (3; 0% instances), AUX (2; 0% instances), SCONJ (2; 0% instances)