Treebank Statistics: UD_Urdu-UDTB: POS Tags: PROPN
There are 3716 PROPN
lemmas (32%), 3709 PROPN
types (29%) and 17135 PROPN
tokens (12%).
Out of 16 observed tags, the rank of PROPN
is: 2 in number of lemmas, 2 in number of types and 3 in number of tokens.
The 10 most frequent PROPN
lemmas: پی، سی، ایس، کانگریس، آئی، بی، ہندوستان، ریڈی، اے، سنگھ
The 10 most frequent PROPN
types: پی، سی، آئی، ایس، کانگریس، بی، ہندوستان، ریڈی، اے، سنگھ
The 10 most frequent ambiguous lemmas: پی (PROPN 350, NOUN 28, ADP 1), سی (PROPN 268, NOUN 11, PART 7, ADP 1), ایس (PROPN 236, NOUN 12), کانگریس (PROPN 235, ADJ 2, NOUN 2), آئی (PROPN 218, NOUN 9), بی (PROPN 216, NOUN 1), ریڈی (PROPN 183, NOUN 1, SCONJ 1), اے (PROPN 168, NOUN 11, PART 3), ٹی (PROPN 141, NOUN 13), ڈی (PROPN 139, NOUN 14)
The 10 most frequent ambiguous types: پی (PROPN 350, NOUN 18), سی (PROPN 268, NOUN 10, PART 7, VERB 2), آئی (PROPN 242, VERB 25, NOUN 9), ایس (PROPN 236, NOUN 12), کانگریس (PROPN 236, NOUN 3, ADJ 2), بی (PROPN 219, NOUN 1), ہندوستان (PROPN 197, NOUN 2), ریڈی (PROPN 184, NOUN 1), اے (PROPN 168, NOUN 11, PART 3), ٹی (PROPN 143, NOUN 13)
- پی
- سی
- PROPN 268: اس موقع پر گوتم پوشٹی اور ایس سی طبقہ کی خواتین کی کثیر تعداد موجود تھی ۔
- NOUN 10: اس موقع پر ایس ڈی سی مسٹر شیخ چاند کے علاوہ مسٹر وجیندر ، سی او بھی موجود تھے ۔
- PART 7: علی_الصبح بلاناغہ تھوڑی سی چہل_قدمی صحت کی نگہداشت کے لیے مفت اپنا علاج آپ ہے ۔
- VERB 2: عبدالرحمن انتولے نے بھی ہیمنت کرکرے کی ہلاکت کی تحقیقات کا مطالبہ کیا تو کانگریس ہائی کمان نے ان کے لب سی دیئے تھے ۔
- آئی
- ایس
- کانگریس
- PROPN 236: ضلعی کانگریس ہمیشہ دو گروپ مےں تقسیم رہی ہے ۔
- NOUN 3: کانگریس قائد نے کہا کہ صدر کانگریس سونیا گاندھی وہ پہلی سیاست_داں تھی , جنہوں نے اناہزارے کی تائید کی ۔
- ADJ 2: ویسے بھی یہی ضمنی انتخاب اےک کڑی ہے جس کے بعد بہت سے ایسے کانگریس قائدین ہےں جو دیوار پھلانگ کر جگن کی جماعت مےں شامل ہونے سے گریز نہیں کرےنگے ۔
- بی
- ہندوستان
- ریڈی
- اے
- ٹی
Morphology
The form / lemma ratio of PROPN
is 0.998116 (the average of all parts of speech is 1.103404).
The 1st highest number of forms (5) was observed with the lemma “اسلم”: 110F2007, I.A.No., O.S., ،, اسلم.
The 2nd highest number of forms (3) was observed with the lemma “اعجازبٹ”: اعجاز, اعجازبٹ, بٹ.
The 3rd highest number of forms (3) was observed with the lemma “اور”: 28, او, اور.
PROPN
occurs with 10 features: Case (17052; 100% instances), Number (17035; 99% instances), Person (17027; 99% instances), Gender (16889; 99% instances), VerbForm (6; 0% instances), Mood (3; 0% instances), Aspect (1; 0% instances), Echo (1; 0% instances), Polite (1; 0% instances), Tense (1; 0% instances)
PROPN
occurs with 16 feature-value pairs: Aspect=Imp
, Case=Acc
, Case=Nom
, Echo=Rdp
, Gender=Fem
, Gender=Masc
, Mood=Ind
, Mood=Sub
, Number=Plur
, Number=Sing
, Person=3
, Polite=Form
, Tense=Pres
, VerbForm=Fin
, VerbForm=Inf
, VerbForm=Part
PROPN
occurs with 28 feature combinations.
The most frequent feature combination is Case=Nom|Gender=Masc|Number=Sing|Person=3
(9509 tokens).
Examples: پی، سی، ایس، بی، آئی، ٹی، ڈی، محمد، آر، جے
Relations
PROPN
nodes are attached to their parents using 15 different relations: compound (8194; 48% instances), nmod (3756; 22% instances), nsubj (1866; 11% instances), obl (1706; 10% instances), conj (868; 5% instances), obj (370; 2% instances), iobj (236; 1% instances), root (43; 0% instances), dep (24; 0% instances), xcomp (23; 0% instances), acl (15; 0% instances), acl:relcl (15; 0% instances), dislocated (9; 0% instances), vocative (6; 0% instances), flat (4; 0% instances)
Parents of PROPN
nodes belong to 10 different parts of speech: PROPN (9680; 56% instances), VERB (3830; 22% instances), NOUN (3254; 19% instances), ADJ (261; 2% instances), (43; 0% instances), PRON (34; 0% instances), ADV (15; 0% instances), NUM (15; 0% instances), DET (2; 0% instances), PART (1; 0% instances)
9102 (53%) PROPN
nodes are leaves.
2233 (13%) PROPN
nodes have one child.
2479 (14%) PROPN
nodes have two children.
3321 (19%) PROPN
nodes have three or more children.
The highest child degree of a PROPN
node is 35.
Children of PROPN
nodes are attached using 22 different relations: compound (8595; 42% instances), case (5975; 29% instances), nmod (2112; 10% instances), conj (953; 5% instances), punct (741; 4% instances), dep (617; 3% instances), cc (462; 2% instances), amod (450; 2% instances), acl:relcl (92; 0% instances), nummod (83; 0% instances), nsubj (58; 0% instances), dislocated (50; 0% instances), cop (48; 0% instances), det (41; 0% instances), obl (21; 0% instances), acl (9; 0% instances), mark (9; 0% instances), obj (8; 0% instances), advmod (5; 0% instances), flat (4; 0% instances), iobj (3; 0% instances), advcl (2; 0% instances)
Children of PROPN
nodes belong to 14 different parts of speech: PROPN (9680; 48% instances), ADP (6028; 30% instances), NOUN (2100; 10% instances), PUNCT (741; 4% instances), PART (592; 3% instances), CCONJ (449; 2% instances), ADJ (319; 2% instances), VERB (148; 1% instances), NUM (92; 0% instances), PRON (63; 0% instances), AUX (48; 0% instances), DET (33; 0% instances), ADV (25; 0% instances), SCONJ (20; 0% instances)