home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Sindhi-Isra: POS Tags: PROPN

There are 595 PROPN lemmas (10%), 1118 PROPN types (10%) and 4290 PROPN tokens (5%). Out of 15 observed tags, the rank of PROPN is: 4 in number of lemmas, 4 in number of types and 8 in number of tokens.

The 10 most frequent PROPN lemmas: _, سنڌ, پاڪستان, علي, ڪراچي, پ, محمد, آمريڪا, احمد, اسلام

The 10 most frequent PROPN types: سنڌ, پاڪستان, علي, ڪراچي, پ, محمد, آمريڪا, ماليڪٽ, احمد, اسلام

The 10 most frequent ambiguous lemmas: _ (NOUN 3850, PROPN 838, VERB 185, ADJ 66, NUM 58, ADV 30, ADP 24, PART 24, PUNCT 22, PRON 17, AUX 16, SCONJ 9, DET 8, INTJ 2, CCONJ 1), پ (PROPN 60, NOUN 3), محمد (PROPN 57, NOUN 1), نواز (PROPN 36, NOUN 3), آباد (PROPN 33, NOUN 22, ADJ 1), شريف (PROPN 30, NOUN 3), مارئي (PROPN 27, NOUN 1), غلام (PROPN 26, NOUN 5), ايم (PROPN 25, NOUN 20), بلوچستان (PROPN 25, NOUN 3)

The 10 most frequent ambiguous types: پ (PROPN 60, NOUN 3), محمد (PROPN 57, NOUN 1), نواز (PROPN 36, NOUN 3), آباد (PROPN 33, NOUN 22, ADJ 1), شريف (PROPN 30, NOUN 3), آئرلينڊ (PROPN 29, NOUN 1), مارئي (PROPN 27, NOUN 1), غلام (PROPN 26, NOUN 5), ايم (PROPN 25, NOUN 20), بلوچستان (PROPN 25, NOUN 3)

Morphology

The form / lemma ratio of PROPN is 1.878992 (the average of all parts of speech is 1.872520).

The 1st highest number of forms (526) was observed with the lemma “_”: B.T, Becher, Body, Chukovsky, Johannes, Kornei, Powel, Rabuhi, Thousand, Toper, Vagram, https://www.facebook.com/Birdsofsindh/, https://www.facebook.com/groups/499653667487200/, talpuraltaf@gmail.com, آئيفون, آمده, آمري, آمريءَ, آوانگ, آچر, ائشيلس, احسان, احمدپور, اختيار, ادا, اربن, ارسطوءَ, ارشاد, ارشد, اساما, اسامابن, اسد, اسموديز, اسپيني, اشتياق, اشفاق, اشوڪ, اصغر, اعتبار, اعجاز, اعواڻ, افريقا, افشان, افغان, الاول, المبارڪ, المرتضيٰ, اليگزينڊر, امام, امداد, امير, انجنيئر, انصاري, انڊر, انڊو, انگريزي, انگلينڊ, اويس, اوڍاڻو, اوڏ, ايشين, ايف, ايلزبيٿ, ايواڪاڊو, ايوب, اُڌر, اِڌر, اٽالين, اڪرام, اڪولا, اڱاري, ب, بائيبل, بابا, بابو, بالي, بتارا, بخاري, برادي, برهان, برٽن, برڪت, برگيڊيئر, بسون, بشير, بلوچ, بليدي, بن, بنون, بنگالي, بنگلاديش, بهادر, بهڻ, بورڊ, بيدي, بيلفاسٽ, بيورورپورٽ, بڙدي, تاج, تربيلا, ترجمو, تمراڻي, توقير, تونسا, تيره, ثمرين, جئه, جائوز, جارج, جاپان, جت, جرمن, جل, جمشيد, جنيد, جهان, جهرڪي, جهلم, جهنگل, جهڏو, جون, جوهي, جوڻيجي, جي, جيرالڊ, جيلس, جيمس, حامد, حبيب, حسنه, حسيب, حسينيه, حفيظ, حميدان, حميرا, حنا, حنيف, حوا, حڪيم, خادم, خارجا, خانزادو, خاور, خير, دادو, دراوت, درزاب, دوداڻي, ديوي, دھلي, ذرا, ر, راجيش, راشد, رام, رانجهن, راهوجو, راڄڙ, راڌڻ, ربيع, ربيلائيز, رتوديرو, رتيديري, رحمان, رحمت, رخ, رخسانه, رزاق, رسول, رضاآباد, رفيق, روس, روسي, روپاڻي, رياض, رينجرز, ريپبلڪ, ريڊيو, رچرڊ, رڪشا, زاهده, زليخان, زمان, زنئور, زوار, زيبا, ساجده, سامي, سانڊي, سانگهڙ, ساڪرو, ساگر, سبطين, ستار, سجاد, سجاول, سر, سراج, سردار, سرفراز, سرور, سري, سرگر, سعد, سعوديه, سعيد, سلطان, سلمان, سميري, سن, سنگ, سنگهه, سوئو, سوئي, سوتون, سوپ, سي, سيارو, سيانتو, سيد, سيريل, سيشلز, سيف, سيفو, سيليبرٽي, سين, سينيان, سينٽرل, سينگاپور, سيوهڻ, سپر, سپريم, سڀاش, سڪرنڊ, سڪسز, سڪندر, سڪوئيڊ, شاهد, شاهده, شاهين, شاڪر, شاھده, شبانه, شبير, شجاع, شجاعت, شرما, شفيع, شفيق, شن, شهباز, شهدادڪوٽ, شهريار, شهزاد, شهزاده, شهمير, شهيد, شوڪت, شير, صدف, صديقي, صنوبر, ضراب, ضلعوUK, طلحه, ع, عادل, عارفاڻي, عاشق, عاشن, عالم, عامر, عباس, عبدالجبار, عبدالحميد, عبدالعزيز, عبدالغفور, عبدالقادر, عبداللطيف, عبدالواحد, عربي, عروسه, عزيز, عزيزالله, عشر, عصمت, عطائي, عقيل, عنايت, عيسوي, غزالي, ف, فاروق, فاٽا, فتيانه, فرانسيسي, فرخ, فريد, فلور, فلپائين, فياض, فيصل, فيڊرل, فٽز, ق, قائره, قاري, قطرينا, قلندر, قمرالزمان, قمرالنساءِ, قنڌار, لا, لائوس, لادن, لارا, لاشاري, لالا, لبريشن, لعل, لغاري, لمبو, لمس, لنڪا, لومڙيءَ, لوهار, لياري, ماليڪٽ, مالھي, ماڃوٺي, متحده, مجيد, مجيدان, محبوب, محر, محمود, مراد, مريضه, مسلم, مسڪان, مصطفيٰ, مغيري, مقبول, مقتول, مقرن, ملائيشيا, ملاح, ملازم, ملير, ممبئي, من, منظور, منور, منيش, مهاتما, مهاجر, مهاڻي, مهدي, مهراج, مهمند, مهوش, موراڻي, مورو, مولانا, موهن, موومينٽ, ميرس, ميرواهه, ميرپورخاص, مينڌرو, مينگهواڙ, ميڊيڪل, مٺل, مڪسل, ن, نامهءِ, نجف, نجم, نسرين, نسيم, نصرت, نعمان, نعيم, نوڪدار, نيشيا, نيٽو, نيپال, هائيڊپارڪ, هارون, هتام, هلينا, هليو, همايون, هندستان, هندوستان, هونگ, هٽلر, هڪڙو, واجد, واحد, واسي, واشنگٽن, وانتيز, وانگ, وزير, وقار, ولڀ, وومين, ووڊ, ويهڙ, ويٽنام, وڳڻ, يسوع, يورپي, يوناني, يوٿ, ٺري, ٺڪر, ٻانڀڻ, ٻنڊو, ٻوڏ, ٻڌ, ٽالسٽاءِ, ٽنڊوباگو, ٽيڪساس, پاراچنار, پاشا, پاپوش, پبلڪ, پتافي, پجاجارن, پرار, پروين, پريالوءِ, پريم, پرڪاش, پـُـشڪن, پلئٽو, پليجو, پنهون, پيرمظهر, پيٽارو, پيپلزپا, پيپلزپارٽي, پيچر, پڊعيدن, پکو, پگوڊا, ٿائو, ٿائوکام, ٿل, ٿهيم, ڀئونر, ڀائي, ڀون, ڀيل, ڄامشوري, چانور, چانڊي, چاچڙ, چاچڙان, چشما, چناب, چندا, چندر, چنگچي, ڊ, ڊائو, ڊاڪٽر, ڊبلن, ڊبوري, ڊيٽول, ڏوگر, ڏھرڪي, کارادر, کام, کاٽائو, کمير, کن, ڪائولانگ, ڪائونٽي, ڪارونجهر, ڪاشف, ڪاليج, ڪاوش, ڪاٺير, ڪاٽو, ڪرم, ڪشش, ڪفگير, ڪلادي, ڪلثوم, ڪلوز, ڪمار, ڪنب, ڪنبوه, ڪنگري, ڪهوٽا, ڪوئلو, ڪوئلي, ڪوثر, ڪورائي, ڪوريا, ڪوريجو, ڪوش, ڪولهي, ڪولوف, ڪوهستان, ڪوٽڏيجي, ڪوٽڪئي, ڪياني, ڪيري, ڪيف, گارڊا, گدو, گرناڻي, گل, گلال, گلشن, گمارنگ, گواڪامول, گوھر, گيهلپور, ڳڙھي, ھارڊ, ’مـُون‘.

The 2nd highest number of forms (3) was observed with the lemma “سنڌ”: سنڌ, سنڌي, سنڌين.

The 3rd highest number of forms (2) was observed with the lemma “اُٻاوڙو”: اُٻاوڙو, اُٻاوڙي.

PROPN occurs with 3 features: Case (4289; 100% instances), Gender (4272; 100% instances), Number (475; 11% instances)

PROPN occurs with 7 feature-value pairs: Case=Abl, Case=Acc, Case=Nom, Case=Voc, Gender=Fem, Gender=Masc, Number=Sing

PROPN occurs with 15 feature combinations. The most frequent feature combination is Case=Nom|Gender=Masc (3139 tokens). Examples: علي, پاڪستان, محمد, ڪراچي, آمريڪا, اسلام, نواز, الله, احمد, آصف

Relations

PROPN nodes are attached to their parents using 21 different relations: nmod (1181; 28% instances), compound (1008; 23% instances), nsubj (515; 12% instances), obl (499; 12% instances), flat (481; 11% instances), conj (337; 8% instances), obj (103; 2% instances), iobj (52; 1% instances), root (35; 1% instances), parataxis (25; 1% instances), dislocated (13; 0% instances), appos (8; 0% instances), vocative (8; 0% instances), advcl (7; 0% instances), amod (5; 0% instances), discourse (4; 0% instances), nsubj:pass (3; 0% instances), ccomp (2; 0% instances), xcomp (2; 0% instances), dep (1; 0% instances), nmod:poss (1; 0% instances)

Parents of PROPN nodes belong to 11 different parts of speech: NOUN (1894; 44% instances), PROPN (1162; 27% instances), VERB (1046; 24% instances), ADJ (74; 2% instances), NUM (37; 1% instances), (35; 1% instances), ADV (20; 0% instances), AUX (10; 0% instances), PRON (8; 0% instances), DET (3; 0% instances), ADP (1; 0% instances)

2020 (47%) PROPN nodes are leaves.

1160 (27%) PROPN nodes have one child.

645 (15%) PROPN nodes have two children.

465 (11%) PROPN nodes have three or more children.

The highest child degree of a PROPN node is 29.

Children of PROPN nodes are attached using 24 different relations: case (1308; 32% instances), nmod (748; 18% instances), flat (494; 12% instances), conj (447; 11% instances), compound (384; 9% instances), punct (356; 9% instances), cc (122; 3% instances), amod (94; 2% instances), cop (32; 1% instances), advmod:emph (29; 1% instances), nsubj (23; 1% instances), nummod (23; 1% instances), appos (17; 0% instances), det (12; 0% instances), advmod (9; 0% instances), dep (9; 0% instances), acl (8; 0% instances), mark (8; 0% instances), obl (6; 0% instances), advcl (2; 0% instances), discourse (2; 0% instances), parataxis (2; 0% instances), acl:relcl (1; 0% instances), ccomp (1; 0% instances)

Children of PROPN nodes belong to 15 different parts of speech: ADP (1312; 32% instances), PROPN (1162; 28% instances), NOUN (850; 21% instances), PUNCT (356; 9% instances), CCONJ (122; 3% instances), ADJ (104; 3% instances), NUM (88; 2% instances), PART (35; 1% instances), AUX (32; 1% instances), DET (21; 1% instances), ADV (18; 0% instances), VERB (15; 0% instances), PRON (13; 0% instances), SCONJ (7; 0% instances), INTJ (2; 0% instances)