Treebank Statistics: UD_Urdu-UDTB: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem, Masc.
74073 tokens (54%) have a non-empty value of Gender.
8867 types (82%) occur at least once with a non-empty value of Gender.
7852 lemmas (82%) occur at least once with a non-empty value of Gender.
The feature is used with 14 part-of-speech tags: NOUN (32504; 24% instances), PROPN (16889; 12% instances), ADP (10419; 8% instances), VERB (7550; 5% instances), AUX (3999; 3% instances), ADJ (1441; 1% instances), PRON (614; 0% instances), ADV (441; 0% instances), DET (115; 0% instances), PART (47; 0% instances), NUM (45; 0% instances), CCONJ (6; 0% instances), X (2; 0% instances), SCONJ (1; 0% instances).
NOUN
32504 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Person=3 (32398; 100%), Number=Sing (27377; 84%), Case=Acc (17103; 53%).
NOUN tokens may have the following values of Gender:
Fem(6073; 19% of non-emptyGender): حکومت، پولیس، بات، پارٹی، کارروائی، کمیٹی، ریاست، ٹیم، کوشش، ہدایتMasc(26431; 81% of non-emptyGender): حاصل، آج، عوام، ضلع، اجلاس، افراد، سال، طور، طرح، ارکانEMPTY(465): اللہ، علیہ، مرکزی، صلی، مرحوم، وسلم، انتخابی، رضی، نقصان، دونوں
| Paradigm حکومت | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing | حکومت | حکومت |
| Case=Acc|Number=Plur | حکومتوں | حکومتوں, حکومتیں |
| Case=Nom|Number=Sing | حکومت | حکومت |
| Case=Nom|Number=Plur | حکومتیں | حکومتیں |
PROPN
16889 PROPN tokens (99% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Person=3 (16879; 100%), Number=Sing (16829; 100%), Case=Nom (9869; 58%).
PROPN tokens may have the following values of Gender:
Fem(654; 4% of non-emptyGender): پارٹی، مسجد، دہلی، کانگریس، اردو، سونیا، سبھا، کمیٹی، حکومت، ریاستMasc(16235; 96% of non-emptyGender): پی، سی، آئی، ایس، کانگریس، بی، ہندوستان، اے، ٹی، ریڈیEMPTY(246): ریڈی، سنگھ، گاندھی، کرت، ریاستی، صدیقی، نائیڈو، برائے، سبھروال، و
| Paradigm پی | Masc | Fem |
|---|---|---|
| Case=Acc | پی | پی |
| Case=Nom | پی, بی | پی |
Gender seems to be lexical feature of PROPN. 96% lemmas (3558) occur only with one value of Gender.
ADP
10419 ADP tokens (37% of all ADP tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADP and Gender co-occurred: Number=Sing (10069; 97%), AdpType=Post (9908; 95%), Case=Nom (5615; 54%).
ADP tokens may have the following values of Gender:
Fem(3739; 36% of non-emptyGender): کی، وجہ، جانب، حیثیت، والی، مدد، طرف، غرض، کو، کےMasc(6680; 64% of non-emptyGender): کے، کا، بعد، جانب، ساتھ، دوران، قبل، ذریعہ، پاس، زیرEMPTY(17387): نے، سے، کے، مےں، کو، پر، میں، لیے، تک، خلاف
| Paradigm کا | Masc | Fem |
|---|---|---|
| AdpType=Post | کے | |
| AdpType=Post|Case=Acc | کی | |
| AdpType=Post|Case=Acc|Number=Sing | کے, کا, کی, سے, نے | کی, کے, والی, کا |
| AdpType=Post|Case=Acc|Number=Sing|Person=3 | کا, کے | |
| AdpType=Post|Case=Acc|Number=Sing|Person=3|Polite=Form | کے | |
| AdpType=Post|Case=Acc|Number=Plur | کے | کی |
| AdpType=Post|Case=Acc|Number=Plur|Person=3|Polite=Form | کے | |
| AdpType=Post|Case=Nom|Number=Sing | کا, کے, کی | کی, کا, کو, کے |
| AdpType=Post|Case=Nom|Number=Sing|Person=3 | کی | |
| AdpType=Post|Case=Nom|Number=Sing|Person=3|Polite=Form | کے | |
| AdpType=Post|Case=Nom|Number=Plur | کے | کی |
| AdpType=Post|Case=Nom|Number=Plur|Person=3 | کے | |
| AdpType=Post|Case=Nom|Number=Plur|Person=3|Polite=Form | کے | |
| AdpType=Post|Number=Sing | کا | کی |
| AdpType=Post|Number=Sing|Person=3 | کا | |
| Aspect=Perf|Case=Nom|Number=Sing|VerbForm=Part | کی | |
| Case=Acc | کے | |
| Case=Acc|Number=Sing | کے | |
| Case=Acc|Number=Plur | کے | |
| Case=Nom|Number=Sing | کے | کی |
VERB
7550 VERB tokens (59% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Case=EMPTY (7440; 99%), Person=EMPTY (6616; 88%), VerbForm=Part (6484; 86%), Number=Sing (6409; 85%), Aspect=Perf (5388; 71%), Voice=Act (4884; 65%).
VERB tokens may have the following values of Gender:
Fem(1872; 25% of non-emptyGender): کی، دی، ہوئی، ہوگی، ہوتی، بتائی، لی، چکی، رہی، آئیMasc(5678; 75% of non-emptyGender): کیا، کہا، دیا، کرتے، بتایا، لیا، ہوا، کیے، ہوگا، کرناEMPTY(5145): کر، ہو، کرنے، ہے، ہونے، کریں، دینے، ہوئے، دے، رکھنے
| Paradigm کرنا | Masc | Fem |
|---|---|---|
| Aspect=Imp|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | کرتے | کرتیں |
| Aspect=Imp|Number=Sing|VerbForm=Part | کرتے, کرتا | کرتی, کرتے |
| Aspect=Imp|Number=Sing|VerbForm=Part|Voice=Act | کرتا, کرتے | کرتی |
| Aspect=Imp|Number=Plur|VerbForm=Part | کرتے | |
| Aspect=Imp|Number=Plur|VerbForm=Part|Voice=Act | کرتے | کرتیں |
| Aspect=Perf|Case=Acc|Number=Sing|Person=3|VerbForm=Part | کیے | |
| Aspect=Perf|Case=Acc|Number=Sing|VerbForm=Part | کئے, کیے | کی |
| Aspect=Perf|Case=Nom|Number=Sing|VerbForm=Part|Voice=Act | کی | |
| Aspect=Perf|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | کئے | |
| Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | کئے, کیا, کیے | |
| Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Act | کیا, کئے, کر, کی | کی |
| Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Pass | کئے, کیے | کی |
| Aspect=Perf|Number=Sing|VerbForm=Part | کیا, کئے, کرتے, کیے | کی, کیے |
| Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Act | کیا, کیے, کئے, کر, کی | کی, کریں |
| Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Pass | کیا, کئے, کیے | کی |
| Aspect=Perf|Number=Plur|Person=3|VerbForm=Part | کیے | |
| Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Act | کئے, کیے, کیں | کیں |
| Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Pass | کیے | |
| Aspect=Perf|Number=Plur|VerbForm=Part | کیے, کئے | |
| Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Act | کیے, کئے, کریں | کیں |
| Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Pass | کیے, کئے | |
| Aspect=Perf|Person=3|VerbForm=Part | کیے | |
| Aspect=Perf|VerbForm=Part|Voice=Act | کیے | |
| Case=Acc|Number=Sing|Person=3|Voice=Pass | کی | |
| Case=Acc|Number=Plur|VerbForm=Inf | کرنے | |
| Case=Acc|VerbForm=Inf | کرنے | |
| Case=Nom|Number=Sing|VerbForm=Inf | کرنا | |
| Case=Nom|Number=Sing|Voice=Act | کی | |
| Case=Nom|Number=Plur|Person=3|Voice=Act | کر | |
| Case=Nom|VerbForm=Inf | کرنے | |
| Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کریںگے | |
| Mood=Ind|Number=Sing|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کریگا, کرےگا | کرےگی, کریں_گی, کریگی |
| Mood=Ind|Number=Sing|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے | کرےگی, کریں_گی |
| Mood=Ind|Number=Plur|Person=3|Polite=Form|Tense=Fut|VerbForm=Fin|Voice=Act | کرینگے | |
| Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کرےنگے | کریں_گی |
| Mood=Ind|Number=Plur|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کرےنگے | کریں_گی |
| Mood=Sub|Number=Sing|Person=3|Polite=Form|VerbForm=Fin|Voice=Act | کریں_گے, کریں | |
| Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | کریں, کرے | |
| Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Pass | کریں | |
| Mood=Sub|Number=Sing|VerbForm=Fin|Voice=Act | کریں | |
| Mood=Sub|Number=Sing|VerbForm=Fin|Voice=Pass | کریں | |
| Mood=Sub|Number=Plur|Person=3|VerbForm=Fin|Voice=Act | کریں | |
| Mood=Sub|Number=Plur|Person=3|VerbForm=Fin|Voice=Pass | کریں | کریں |
| Mood=Sub|Number=Plur|VerbForm=Fin|Voice=Act | کریں | |
| Mood=Sub|Number=Plur|VerbForm=Fin|Voice=Pass | کریں | |
| Number=Sing|Person=3 | کیے, کر | |
| Number=Sing|Person=3|VerbForm=Inf|Voice=Pass | کرنی | |
| Number=Sing|Person=3|Voice=Act | کرےگا, کیا, کر, کریں_گے | کرےگی, کی |
| Number=Sing|VerbForm=Inf | کرنا | |
| Number=Sing|VerbForm=Inf|Voice=Act | کرنا, کرنے | کرنی |
| Number=Sing|VerbForm=Inf|Voice=Pass | کرنا | کرنی |
| Number=Sing|Voice=Act | کیا, کر, کرےگا, کہا | کریں, کی |
| Number=Sing|Voice=Pass | کیا | کی |
| Number=Plur|VerbForm=Inf | کرنے | |
| Number=Plur|VerbForm=Inf|Voice=Act | کرنے | کرنی |
| Number=Plur|VerbForm=Inf|Voice=Pass | کرنے | |
| VerbForm=Inf | کرنے |
AUX
3999 AUX tokens (44% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Voice=EMPTY (3739; 93%), Number=Sing (2943; 74%), Person=EMPTY (2650; 66%), Tense=EMPTY (2450; 61%), Mood=EMPTY (2394; 60%), VerbForm=Part (2282; 57%).
AUX tokens may have the following values of Gender:
Fem(1105; 28% of non-emptyGender): گئی، تھی، رہی، گی، سکتی، جاتی، جائےگی، تھیں، ہوئی، گئیںMasc(2894; 72% of non-emptyGender): گیا، تھا، تھے، گئے، ہیں، رہے، رہا، سکتا، جائےگا، گےEMPTY(5122): ہے، ہوئے، ہےں، ہیں، جا، کر، جائے، جانے، چاہیے، ہوں
| Paradigm ہے | Masc | Fem |
|---|---|---|
| Aspect=Perf|Number=Sing|VerbForm=Part | ہوا, ہے | ہے |
| Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Pres|VerbForm=Fin | ہیں | ہیں |
| Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں | ہیں |
| Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin | ہے, ہیں | ہیں |
| Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں, ہے | ہیں |
| Mood=Ind|Number=Sing|Tense=Pres|VerbForm=Fin | ہیں, ہے | ہیں |
| Mood=Ind|Number=Sing|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں | |
| Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | ہوں_گے | |
| Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin | ہیں, ہےں | ہیں |
| Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں | ہیں |
| Mood=Ind|Number=Plur|Tense=Pres|VerbForm=Fin | ہیں, ہے | ہیں |
| Mood=Ind|Number=Plur|Tense=Pres|VerbForm=Fin|Voice=Act | ہیں | ہیں |
ADJ
1441 ADJ tokens (14% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (926; 64%).
ADJ tokens may have the following values of Gender:
Fem(475; 33% of non-emptyGender): والی، دوسری، بڑی، پہلی، پوری، نئی، آخری، خصوصی، اچھی، سیاسیMasc(966; 67% of non-emptyGender): والے، بڑے، والا، دوسرے، والوں، نئے، پہلے، پہلا، دوسرا، بڑاEMPTY(9074): جاری، شامل، دیگر، سابق، موجود، پیدا، ہلاک، منعقد، ریاستی، سرکاری
| Paradigm والا | Masc | Fem |
|---|---|---|
| _ | والی | |
| Case=Acc | والی | |
| Case=Acc|Number=Sing | والے, والا | والی |
| Case=Acc|Number=Sing|Person=3 | والا | |
| Case=Acc|Number=Plur | والے, والوں | |
| Case=Nom | والی | |
| Case=Nom|Number=Sing | والا, والے | والی |
| Case=Nom|Number=Sing|Person=3 | والا | |
| Case=Nom|Number=Plur | والے | |
| Number=Sing | والا | والی |
| Number=Sing|Person=3 | والا, والے | والی |
| Number=Plur | والے | والی |
PRON
614 PRON tokens (11% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: PronType=Prs (562; 92%), Number=Sing (406; 66%), Polite=EMPTY (403; 66%), Case=Acc (308; 50%).
PRON tokens may have the following values of Gender:
Fem(139; 23% of non-emptyGender): اپنی، ہماری، میری، انہیں، تمہاری، اتنی، اسی، ان، اُس، ایسیMasc(475; 77% of non-emptyGender): انہوں، انہیں، اپنے، ایسا، ہمارے، ایسے، اُنھوں، انھیں، اپنا، دوسرےEMPTY(4983): اس، وہ، ان، انہوں، جو، جس، یہ، اپنے، کوئی، کسی
| Paradigm وہ | Masc | Fem |
|---|---|---|
| Case=Acc,Dat|Number=Sing|Polite=Form|PronType=Prs | انہیں, انہوں, انھیں, انھوں, اُنھیں | انہیں |
| Case=Acc,Dat|Number=Sing|PronType=Prs | انھیں | |
| Case=Acc,Dat|Number=Plur|PronType=Prs | انھیں, انہیں | |
| Case=Acc|Number=Sing | اُس | اُس |
| Case=Acc|Number=Sing|Polite=Form | اُن, انہوں | |
| Case=Acc|Number=Sing|Polite=Form|PronType=Prs | انہوں, اُنھوں, انھوں, ان | |
| Case=Acc|Number=Sing|PronType=Prs | اُس, انہوں, اُن | |
| Case=Acc|Number=Plur | اُن | |
| Case=Acc|Number=Plur|Polite=Form|PronType=Prs | انہوں | |
| Case=Acc|Number=Plur|PronType=Prs | انہوں | ان |
| Case=Nom|Number=Sing|Polite=Form|PronType=Prs | انھوں, اُنھیں | |
| Case=Nom|Number=Plur|PronType=Prs | انہیں | |
| Number=Sing|Polite=Form|PronType=Prs | انہوں |
ADV
441 ADV tokens (32% of all ADV tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADV and Gender co-occurred: AdvType=EMPTY (440; 100%), Number=Sing (437; 99%), Person=3 (408; 93%), Case=Nom (398; 90%), AdpType=Post (372; 84%).
ADV tokens may have the following values of Gender:
Fem(5; 1% of non-emptyGender): بڑی، جانب، آس، کافیMasc(436; 99% of non-emptyGender): پیش، بعد، پہلے، دوران، جانب، طرف، آگے، باہر، سامنے، قبلEMPTY(945): پھر، بہت، سے، مزید، پیش، دوبارہ، جلد، انتہائی، ہمیشہ، ہنوز
| Paradigm جانب | Masc | Fem |
|---|---|---|
| AdpType=Post|Case=Acc | جانب | |
| AdpType=Post|Case=Nom | جانب, عنقریب | جانب |
| Case=Acc | جانب |
Gender seems to be lexical feature of ADV. 98% lemmas (53) occur only with one value of Gender.
DET
115 DET tokens (5% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (102; 89%), Person=EMPTY (96; 83%), PronType=Dem (91; 79%), Case=Nom (68; 59%).
DET tokens may have the following values of Gender:
Fem(18; 16% of non-emptyGender): ایسی، اسی، انہیں، بڑی، تھوڑی، جتنی، ساریMasc(97; 84% of non-emptyGender): ایسے، ایسا، یہ، اتنا، اسی، سارے، پورے، ایسی، دوسرے، کیاEMPTY(2381): اس، یہ، ان، کئی، تمام، کچھ، اسی، ہر، چند، کوئی
| Paradigm یہ | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing | اسی | اسی |
| Case=Acc|Number=Plur | ایسی | |
| Case=Nom|Number=Sing|Person=3 | یہ, اسی | |
| Case=Nom|Number=Sing | اس, اسی | اسی |
| Case=Nom|Number=Plur | ایسی | |
| Number=Sing|Person=3 | یہ |
PART
47 PART tokens (2% of all PART tokens) have a non-empty value of Gender.
The most frequent other feature values with which PART and Gender co-occurred: Polarity=EMPTY (47; 100%), PronType=EMPTY (47; 100%).
PART tokens may have the following values of Gender:
Fem(2; 4% of non-emptyGender): مسٹر، ویںMasc(45; 96% of non-emptyGender): مسٹر، کرام، جناب، حضرت، مسز، کے، بلا، بھلے، تعالی، تعالیٰEMPTY(2993): بھی، نہیں، مسٹر، ہی، نہ، صرف، جناب، کہ، تو، بغیر
| Paradigm مسٹر | Masc | Fem |
|---|---|---|
| Case=Nom | مسٹر | مسٹر |
| مسٹر |
Gender seems to be lexical feature of PART. 95% lemmas (19) occur only with one value of Gender.
NUM
45 NUM tokens (2% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (45; 100%).
NUM tokens may have the following values of Gender:
Fem(3; 7% of non-emptyGender): تینوں، دوسری، پہلیMasc(42; 93% of non-emptyGender): دونوں، کروڑ، ایک، ہزار، 30، اےک، لاکھ، 02، 101، 29EMPTY(2416): اےک، ایک، دو، تین، دونوں، لاکھ، چار، ہزار، پانچ، کروڑ
| Paradigm تین | Masc | Fem |
|---|---|---|
| تینوں | تینوں |
Gender seems to be lexical feature of NUM. 96% lemmas (22) occur only with one value of Gender.
CCONJ
6 CCONJ tokens (0% of all CCONJ tokens) have a non-empty value of Gender.
CCONJ tokens may have the following values of Gender:
Fem(1; 17% of non-emptyGender): وMasc(5; 83% of non-emptyGender): و، آیا، اور، تاہمEMPTY(3242): اور، و، لیکن، جبکہ، تاہم، یا، مگر، نیز، لہذا، آیا
X
2 X tokens (14% of all X tokens) have a non-empty value of Gender.
The most frequent other feature values with which X and Gender co-occurred: Foreign=EMPTY (2; 100%), Number=Sing (2; 100%), Person=3 (2; 100%).
X tokens may have the following values of Gender:
Masc(2; 100% of non-emptyGender): افسوسEMPTY(12): کتنے، ئن، خدارا، را، لوڈ، نئچ، نسبتاً، واقعی، چۓۓپ، ڈان
SCONJ
1 SCONJ tokens (0% of all SCONJ tokens) have a non-empty value of Gender.
SCONJ tokens may have the following values of Gender:
Masc(1; 100% of non-emptyGender): ،EMPTY(2672): کہ، تو، اگر، کیونکہ، تاکہ، بلکہ، حالانکہ، چنانچہ، ,، کیوںکہ
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
PROPN –[compound]–> PROPN (7500; 92%),
NOUN –[nmod]–> NOUN (4376; 69%),
NOUN –[nmod]–> PROPN (2271; 77%),
NOUN –[compound]–> NOUN (1863; 81%),
PROPN –[nmod]–> NOUN (1175; 88%),
VERB –[nsubj]–> PROPN (932; 55%),
NOUN –[conj]–> NOUN (837; 76%),
PROPN –[conj]–> PROPN (690; 93%),
PROPN –[nmod]–> PROPN (650; 89%),
PROPN –[compound]–> NOUN (414; 93%).