Treebank Statistics: UD_Urdu-UDTB: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
74077 tokens (54%) have a non-empty value of Gender
.
8868 types (82%) occur at least once with a non-empty value of Gender
.
7796 lemmas (82%) occur at least once with a non-empty value of Gender
.
The feature is used with 14 part-of-speech tags: NOUN (32504; 24% instances), PROPN (16891; 12% instances), ADP (10777; 8% instances), VERB (6845; 5% instances), AUX (4732; 3% instances), ADJ (1053; 1% instances), PRON (614; 0% instances), ADV (441; 0% instances), DET (115; 0% instances), PART (47; 0% instances), NUM (45; 0% instances), CCONJ (6; 0% instances), X (6; 0% instances), SCONJ (1; 0% instances).
NOUN
32504 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Person=3 (32398; 100%), Number=Sing (27377; 84%), Case=Acc (17103; 53%).
NOUN
tokens may have the following values of Gender
:
Fem
(6073; 19% of non-emptyGender
): حکومت، پولیس، بات، پارٹی، کارروائی، کمیٹی، ریاست، ٹیم، کوشش، ہدایتMasc
(26431; 81% of non-emptyGender
): حاصل، آج، عوام، ضلع، اجلاس، افراد، سال، طور، طرح، ارکانEMPTY
(465): اللہ، علیہ، مرکزی، صلی، مرحوم، وسلم، انتخابی، رضی، نقصان، دونوں
Paradigm حکومت | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | حکومت | حکومت |
Case=Acc|Number=Plur | حکومتوں | حکومتوں, حکومتیں |
Case=Nom|Number=Sing | حکومت | حکومت |
Case=Nom|Number=Plur | حکومتیں | حکومتیں |
PROPN
16891 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Person=3 (16881; 100%), Number=Sing (16831; 100%), Case=Nom (9870; 58%).
PROPN
tokens may have the following values of Gender
:
Fem
(654; 4% of non-emptyGender
): پارٹی، مسجد، دہلی، کانگریس، اردو، سونیا، سبھا، کمیٹی، حکومت، ریاستMasc
(16237; 96% of non-emptyGender
): پی، سی، آئی، ایس، کانگریس، بی، ہندوستان، اے، ٹی، ریڈیEMPTY
(246): ریڈی، سنگھ، گاندھی، کرت، ریاستی، صدیقی، نائیڈو، برائے، سبھروال، و
Paradigm پی | Masc | Fem |
---|---|---|
Case=Acc | پی | پی |
Case=Nom | پی, بی | پی |
Gender
seems to be lexical feature of PROPN
. 96% lemmas (3559) occur only with one value of Gender
.
ADP
10777 ADP tokens (38% of all ADP
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADP
and Gender
co-occurred: AdpType=Post (10265; 95%), Number=Sing (10260; 95%), Case=Nom (5719; 53%).
ADP
tokens may have the following values of Gender
:
Fem
(3808; 35% of non-emptyGender
): کی، وجہ، والی، جانب، حیثیت، مدد، طرف، غرض، کو، کےMasc
(6969; 65% of non-emptyGender
): کے، کا، بعد، والے، جانب، ساتھ، دوران، قبل، ذریعہ، پاسEMPTY
(17387): نے، سے، کے، مےں، کو، پر، میں، لیے، تک، خلاف
Paradigm کا | Masc | Fem |
---|---|---|
AdpType=Post | کے | |
AdpType=Post|Case=Acc | کی | |
AdpType=Post|Case=Acc|Number=Sing | کے, کا, کی, سے, نے | کی, کے, والی, کا |
AdpType=Post|Case=Acc|Number=Sing|Person=3 | کا, کے | |
AdpType=Post|Case=Acc|Number=Sing|Person=3|Polite=Form | کے | |
AdpType=Post|Case=Acc|Number=Plur | کے | کی |
AdpType=Post|Case=Acc|Number=Plur|Person=3|Polite=Form | کے | |
AdpType=Post|Case=Nom|Number=Sing | کا, کے, کی | کی, کا, کو, کے |
AdpType=Post|Case=Nom|Number=Sing|Person=3 | کی | |
AdpType=Post|Case=Nom|Number=Sing|Person=3|Polite=Form | کے | |
AdpType=Post|Case=Nom|Number=Plur | کے | کی |
AdpType=Post|Case=Nom|Number=Plur|Person=3 | کے | |
AdpType=Post|Case=Nom|Number=Plur|Person=3|Polite=Form | کے | |
AdpType=Post|Number=Sing | کا | کی |
AdpType=Post|Number=Sing|Person=3 | کا | |
Aspect=Perf|Case=Nom|Number=Sing|VerbForm=Part | کی | |
Case=Acc | کے |
VERB
6845 VERB tokens (58% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Case=EMPTY (6744; 99%), Person=EMPTY (6012; 88%), Number=Sing (5815; 85%), VerbForm=Part (5809; 85%), Voice=Act (4884; 71%), Aspect=Perf (4764; 70%).
VERB
tokens may have the following values of Gender
:
Fem
(1699; 25% of non-emptyGender
): کی، دی، ہوئی، ہوگی، ہوتی، بتائی، رہی، آئی، کرتی، رکھیMasc
(5146; 75% of non-emptyGender
): کیا، کہا، کرتے، بتایا، دیا، ہوا، کیے، ہوگا، کرنا، ہوتاEMPTY
(5017): کر، ہو، کرنے، ہے، ہونے، کریں، ہوئے، دینے، دے، رکھنے
Paradigm کر | Masc | Fem |
---|---|---|
Aspect=Imp|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | کرتے | کرتیں |
Aspect=Imp|Number=Sing|VerbForm=Part | کرتے, کرتا | کرتی, کرتے |
Aspect=Imp|Number=Sing|VerbForm=Part|Voice=Act | کرتا, کرتے | کرتی |
Aspect=Imp|Number=Plur|VerbForm=Part | کرتے | |
Aspect=Imp|Number=Plur|VerbForm=Part|Voice=Act | کرتے | کرتیں |
Aspect=Perf|Case=Acc|Number=Sing|Person=3|VerbForm=Part | کیے | |
Aspect=Perf|Case=Acc|Number=Sing|VerbForm=Part | کئے, کیے | کی |
Aspect=Perf|Case=Nom|Number=Sing|VerbForm=Part|Voice=Act | کی | |
Aspect=Perf|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | کئے | |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | کئے, کیا, کیے | |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Act | کیا, کئے, کر, کی | کی |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Pass | کئے, کیے | کی |
Aspect=Perf|Number=Sing|VerbForm=Part | کیا, کئے, کرتے, کیے | کی, کیے |
Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Act | کیا, کیے, کئے, کر, کی | کی, کریں |
Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Pass | کیا, کئے, کیے | کی |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part | کیے | |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Act | کئے, کیے, کیں | کیں |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Pass | کیے | |
Aspect=Perf|Number=Plur|VerbForm=Part | کیے, کئے | |
Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Act | کیے, کئے, کریں | کیں |
Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Pass | کیے, کئے | |
Aspect=Perf|Person=3|VerbForm=Part | کیے | |
Aspect=Perf|VerbForm=Part|Voice=Act | کیے | |
Case=Acc|Number=Sing|Person=3|Voice=Pass | کی | |
Case=Acc|Number=Plur|VerbForm=Inf | کرنے | |
Case=Acc|VerbForm=Inf | کرنے | |
Case=Nom|Number=Sing|VerbForm=Inf | کرنا | |
Case=Nom|Number=Sing|Voice=Act | کی | |
Case=Nom|Number=Plur|Person=3|Voice=Act | کر | |
Case=Nom|VerbForm=Inf | کرنے | |
Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کریںگے | |
Mood=Ind|Number=Sing|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کریگا, کرےگا | کرےگی, کریں_گی, کریگی |
Mood=Ind|Number=Sing|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے | کرےگی, کریں_گی |
Mood=Ind|Number=Plur|Person=3|Polite=Form|Tense=Fut|VerbForm=Fin|Voice=Act | کرینگے | |
Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کرےنگے | کریں_گی |
Mood=Ind|Number=Plur|Tense=Fut|VerbForm=Fin|Voice=Act | کریں_گے, کرےنگے | کریں_گی |
Mood=Sub|Number=Sing|Person=3|Polite=Form|VerbForm=Fin|Voice=Act | کریں_گے, کریں | |
Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Act | کریں, کرے | |
Mood=Sub|Number=Sing|Person=3|VerbForm=Fin|Voice=Pass | کریں | |
Mood=Sub|Number=Sing|VerbForm=Fin|Voice=Act | کریں | |
Mood=Sub|Number=Sing|VerbForm=Fin|Voice=Pass | کریں | |
Mood=Sub|Number=Plur|Person=3|VerbForm=Fin|Voice=Act | کریں | |
Mood=Sub|Number=Plur|Person=3|VerbForm=Fin|Voice=Pass | کریں | کریں |
Mood=Sub|Number=Plur|VerbForm=Fin|Voice=Act | کریں | |
Mood=Sub|Number=Plur|VerbForm=Fin|Voice=Pass | کریں | |
Number=Sing|Person=3 | کیے, کر | |
Number=Sing|Person=3|VerbForm=Inf|Voice=Pass | کرنی | |
Number=Sing|Person=3|Voice=Act | کرےگا, کیا, کر, کریں_گے | کرےگی, کی |
Number=Sing|VerbForm=Inf | کرنا | |
Number=Sing|VerbForm=Inf|Voice=Act | کرنا, کرنے | کرنی |
Number=Sing|VerbForm=Inf|Voice=Pass | کرنا | کرنی |
Number=Sing|Voice=Act | کیا, کر, کرےگا, کہا | کریں, کی |
Number=Sing|Voice=Pass | کیا | کی |
Number=Plur|VerbForm=Inf | کرنے | |
Number=Plur|VerbForm=Inf|Voice=Act | کرنے | کرنی |
Number=Plur|VerbForm=Inf|Voice=Pass | کرنے | |
VerbForm=Inf | کرنے |
AUX
4732 AUX tokens (47% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Voice=EMPTY (4472; 95%), Number=Sing (3560; 75%), Person=EMPTY (3277; 69%), Tense=EMPTY (3174; 67%), Mood=EMPTY (3109; 66%), VerbForm=Part (2962; 63%), Aspect=Perf (2544; 54%).
AUX
tokens may have the following values of Gender
:
Fem
(1283; 27% of non-emptyGender
): گئی، تھی، رہی، دی، گی، سکتی، جاتی، جائےگی، لی، چکیMasc
(3449; 73% of non-emptyGender
): گیا، تھا، دیا، تھے، گئے، ہیں، رہے، رہا، لیا، سکتاEMPTY
(5257): ہے، ہوئے، ہےں، ہیں، جا، کر، جائے، جانے، چاہیے، ہوں
Paradigm ہے | Masc | Fem |
---|---|---|
Number=Sing|Person=3|Polite=Form|Tense=Pres | ہیں | ہیں |
Number=Sing|Person=3|Polite=Form|Tense=Pres|Voice=Act | ہیں | |
Number=Sing|Person=3|Tense=Pres | ہے, ہیں | ہیں |
Number=Sing|Person=3|Tense=Pres|Voice=Act | ہیں, ہے | ہیں |
Number=Sing|Tense=Pres | ہیں, ہے | ہیں |
Number=Sing|Tense=Pres|Voice=Act | ہیں | |
Number=Plur|Person=3|Tense=Fut|Voice=Act | ہوں_گے | |
Number=Plur|Person=3|Tense=Pres | ہیں, ہےں | ہیں |
Number=Plur|Person=3|Tense=Pres|Voice=Act | ہیں | ہیں |
Number=Plur|Tense=Pres | ہیں, ہے | ہیں |
Number=Plur|Tense=Pres|Voice=Act | ہیں | ہیں |
ADJ
1053 ADJ tokens (10% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Case=Nom (586; 56%).
ADJ
tokens may have the following values of Gender
:
Fem
(401; 38% of non-emptyGender
): دوسری، بڑی، پہلی، پوری، نئی، آخری، خصوصی، اچھی، سیاسی، علاقائیMasc
(652; 62% of non-emptyGender
): بڑے، دوسرے، نئے، پہلے، پہلا، دوسرا، بڑا، تیسرے، پرانے، پچھلےEMPTY
(9066): جاری، شامل، دیگر، سابق، موجود، پیدا، ہلاک، منعقد، ریاستی، سرکاری
Paradigm ریاستی | Masc | Fem |
---|---|---|
Number=Sing | ریاستی | ریاستی |
ریاستی |
PRON
614 PRON tokens (11% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=Prs (562; 92%), Number=Sing (406; 66%), Polite=EMPTY (403; 66%), Case=Acc (308; 50%).
PRON
tokens may have the following values of Gender
:
Fem
(139; 23% of non-emptyGender
): اپنی، ہماری، میری، انہیں، تمہاری، اتنی، اسی، ان، اُس، ایسیMasc
(475; 77% of non-emptyGender
): انہوں، انہیں، اپنے، ایسا، ہمارے، ایسے، اُنھوں، انھیں، اپنا، دوسرےEMPTY
(4982): اس، وہ، ان، انہوں، جو، جس، یہ، اپنے، کوئی، کسی
Paradigm وہ | Masc | Fem |
---|---|---|
Case=Acc,Dat|Number=Sing|Polite=Form|PronType=Prs | انہیں, انہوں, انھیں, انھوں, اُنھیں | انہیں |
Case=Acc,Dat|Number=Sing|PronType=Prs | انھیں | |
Case=Acc,Dat|Number=Plur|PronType=Prs | انھیں, انہیں | |
Case=Acc|Number=Sing | اُس | اُس |
Case=Acc|Number=Sing|Polite=Form | اُن, انہوں | |
Case=Acc|Number=Sing|Polite=Form|PronType=Prs | انہوں, اُنھوں, انھوں, ان | |
Case=Acc|Number=Sing|PronType=Prs | اُس, انہوں, اُن | |
Case=Acc|Number=Plur | اُن | |
Case=Acc|Number=Plur|Polite=Form|PronType=Prs | انہوں | |
Case=Acc|Number=Plur|PronType=Prs | انہوں | ان |
Case=Nom|Number=Sing|Polite=Form|PronType=Prs | انھوں, اُنھیں | |
Case=Nom|Number=Plur|PronType=Prs | انہیں | |
Number=Sing|Polite=Form|PronType=Prs | انہوں |
ADV
441 ADV tokens (32% of all ADV
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADV
and Gender
co-occurred: AdvType=EMPTY (440; 100%), Number=Sing (437; 99%), Person=3 (408; 93%), Case=Nom (398; 90%), AdpType=Post (372; 84%).
ADV
tokens may have the following values of Gender
:
Fem
(5; 1% of non-emptyGender
): بڑی، جانب، آس، کافیMasc
(436; 99% of non-emptyGender
): پیش، بعد، پہلے، دوران، جانب، طرف، آگے، باہر، سامنے، قبلEMPTY
(945): پھر، بہت، سے، مزید، پیش، دوبارہ، جلد، انتہائی، ہمیشہ، ہنوز
Paradigm جانب | Masc | Fem |
---|---|---|
AdpType=Post|Case=Acc | جانب | |
AdpType=Post|Case=Nom | جانب, عنقریب | جانب |
Case=Acc | جانب |
Gender
seems to be lexical feature of ADV
. 98% lemmas (53) occur only with one value of Gender
.
DET
115 DET tokens (5% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Number=Sing (102; 89%), Person=EMPTY (96; 83%), PronType=Dem (91; 79%), Case=Nom (68; 59%).
DET
tokens may have the following values of Gender
:
Fem
(18; 16% of non-emptyGender
): ایسی، اسی، انہیں، بڑی، تھوڑی، جتنی، ساریMasc
(97; 84% of non-emptyGender
): ایسے، ایسا، یہ، اتنا، اسی، سارے، پورے، ایسی، دوسرے، کیاEMPTY
(2381): اس، یہ، ان، کئی، تمام، کچھ، اسی، ہر، چند، کوئی
Paradigm یہ | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing | اسی | اسی |
Case=Acc|Number=Plur | ایسی | |
Case=Nom|Number=Sing|Person=3 | یہ, اسی | |
Case=Nom|Number=Sing | اس, اسی | اسی |
Case=Nom|Number=Plur | ایسی | |
Number=Sing|Person=3 | یہ |
PART
47 PART tokens (2% of all PART
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PART
and Gender
co-occurred: Polarity=EMPTY (47; 100%), PronType=EMPTY (47; 100%).
PART
tokens may have the following values of Gender
:
Fem
(2; 4% of non-emptyGender
): مسٹر، ویںMasc
(45; 96% of non-emptyGender
): مسٹر، کرام، جناب، حضرت، مسز، کے، بلا، بھلے، تعالی، تعالیٰEMPTY
(2993): بھی، نہیں، مسٹر، ہی، نہ، صرف، جناب، کہ، تو، بغیر
Paradigm مسٹر | Masc | Fem |
---|---|---|
Case=Nom | مسٹر | مسٹر |
مسٹر |
Gender
seems to be lexical feature of PART
. 95% lemmas (19) occur only with one value of Gender
.
NUM
45 NUM tokens (2% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=Card (45; 100%).
NUM
tokens may have the following values of Gender
:
Fem
(3; 7% of non-emptyGender
): تینوں، دوسری، پہلیMasc
(42; 93% of non-emptyGender
): دونوں، کروڑ، ایک، ہزار، 30، اےک، لاکھ، 02، 101، 29EMPTY
(2416): اےک، ایک، دو، تین، دونوں، لاکھ، چار، ہزار، پانچ، کروڑ
Paradigm تین | Masc | Fem |
---|---|---|
تینوں | تینوں |
Gender
seems to be lexical feature of NUM
. 96% lemmas (22) occur only with one value of Gender
.
CCONJ
6 CCONJ tokens (0% of all CCONJ
tokens) have a non-empty value of Gender
.
CCONJ
tokens may have the following values of Gender
:
Fem
(1; 17% of non-emptyGender
): وMasc
(5; 83% of non-emptyGender
): و، آیا، اور، تاہمEMPTY
(3242): اور، و، لیکن، جبکہ، تاہم، یا، مگر، نیز، لہذا، آیا
X
6 X tokens (27% of all X
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which X
and Gender
co-occurred: Foreign=EMPTY (6; 100%), Number=Sing (5; 83%), Person=3 (5; 83%), Case=Nom (4; 67%).
X
tokens may have the following values of Gender
:
Masc
(6; 100% of non-emptyGender
): کاش، افسوس، جانےEMPTY
(16): خدارا، کتنے، آخر، ئن، را، لوڈ، نئچ، نسبتاً، نہ، واقعی
SCONJ
1 SCONJ tokens (0% of all SCONJ
tokens) have a non-empty value of Gender
.
SCONJ
tokens may have the following values of Gender
:
Masc
(1; 100% of non-emptyGender
): ،EMPTY
(2672): کہ، تو، اگر، کیونکہ، تاکہ، بلکہ، حالانکہ، چنانچہ، ,، کیوںکہ
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
PROPN –[compound]–> PROPN (7465; 92%),
NOUN –[nmod]–> NOUN (4365; 69%),
NOUN –[nmod]–> PROPN (2271; 77%),
NOUN –[compound]–> NOUN (1835; 81%),
PROPN –[nmod]–> NOUN (1168; 88%),
VERB –[nsubj]–> PROPN (920; 54%),
NOUN –[conj]–> NOUN (837; 76%),
PROPN –[conj]–> PROPN (690; 93%),
PROPN –[nmod]–> PROPN (650; 89%),
PROPN –[compound]–> NOUN (409; 93%).