Treebank Statistics: UD_Hindi-HDTB: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem, Masc.
185891 tokens (53%) have a non-empty value of Gender.
15289 types (80%) occur at least once with a non-empty value of Gender.
12477 lemmas (80%) occur at least once with a non-empty value of Gender.
The feature is used with 14 part-of-speech tags: NOUN (77241; 22% instances), PROPN (37639; 11% instances), ADP (26218; 7% instances), VERB (23926; 7% instances), AUX (11065; 3% instances), ADJ (4376; 1% instances), PRON (3516; 1% instances), ADV (1387; 0% instances), DET (464; 0% instances), PART (35; 0% instances), NUM (16; 0% instances), X (5; 0% instances), SCONJ (2; 0% instances), PUNCT (1; 0% instances).
NOUN
77241 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Person=3 (77214; 100%), Number=Sing (62647; 81%), Case=Acc (41556; 54%).
NOUN tokens may have the following values of Gender:
Fem(27489; 36% of non-emptyGender): सरकार, पुलिस, पार्टी, बात, तरह, बैठक, सुरक्षा, जानकारी, बातचीत, रिपोर्टMasc(49752; 64% of non-emptyGender): लोगों, मामले, राज्य, चुनाव, देश, समय, साल, शुरू, रुपये, दिनEMPTY(914): हवाई, दोनों, मुख्य, खुफिया, अध्यक्ष, संयुक्त, चीफ, जनरल, उप, ऑफ
| Paradigm सरकार | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing | सरकार | |
| Case=Acc|Number=Sing|Person=3 | सरकार | सरकार |
| Case=Acc|Number=Plur|Person=3 | सरकारों | सरकारों |
| Case=Nom|Number=Sing|Person=3 | सरकार | |
| Case=Nom|Number=Plur|Person=3 | सरकारें, सरकार |
Gender seems to be lexical feature of NOUN. 95% lemmas (5986) occur only with one value of Gender.
PROPN
37639 PROPN tokens (88% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Person=3 (37556; 100%), Number=Sing (37407; 99%), Case=Nom (19783; 53%).
PROPN tokens may have the following values of Gender:
Fem(6617; 18% of non-emptyGender): कांग्रेस, दिल्ली, भाजपा, सरकार, सोनिया, मुंबई, उमा, माकपा, पार्टी, जनताMasc(31022; 82% of non-emptyGender): भारत, सिंह, प्रधानमंत्री, पाकिस्तान, मंत्री, कश्मीर, केंद्र, प्रदेश, मंत्रालय, मनमोहनEMPTY(5301): सिंह, गांधी, आडवाणी, भारतीय, केंद्रीय, राष्ट्रीय, यादव, ऑफ, वाजपेयी, पासवान
| Paradigm प्रधानमंत्री | Masc | Fem |
|---|---|---|
| Case=Acc | प्रधानमंत्री | |
| Case=Nom | प्रधानमंत्री | प्रधानमंत्री |
| प्रधानमंत्री |
Gender seems to be lexical feature of PROPN. 95% lemmas (6476) occur only with one value of Gender.
ADP
26218 ADP tokens (36% of all ADP tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADP and Gender co-occurred: AdpType=Post (25275; 96%), Number=Sing (21248; 81%).
ADP tokens may have the following values of Gender:
Fem(8698; 33% of non-emptyGender): की, ओर, वजह, तरह, जैसी, तरफ, तुलना, जगह, अपेक्षा, केMasc(17520; 67% of non-emptyGender): के, का, साथ, बाद, दौरान, बीच, कारण, पहले, पास, रूपEMPTY(46997): में, को, के, ने, से, पर, लिए, तक, द्वारा, बारे
| Paradigm का | Masc | Fem |
|---|---|---|
| AdpType=Post | की | |
| AdpType=Post|Case=Acc | के | की |
| AdpType=Post|Case=Acc,Gen|Number=Sing|Poss=Yes | का, के | की |
| AdpType=Post|Case=Acc,Gen|Number=Plur|Poss=Yes | के | की |
| AdpType=Post|Case=Acc|Number=Sing | के, का, की | की, के, का |
| AdpType=Post|Case=Acc|Number=Sing|Person=3 | के | की |
| AdpType=Post|Case=Acc|Number=Sing|Person=3|Polite=Form | के | |
| AdpType=Post|Case=Acc|Number=Plur | के, का | की, के |
| AdpType=Post|Case=Acc|Number=Plur|Person=3 | के | की |
| AdpType=Post|Case=Nom | की | |
| AdpType=Post|Case=Nom|Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Past|VerbForm=Fin | के | |
| AdpType=Post|Case=Nom|Number=Sing | का, के, की | की, के |
| AdpType=Post|Case=Nom|Number=Sing|Person=2|Polite=Form | के | |
| AdpType=Post|Case=Nom|Number=Sing|Person=3 | का, की | की |
| AdpType=Post|Case=Nom|Number=Sing|Person=3|Polite=Form | के | |
| AdpType=Post|Case=Nom|Number=Plur | के, का | की |
| AdpType=Post|Case=Nom|Number=Plur|Person=3 | के | |
| AdpType=Post|Number=Sing | के | की |
| AdpType=Post|Number=Plur|Person=3 | के | |
| Case=Acc|Number=Sing | के | की |
| Case=Acc|Number=Plur | के | |
| Case=Nom|Number=Sing | का | की |
| Case=Nom|Number=Sing|Person=3|Polite=Form | के |
Gender seems to be lexical feature of ADP. 92% lemmas (87) occur only with one value of Gender.
VERB
23926 VERB tokens (67% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Case=EMPTY (23683; 99%), Number=Sing (19973; 83%), VerbForm=Part (17986; 75%), Voice=Act (16932; 71%), Aspect=Perf (15579; 65%), Person=EMPTY (12793; 53%).
VERB tokens may have the following values of Gender:
Fem(6442; 27% of non-emptyGender): की, दी, हुई, कर, हो, होगी, ली, मिली, आई, जताईMasc(17484; 73% of non-emptyGender): कहा, किया, दिया, बताया, कर, करते, लिया, हो, किए, हुआEMPTY(12033): करने, है, कर, हो, होने, देने, लेकर, कहना, बनाने, लेने
| Paradigm करना | Masc | Fem |
|---|---|---|
| _ | कर | |
| Aspect=Imp|Case=Acc|Number=Sing|VerbForm=Part | करते | |
| Aspect=Imp|Echo=Rdp|Number=Sing|VerbForm=Part | करते | |
| Aspect=Imp|Number=Sing|Person=1|VerbForm=Part|Voice=Act | करता | |
| Aspect=Imp|Number=Sing|Person=2|Polite=Form|VerbForm=Part|Voice=Act | करते | |
| Aspect=Imp|Number=Sing|Person=3|Polite=Form|VerbForm=Part | करते | |
| Aspect=Imp|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | करते | करती |
| Aspect=Imp|Number=Sing|Person=3|VerbForm=Part | करते | |
| Aspect=Imp|Number=Sing|Person=3|VerbForm=Part|Voice=Act | करता, करते, करवाता | करती |
| Aspect=Imp|Number=Sing|VerbForm=Part | करते, करता | करती |
| Aspect=Imp|Number=Sing|VerbForm=Part|Voice=Act | करता, करते | करती |
| Aspect=Imp|Number=Plur|Person=1|VerbForm=Part|Voice=Act | करते | |
| Aspect=Imp|Number=Plur|Person=3|VerbForm=Part|Voice=Act | करते | करती |
| Aspect=Imp|Number=Plur|VerbForm=Part | करते | करती |
| Aspect=Imp|Number=Plur|VerbForm=Part|Voice=Act | करते | करती, करतीं |
| Aspect=Perf|Number=Sing|Person=1|VerbForm=Part|Voice=Act | की | |
| Aspect=Perf|Number=Sing|Person=3|Polite=Form|VerbForm=Part|Voice=Act | किए, करा, किये | |
| Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | किए, किये | किए, की |
| Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Act | किया, करा, करवाया, किए, कर | की, करा, कर |
| Aspect=Perf|Number=Sing|Person=3|VerbForm=Part|Voice=Pass | किया, करवाया, करा, कराया | की |
| Aspect=Perf|Number=Sing|VerbForm=Part | किए, किया, किये | की |
| Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Act | किया, करवाया, करा, किये | की |
| Aspect=Perf|Number=Sing|VerbForm=Part|Voice=Pass | किया, करा, करवाया | की |
| Aspect=Perf|Number=Plur|Person=3|Polite=Form|VerbForm=Part|Voice=Act | किए | |
| Aspect=Perf|Number=Plur|Person=3|VerbForm=Part | किए | की |
| Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Act | किए, करा, किये, किया | की, कीं |
| Aspect=Perf|Number=Plur|Person=3|VerbForm=Part|Voice=Pass | किए, किये | की |
| Aspect=Perf|Number=Plur|VerbForm=Part | किए | की |
| Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Act | किए, किये, करा | की, कीं |
| Aspect=Perf|Number=Plur|VerbForm=Part|Voice=Pass | किए, किये | की |
| Aspect=Perf|VerbForm=Part | किया, किए | की |
| Aspect=Perf|VerbForm=Part|Voice=Act | किया, किए | की |
| Aspect=Perf|VerbForm=Part|Voice=Pass | किया, किए | की |
| Case=Acc|Number=Sing|Person=3|Polite=Form|VerbForm=Inf|Voice=Act | करने | |
| Case=Acc|Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करने | करने |
| Case=Acc|Number=Sing|VerbForm=Inf | करने | |
| Case=Acc|VerbForm=Inf | करने | करने |
| Case=Acc|VerbForm=Inf|Voice=Act | करने | |
| Case=Nom|Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करना | |
| Case=Nom|Number=Sing|Person=3|Voice=Act | कर | |
| Case=Nom|Number=Sing|Voice=Act | कर | |
| Mood=Ind|Number=Sing|Person=1|Tense=Fut|VerbForm=Fin|Voice=Act | करूंगा, करूँगा | करुंगी, करूँगी |
| Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Fut|VerbForm=Fin|Voice=Act | करेंगे | करेंगी |
| Mood=Ind|Number=Sing|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | करेगा | करेगी, करूंगी |
| Mood=Ind|Number=Plur|Person=1|Tense=Fut|VerbForm=Fin|Voice=Act | करेंगे, करेगें | |
| Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin | करेंगे | |
| Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin|Voice=Act | करेंगे, करवाएंगे | करेंगी |
| Mood=Ind|Number=Plur|Tense=Fut|VerbForm=Fin|Voice=Act | करेंगे | |
| Number=Sing|Person=1|Voice=Act | कर | |
| Number=Sing|Person=2|Polite=Form|Voice=Act | कर, करवा | |
| Number=Sing|Person=3 | कर | |
| Number=Sing|Person=3|Polite=Form|VerbForm=Inf|Voice=Act | करने | |
| Number=Sing|Person=3|Polite=Form|Voice=Act | कर | कर |
| Number=Sing|Person=3|VerbForm=Inf|Voice=Act | करना, करने, कराना | करनी, करने |
| Number=Sing|Person=3|VerbForm=Inf|Voice=Pass | करनी | |
| Number=Sing|Person=3|Voice=Act | कर | कर, की |
| Number=Sing|Person=3|Voice=Pass | कर | कर |
| Number=Sing|VerbForm=Inf | करना | |
| Number=Sing|VerbForm=Inf|Voice=Act | करना, करने | करनी, करने |
| Number=Sing|VerbForm=Inf|Voice=Pass | करनी | |
| Number=Sing|Voice=Act | कर | कर |
| Number=Sing|Voice=Pass | कर | कर |
| Number=Plur|Person=1|Voice=Act | कर | |
| Number=Plur|Person=3|VerbForm=Inf|Voice=Act | करने | करनी |
| Number=Plur|Person=3|Voice=Act | कर | कर |
| Number=Plur|Person=3|Voice=Pass | कर | कर |
| Number=Plur|VerbForm=Inf|Voice=Act | करने | |
| Number=Plur|Voice=Act | कर | कर |
| Number=Plur|Voice=Pass | कर | कर |
| VerbForm=Inf|Voice=Act | करना, करने | करनी |
| VerbForm=Inf|Voice=Pass | करने | |
| Voice=Act | कर | कर |
AUX
11065 AUX tokens (47% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Voice=EMPTY (10564; 95%), Number=Sing (8947; 81%), Person=EMPTY (8905; 80%), Tense=EMPTY (7642; 69%), Mood=EMPTY (7591; 69%), VerbForm=Part (7436; 67%), Aspect=Perf (6351; 57%).
AUX tokens may have the following values of Gender:
Fem(3108; 28% of non-emptyGender): गई, थी, रही, जाएगी, सकती, थीं, जाती, हुई, गयी, पड़ीMasc(7957; 72% of non-emptyGender): गया, था, गए, हुए, रहे, थे, रहा, जाएगा, सकता, जाताEMPTY(12691): है, हैं, जा, जाने, चाहिए, जाए, कर, सके, रहे, हूं
| Paradigm है | Masc | Fem |
|---|---|---|
| Aspect=Perf|Number=Plur|Person=3|VerbForm=Part | हैं | |
| Case=Nom|Number=Sing | है | |
| Mood=Ind|Number=Sing|Person=3|Polite=Form|Tense=Pres|VerbForm=Fin | हैं | |
| Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin | है | है |
| Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin | हैं | |
| Number=Sing | है | |
| Number=Plur | हैं | |
| Number=Plur|Person=3 | हों, हैं | |
| Number=Plur|Person=3|Voice=Act | हों |
ADJ
4376 ADJ tokens (20% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (3430; 78%), Case=Acc (2378; 54%).
ADJ tokens may have the following values of Gender:
Fem(1419; 32% of non-emptyGender): वाली, पूरी, नई, पहली, बड़ी, दूसरी, अच्छी, कड़ी, लंबी, पुरानीMasc(2957; 68% of non-emptyGender): वाले, पिछले, पूरा, अगले, नए, पूरे, दूसरे, बड़े, वाला, बड़ाEMPTY(17269): शामिल, अन्य, जारी, पूर्व, भारतीय, तैयार, स्थित, वरिष्ठ, पेश, दर्ज
| Paradigm वाला | Masc | Fem |
|---|---|---|
| Case=Acc | वाले | |
| Case=Acc|Number=Sing | वाले, वाला | वाली |
| Case=Acc|Number=Sing|Person=3 | वाला, वाले | |
| Case=Acc|Number=Sing|Person=3|Polite=Form | वाले | |
| Case=Acc|Number=Plur | वाले, वालों | वाली |
| Case=Acc|Number=Plur|Person=3 | वाले, वालों | |
| Case=Nom|Number=Sing | वाला, वाले | वाली |
| Case=Nom|Number=Sing|Person=3 | वाला | वाली |
| Case=Nom|Number=Sing|Person=3|Polite=Form | वाले | |
| Case=Nom|Number=Plur | वाले | वाली |
| Number=Sing | वाला | वाली |
| Number=Sing|Person=3 | वाला, वाले | वाली |
| Number=Sing|Person=3|Polite=Form | वाले | वाली |
| Number=Plur | वाले | |
| Number=Plur|Person=3 | वाले | वाली |
PRON
3516 PRON tokens (24% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: PronType=Prs (3505; 100%), Polite=EMPTY (2826; 80%), Case=Acc,Gen (2038; 58%), Poss=Yes (2038; 58%), Number=Sing (2026; 58%), Person=3 (2010; 57%).
PRON tokens may have the following values of Gender:
Fem(1142; 32% of non-emptyGender): अपनी, उनकी, इसकी, उसकी, हमारी, इनकी, जिसकी, मेरी, आपकी, जिनकीMasc(2374; 68% of non-emptyGender): अपने, उनके, इसके, अपना, इसका, उनका, उसके, ऐसा, उसका, ऐसेEMPTY(11186): उन्होंने, यह, वह, कोई, उन्हें, इसके, अब, किसी, वे, इससे
| Paradigm वह | Masc | Fem |
|---|---|---|
| Case=Acc,Dat|Number=Sing|Person=3|Polite=Form | उन्हें | उनकी |
| Case=Acc,Erg|Number=Sing|Person=3|Polite=Form | उन्होंने | उन्होंने |
| Case=Acc,Erg|Number=Sing|Person=3 | उन्होंने, उसने | उसने |
| Case=Acc,Erg|Number=Plur|Person=3 | उन्होंने | |
| Case=Acc,Gen|Number=Sing|Person=3|Polite=Form|Poss=Yes | उनके, उनका, उनकी | उनकी |
| Case=Acc,Gen|Number=Sing|Person=3|Poss=Yes | उसके, उसका, उनका, उनके | उसकी, उनकी |
| Case=Acc,Gen|Number=Plur|Person=3|Polite=Form|Poss=Yes | उनके | |
| Case=Acc,Gen|Number=Plur|Person=3|Poss=Yes | उनके, उनका, उसके, उनकी | उनकी |
| Case=Acc,Gen|Person=3|Polite=Form|Poss=Yes | उनकी | |
| Case=Acc,Gen|Poss=Yes | उनकी | |
| Case=Acc,Ins|Number=Sing|Person=3|Polite=Form | उनसे | |
| Case=Acc,Ins|Number=Plur | उनके | |
| Case=Acc|Number=Sing|Person=3|Polite=Form | उन | |
| Case=Acc|Number=Sing|Person=3 | उसी | |
| Case=Nom|Number=Sing|Person=3|Polite=Form | वे | |
| Case=Nom|Number=Sing|Person=3 | वही | वह |
| Case=Nom|Number=Plur|Person=3 | वे |
ADV
1387 ADV tokens (42% of all ADV tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADV and Gender co-occurred: AdvType=EMPTY (1384; 100%), Number=Sing (1381; 100%), AdpType=Post (1372; 99%), Person=3 (1370; 99%), Case=Nom (1137; 82%).
ADV tokens may have the following values of Gender:
Fem(55; 4% of non-emptyGender): ओर, तरफ, इतनी, थोड़ी, सीधी, खासी, तरफ़, दूर, पहल, पासMasc(1332; 96% of non-emptyGender): बाद, पहले, आगे, साथ, दौरान, सामने, दूर, बीच, बाहर, पीछेEMPTY(1920): सबसे, फिर, वहीं, जल्द, लगातार, फिलहाल, बहुत, जमकर, दोबारा, बार
| Paradigm दूर | Masc | Fem |
|---|---|---|
| Case=Acc | दूर | |
| Case=Nom | दूर | दूर |
DET
464 DET tokens (6% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Person=EMPTY (364; 78%), Number=Sing (295; 64%), PronType=Dem (270; 58%), Case=Nom (252; 54%).
DET tokens may have the following values of Gender:
Fem(148; 32% of non-emptyGender): ऐसी, सारी, इतनी, थोड़ी, कितनी, उतनी, आधी, इसी, उसी, जितनीMasc(316; 68% of non-emptyGender): ऐसे, ऐसा, आधा, इतना, इतने, सारे, सारा, आधे, कितने, इसEMPTY(7061): इस, यह, इन, कुछ, कई, सभी, कम, ज्यादा, काफी, उस
| Paradigm यह | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing|Person=3 | इस, इसी, यही | इसी, ऐसी |
| Case=Acc|Number=Sing | इसी | |
| Case=Acc|Number=Plur|Person=3 | इन्हीं | इन्हीं |
| Case=Nom|Number=Sing|Person=3 | यही, यह | इसी, यह |
PART
35 PART tokens (0% of all PART tokens) have a non-empty value of Gender.
The most frequent other feature values with which PART and Gender co-occurred: Polarity=EMPTY (35; 100%), PronType=EMPTY (35; 100%).
PART tokens may have the following values of Gender:
Fem(14; 40% of non-emptyGender): सीMasc(21; 60% of non-emptyGender): सा, गुना, से, भी, जैसेEMPTY(6974): भी, नहीं, ही, न, तो, करीब, से, भर, लगभग, सिर्फ
| Paradigm सा | Masc | Fem |
|---|---|---|
| Case=Acc | सी | |
| Case=Acc|Number=Sing | सी | |
| Case=Nom | सी | |
| Case=Nom|Number=Sing | सा | सी |
| Case=Nom|Number=Plur | से | सी |
| Number=Sing | सा | सी |
| Number=Plur | से | सी |
NUM
16 NUM tokens (0% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (16; 100%).
NUM tokens may have the following values of Gender:
Masc(16; 100% of non-emptyGender): दोनों, पौने, आधा, आधे, दर्जनों, दूसरे, पौन, ७००EMPTY(6724): एक, दो, दोनों, तीन, करोड़, चार, लाख, हजार, पांच, छह
X
5 X tokens (4% of all X tokens) have a non-empty value of Gender.
The most frequent other feature values with which X and Gender co-occurred: Foreign=EMPTY (5; 100%).
X tokens may have the following values of Gender:
Masc(5; 100% of non-emptyGender): अपने, आधा, दर्जन, बडे, साथEMPTY(135): पास, रिकॉर्ड, डाउनलोड, फिट, फेल, बुक, अलग, आउट, आफ, इंटरसेप्ट
SCONJ
2 SCONJ tokens (0% of all SCONJ tokens) have a non-empty value of Gender.
SCONJ tokens may have the following values of Gender:
Masc(2; 100% of non-emptyGender): जैसाEMPTY(6724): कि, तो, हालांकि, अगर, यदि, क्योंकि, ताकि, बहरहाल, बल्कि, यानि
PUNCT
1 PUNCT tokens (0% of all PUNCT tokens) have a non-empty value of Gender.
PUNCT tokens may have the following values of Gender:
Fem(1; 100% of non-emptyGender): (EMPTY(23454): ।, ,, -, ., ‘, ), (, -JOIN, ?, ‘1
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
PROPN –[compound]–> PROPN (8069; 54%),
NOUN –[nmod]–> NOUN (6841; 51%),
VERB –[nsubj]–> NOUN (5125; 61%),
VERB –[compound]–> NOUN (5012; 59%),
NOUN –[nmod]–> PROPN (4558; 55%),
NOUN –[compound]–> NOUN (3607; 52%),
VERB –[nsubj]–> PROPN (2920; 53%),
NOUN –[nmod]–> PRON (2707; 78%),
PROPN –[nmod]–> NOUN (1621; 59%),
PROPN –[nmod]–> PROPN (1614; 69%).