Treebank Statistics: UD_Hindi-PUD: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem, Masc.
This is a layered feature with the following layers: Gender, Gender[psor].
11116 tokens (47%) have a non-empty value of Gender.
3503 types (68%) occur at least once with a non-empty value of Gender.
2993 lemmas (68%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (4997; 21% instances), VERB (1555; 7% instances), PROPN (1338; 6% instances), ADP (1285; 5% instances), AUX (1221; 5% instances), PRON (408; 2% instances), ADJ (273; 1% instances), DET (39; 0% instances).
NOUN
4997 NOUN tokens (89% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (4463; 89%), Case=Acc (2505; 50%).
NOUN tokens may have the following values of Gender:
Fem(1654; 33% of non-emptyGender): तरह, बार, दुनिया, बात, सरकार, शताब्दी, फिल्म, संभावना, सेना, वृद्धिMasc(3343; 67% of non-emptyGender): रूप, वर्ष, समय, क्षेत्र, शुरू, काम, साल, युद्ध, उपयोग, दिनEMPTY(600): लोगों, वहां, लोग, अभी, पहले, बाद, अब, राष्ट्रपति, आगे, आज
| Paradigm बार | Masc | Fem |
|---|---|---|
| बार | बार |
Gender seems to be lexical feature of NOUN. 98% lemmas (1794) occur only with one value of Gender.
VERB
1555 VERB tokens (63% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: VerbForm=EMPTY (1539; 99%), Person=3 (1497; 96%), Number=Sing (1380; 89%), Mood=Ind (1059; 68%), Tense=EMPTY (829; 53%).
VERB tokens may have the following values of Gender:
Fem(362; 23% of non-emptyGender): की, है, थी, दी, हुई, होती, करती, होगी, आती, लीMasc(1193; 77% of non-emptyGender): किया, है, दिया, कहा, हुए, था, हुआ, लिया, होता, करताEMPTY(913): करने, कर, हो, होने, करना, बन, रहने, देने, बनाने, करते
| Paradigm करना | Masc | Fem |
|---|---|---|
| Aspect=Imp|Mood=Imp|Number=Plur|Person=3|Tense=Fut | करेंगे | |
| Aspect=Imp|Mood=Imp|Number=Plur|Person=3|Tense=Pres | करें | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=1 | करता | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=1|Tense=Fut | करूंगा | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3 | करता, करना, करे | करती, करत |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Polite=Form | करती | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Fut | करेगा | करेगी |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres | करता, करते | |
| Aspect=Imp|Mood=Ind|Number=Plur|Person=3 | करते | करती |
| Aspect=Imp|Mood=Ind|Number=Plur|Person=3|Polite=Form | करते | |
| Aspect=Imp|Mood=Ind|Number=Plur|Person=3|Tense=Pres | करें | |
| Aspect=Perf|Mood=Ind|Number=Sing|Person=3 | किया, किए | की |
| Aspect=Perf|Mood=Ind|Number=Sing|Person=3|Tense=Past | किया, की | की, कीं |
| Aspect=Perf|Mood=Ind|Number=Plur|Person=3 | की | |
| Aspect=Perf|Mood=Ind|Number=Plur|Person=3|Tense=Past | किए | कीं |
| Number=Sing | किए | |
| Number=Sing|Person=3 | किया, करते, किए, कर, करने, कियकिया | की, करनी |
| Number=Sing|Person=3|VerbForm=Inf | करनी | |
| Number=Plur|Person=3 | किए, करते, किया | की |
| Number=Plur|Person=3|VerbForm=Inf | करने |
PROPN
1338 PROPN tokens (99% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (1337; 100%), Case=Acc (712; 53%).
PROPN tokens may have the following values of Gender:
Fem(189; 14% of non-emptyGender): इटली, स्पेनिश, क्लिंटन, रोना, केशा, क्यूरी, गिनी, जर्मनी, जैस्मिन, ब्लंटMasc(1149; 86% of non-emptyGender): अमेरिका, चीन, ब्रिटेन, ट्रम्प, फ्रांस, यूरोप, मिस्र, रूस, हांगकांग, अफ्रीकाEMPTY(20): VW, 2C, Aoun, Emicro, ExxonMobil, GEMA, GOP, Hariri, Huawei, IRENA
| Paradigm ट्रम्प | Masc | Fem |
|---|---|---|
| Case=Acc | ट्रम्प | ट्रम्प |
| Case=Nom | ट्रम्प |
Gender seems to be lexical feature of PROPN. 99% lemmas (905) occur only with one value of Gender.
ADP
1285 ADP tokens (27% of all ADP tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADP and Gender co-occurred: Case=Gen (1200; 93%), Number=Sing (758; 59%).
ADP tokens may have the following values of Gender:
Fem(444; 35% of non-emptyGender): की, वाली, संबंधीMasc(841; 65% of non-emptyGender): के, का, वाले, वाला, योग्य, स्थित, आधारित, केन्द्रित, प्राप्त, लायकEMPTY(3562): में, के, से, को, ने, पर, लिए, तक, साथ, बाद
| Paradigm का | Masc | Fem |
|---|---|---|
| का | की | |
| Number=Sing | के, का | |
| Number=Plur | के |
AUX
1221 AUX tokens (89% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Person=3 (1209; 99%), Number=Sing (1020; 84%), Mood=EMPTY (622; 51%), Aspect=EMPTY (620; 51%).
AUX tokens may have the following values of Gender:
Fem(281; 23% of non-emptyGender): है, गयी, थी, हैं, सकती, रही, थीं, गई, जाती, जाएगीMasc(940; 77% of non-emptyGender): है, था, गया, हैं, जाता, सकता, गए, थे, रहा, जानेEMPTY(145): हैं, जा, रहे, थे, जाने, सकते, गए, है, चाहिए, जाते
| Paradigm है | Masc | Fem |
|---|---|---|
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Polite=Form | हैं | |
| Aspect=Imp|Mood=Ind|Number=Sing|Person=3 | है | है |
| Aspect=Imp|Mood=Ind|Number=Plur|Person=3 | हैं | हैं |
| Number=Sing|Person=1 | हूं | |
| Number=Sing|Person=3|Polite=Form | हैं | हैं |
| Number=Sing|Person=3 | है, हैं | है, हूं, हैं |
| Number=Plur|Person=3 | हैं | हैं, है |
PRON
408 PRON tokens (36% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (365; 89%), Gender[psor]=EMPTY (309; 76%), Number[psor]=EMPTY (300; 74%), PronType=EMPTY (297; 73%), Case=Nom (246; 60%), Person=3 (240; 59%).
PRON tokens may have the following values of Gender:
Fem(135; 33% of non-emptyGender): अपनी, उसकी, उनकी, वह, जिसकी, उसे, जिनकी, हमारी, इसने, उन्हेंMasc(273; 67% of non-emptyGender): अपने, वह, उसका, उसके, उसे, इसका, अपना, उसने, मैं, वेEMPTY(720): जो, यह, उसने, उसके, इसके, जिसमें, उसे, इसे, उन्होंने, वे
| Paradigm वह | Masc | Fem |
|---|---|---|
| Case=Acc|Number=Sing|Number[psor]=Sing|PronType=Prs | उसके, उनके | उसकी |
| Case=Acc|Number=Sing | उसे, उसने, उसके, उससे | उसे, उसके, उसने |
| Case=Acc|Number=Sing|Polite=Form | उन्हें | उन्हें |
| Case=Acc|Number=Plur|Number[psor]=Plur|PronType=Prs | उनके | |
| Case=Acc|Number=Plur | उन्होंने, उनके, उन्हें, वे | उन्हें, उन्होंने, वे |
| Case=Acc | उनके | |
| Case=Nom|Number=Sing|Number[psor]=Sing|Polite=Form|PronType=Prs | उनकी | |
| Case=Nom|Number=Sing|Number[psor]=Sing|PronType=Prs | उसका, उसके | उसकी, उनकी |
| Case=Nom|Number=Sing|Number[psor]=Plur|Polite=Form|PronType=Prs | उनकी | |
| Case=Nom|Number=Sing|Number[psor]=Plur|PronType=Prs | उसका | उनकी |
| Case=Nom|Number=Sing | वह, उसका, उनका, वे, वो | उसकी, वह, उनकी, वो |
| Case=Nom|Number=Plur|Number[psor]=Plur|Polite=Form|PronType=Prs | उनकी | |
| Case=Nom|Number=Plur|Number[psor]=Plur|PronType=Prs | उनकी | |
| Case=Nom|Number=Plur | वे, उनका | उनकी |
| Case=Nom | उनका | |
| Case=Nom|PronType=Prs | उनका | |
| Number=Sing|Number[psor]=Sing|PronType=Prs | उसकी | |
| Number=Sing | उसका |
ADJ
273 ADJ tokens (14% of all ADJ tokens) have a non-empty value of Gender.
ADJ tokens may have the following values of Gender:
Fem(91; 33% of non-emptyGender): पहली, अच्छी, दूसरी, नयी, बड़ी, पुरानी, ऊंची, पिछली, पूरी, बुरीMasc(182; 67% of non-emptyGender): नये, पहले, पिछले, नया, दूसरे, पुराने, पूरा, बड़ा, छोटे, तीसरेEMPTY(1722): सबसे, शामिल, प्राप्त, स्थापित, अन्य, अमेरिकी, अलग, महत्वपूर्ण, विशेष, कम
| Paradigm नया | Masc | Fem |
|---|---|---|
| _ | नयी | |
| Case=Acc|Number=Sing | नये | |
| Case=Acc|Number=Plur | नये | |
| Case=Nom|Number=Sing | नया | |
| Case=Nom|Number=Plur | नये |
DET
39 DET tokens (4% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Definite=EMPTY (39; 100%), Number=Sing (23; 59%).
DET tokens may have the following values of Gender:
Fem(18; 46% of non-emptyGender): पूरी, थोड़ी, इतनी, कितनी, सारीMasc(21; 54% of non-emptyGender): थोड़ा, पूरे, कितने, जिस, समूचे, सारे, इतना, जितना, जोEMPTY(837): एक, इस, कई, बहुत, ज्यादा, यह, लगभग, कम, उस, केवल
| Paradigm पूरा | Masc | Fem |
|---|---|---|
| _ | पूरी | |
| Case=Acc|Number=Sing | पूरे | |
| Case=Nom|Number=Sing | पूरी |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
VERB –[obj]–> NOUN (629; 53%),
VERB –[aux]–> AUX (575; 65%),
NOUN –[compound]–> NOUN (221; 56%),
NOUN –[nmod:poss]–> PRON (213; 70%),
PROPN –[flat:name]–> PROPN (194; 94%),
VERB –[aux:pass]–> AUX (171; 86%),
VERB –[nsubj]–> NOUN (161; 51%),
VERB –[nsubj]–> PROPN (159; 72%),
NOUN –[compound]–> PROPN (122; 73%),
NOUN –[conj]–> NOUN (121; 58%).