Treebank Statistics: UD_Hindi-PUD: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
This is a layered feature with the following layers: Gender, Gender[psor].
11116 tokens (47%) have a non-empty value of Gender
.
3503 types (68%) occur at least once with a non-empty value of Gender
.
2993 lemmas (68%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (4997; 21% instances), VERB (1555; 7% instances), PROPN (1338; 6% instances), ADP (1285; 5% instances), AUX (1221; 5% instances), PRON (408; 2% instances), ADJ (273; 1% instances), DET (39; 0% instances).
NOUN
4997 NOUN tokens (89% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (4463; 89%), Case=Acc (2505; 50%).
NOUN
tokens may have the following values of Gender
:
Fem
(1654; 33% of non-emptyGender
): तरह, बार, दुनिया, बात, सरकार, शताब्दी, फिल्म, संभावना, सेना, वृद्धिMasc
(3343; 67% of non-emptyGender
): रूप, वर्ष, समय, क्षेत्र, शुरू, काम, साल, युद्ध, उपयोग, दिनEMPTY
(600): लोगों, वहां, लोग, अभी, पहले, बाद, अब, राष्ट्रपति, आगे, आज
Paradigm बार | Masc | Fem |
---|---|---|
बार | बार |
Gender
seems to be lexical feature of NOUN
. 98% lemmas (1794) occur only with one value of Gender
.
VERB
1555 VERB tokens (63% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: VerbForm=EMPTY (1539; 99%), Person=3 (1497; 96%), Number=Sing (1380; 89%), Mood=Ind (1059; 68%), Tense=EMPTY (829; 53%).
VERB
tokens may have the following values of Gender
:
Fem
(362; 23% of non-emptyGender
): की, है, थी, दी, हुई, होती, करती, होगी, आती, लीMasc
(1193; 77% of non-emptyGender
): किया, है, दिया, कहा, हुए, था, हुआ, लिया, होता, करताEMPTY
(913): करने, कर, हो, होने, करना, बन, रहने, देने, बनाने, करते
Paradigm करना | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Imp|Number=Plur|Person=3|Tense=Fut | करेंगे | |
Aspect=Imp|Mood=Imp|Number=Plur|Person=3|Tense=Pres | करें | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=1 | करता | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=1|Tense=Fut | करूंगा | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3 | करता, करना, करे | करती, करत |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Polite=Form | करती | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Fut | करेगा | करेगी |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres | करता, करते | |
Aspect=Imp|Mood=Ind|Number=Plur|Person=3 | करते | करती |
Aspect=Imp|Mood=Ind|Number=Plur|Person=3|Polite=Form | करते | |
Aspect=Imp|Mood=Ind|Number=Plur|Person=3|Tense=Pres | करें | |
Aspect=Perf|Mood=Ind|Number=Sing|Person=3 | किया, किए | की |
Aspect=Perf|Mood=Ind|Number=Sing|Person=3|Tense=Past | किया, की | की, कीं |
Aspect=Perf|Mood=Ind|Number=Plur|Person=3 | की | |
Aspect=Perf|Mood=Ind|Number=Plur|Person=3|Tense=Past | किए | कीं |
Number=Sing | किए | |
Number=Sing|Person=3 | किया, करते, किए, कर, करने, कियकिया | की, करनी |
Number=Sing|Person=3|VerbForm=Inf | करनी | |
Number=Plur|Person=3 | किए, करते, किया | की |
Number=Plur|Person=3|VerbForm=Inf | करने |
PROPN
1338 PROPN tokens (99% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (1337; 100%), Case=Acc (712; 53%).
PROPN
tokens may have the following values of Gender
:
Fem
(189; 14% of non-emptyGender
): इटली, स्पेनिश, क्लिंटन, रोना, केशा, क्यूरी, गिनी, जर्मनी, जैस्मिन, ब्लंटMasc
(1149; 86% of non-emptyGender
): अमेरिका, चीन, ब्रिटेन, ट्रम्प, फ्रांस, यूरोप, मिस्र, रूस, हांगकांग, अफ्रीकाEMPTY
(20): VW, 2C, Aoun, Emicro, ExxonMobil, GEMA, GOP, Hariri, Huawei, IRENA
Paradigm ट्रम्प | Masc | Fem |
---|---|---|
Case=Acc | ट्रम्प | ट्रम्प |
Case=Nom | ट्रम्प |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (905) occur only with one value of Gender
.
ADP
1285 ADP tokens (27% of all ADP
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADP
and Gender
co-occurred: Case=Gen (1200; 93%), Number=Sing (758; 59%).
ADP
tokens may have the following values of Gender
:
Fem
(444; 35% of non-emptyGender
): की, वाली, संबंधीMasc
(841; 65% of non-emptyGender
): के, का, वाले, वाला, योग्य, स्थित, आधारित, केन्द्रित, प्राप्त, लायकEMPTY
(3562): में, के, से, को, ने, पर, लिए, तक, साथ, बाद
Paradigm का | Masc | Fem |
---|---|---|
का | की | |
Number=Sing | के, का | |
Number=Plur | के |
AUX
1221 AUX tokens (89% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Person=3 (1209; 99%), Number=Sing (1020; 84%), Mood=EMPTY (622; 51%), Aspect=EMPTY (620; 51%).
AUX
tokens may have the following values of Gender
:
Fem
(281; 23% of non-emptyGender
): है, गयी, थी, हैं, सकती, रही, थीं, गई, जाती, जाएगीMasc
(940; 77% of non-emptyGender
): है, था, गया, हैं, जाता, सकता, गए, थे, रहा, जानेEMPTY
(145): हैं, जा, रहे, थे, जाने, सकते, गए, है, चाहिए, जाते
Paradigm है | Masc | Fem |
---|---|---|
Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Polite=Form | हैं | |
Aspect=Imp|Mood=Ind|Number=Sing|Person=3 | है | है |
Aspect=Imp|Mood=Ind|Number=Plur|Person=3 | हैं | हैं |
Number=Sing|Person=1 | हूं | |
Number=Sing|Person=3|Polite=Form | हैं | हैं |
Number=Sing|Person=3 | है, हैं | है, हूं, हैं |
Number=Plur|Person=3 | हैं | हैं, है |
PRON
408 PRON tokens (36% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Number=Sing (365; 89%), Gender[psor]=EMPTY (309; 76%), Number[psor]=EMPTY (300; 74%), PronType=EMPTY (297; 73%), Case=Nom (246; 60%), Person=3 (240; 59%).
PRON
tokens may have the following values of Gender
:
Fem
(135; 33% of non-emptyGender
): अपनी, उसकी, उनकी, वह, जिसकी, उसे, जिनकी, हमारी, इसने, उन्हेंMasc
(273; 67% of non-emptyGender
): अपने, वह, उसका, उसके, उसे, इसका, अपना, उसने, मैं, वेEMPTY
(720): जो, यह, उसने, उसके, इसके, जिसमें, उसे, इसे, उन्होंने, वे
Paradigm वह | Masc | Fem |
---|---|---|
Case=Acc|Number=Sing|Number[psor]=Sing|PronType=Prs | उसके, उनके | उसकी |
Case=Acc|Number=Sing | उसे, उसने, उसके, उससे | उसे, उसके, उसने |
Case=Acc|Number=Sing|Polite=Form | उन्हें | उन्हें |
Case=Acc|Number=Plur|Number[psor]=Plur|PronType=Prs | उनके | |
Case=Acc|Number=Plur | उन्होंने, उनके, उन्हें, वे | उन्हें, उन्होंने, वे |
Case=Acc | उनके | |
Case=Nom|Number=Sing|Number[psor]=Sing|Polite=Form|PronType=Prs | उनकी | |
Case=Nom|Number=Sing|Number[psor]=Sing|PronType=Prs | उसका, उसके | उसकी, उनकी |
Case=Nom|Number=Sing|Number[psor]=Plur|Polite=Form|PronType=Prs | उनकी | |
Case=Nom|Number=Sing|Number[psor]=Plur|PronType=Prs | उसका | उनकी |
Case=Nom|Number=Sing | वह, उसका, उनका, वे, वो | उसकी, वह, उनकी, वो |
Case=Nom|Number=Plur|Number[psor]=Plur|Polite=Form|PronType=Prs | उनकी | |
Case=Nom|Number=Plur|Number[psor]=Plur|PronType=Prs | उनकी | |
Case=Nom|Number=Plur | वे, उनका | उनकी |
Case=Nom | उनका | |
Case=Nom|PronType=Prs | उनका | |
Number=Sing|Number[psor]=Sing|PronType=Prs | उसकी | |
Number=Sing | उसका |
ADJ
273 ADJ tokens (14% of all ADJ
tokens) have a non-empty value of Gender
.
ADJ
tokens may have the following values of Gender
:
Fem
(91; 33% of non-emptyGender
): पहली, अच्छी, दूसरी, नयी, बड़ी, पुरानी, ऊंची, पिछली, पूरी, बुरीMasc
(182; 67% of non-emptyGender
): नये, पहले, पिछले, नया, दूसरे, पुराने, पूरा, बड़ा, छोटे, तीसरेEMPTY
(1722): सबसे, शामिल, प्राप्त, स्थापित, अन्य, अमेरिकी, अलग, महत्वपूर्ण, विशेष, कम
Paradigm नया | Masc | Fem |
---|---|---|
_ | नयी | |
Case=Acc|Number=Sing | नये | |
Case=Acc|Number=Plur | नये | |
Case=Nom|Number=Sing | नया | |
Case=Nom|Number=Plur | नये |
DET
39 DET tokens (4% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Definite=EMPTY (39; 100%), Number=Sing (23; 59%).
DET
tokens may have the following values of Gender
:
Fem
(18; 46% of non-emptyGender
): पूरी, थोड़ी, इतनी, कितनी, सारीMasc
(21; 54% of non-emptyGender
): थोड़ा, पूरे, कितने, जिस, समूचे, सारे, इतना, जितना, जोEMPTY
(837): एक, इस, कई, बहुत, ज्यादा, यह, लगभग, कम, उस, केवल
Paradigm पूरा | Masc | Fem |
---|---|---|
_ | पूरी | |
Case=Acc|Number=Sing | पूरे | |
Case=Nom|Number=Sing | पूरी |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
VERB –[obj]–> NOUN (629; 53%),
VERB –[aux]–> AUX (575; 65%),
NOUN –[compound]–> NOUN (221; 56%),
NOUN –[nmod:poss]–> PRON (213; 70%),
PROPN –[flat:name]–> PROPN (194; 94%),
VERB –[aux:pass]–> AUX (171; 86%),
VERB –[nsubj]–> NOUN (161; 51%),
VERB –[nsubj]–> PROPN (159; 72%),
NOUN –[compound]–> PROPN (122; 73%),
NOUN –[conj]–> NOUN (121; 58%).