Treebank Statistics: UD_Sanskrit-UFAL: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem, Masc, Neut.
881 tokens (48%) have a non-empty value of Gender.
647 types (61%) occur at least once with a non-empty value of Gender.
500 lemmas (64%) occur at least once with a non-empty value of Gender.
The feature is used with 10 part-of-speech tags: NOUN (436; 24% instances), PRON (120; 7% instances), VERB (98; 5% instances), ADJ (77; 4% instances), PROPN (72; 4% instances), DET (64; 3% instances), NUM (10; 1% instances), ADV (2; 0% instances), AUX (1; 0% instances), PART (1; 0% instances).
NOUN
436 NOUN tokens (78% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Compound=EMPTY (436; 100%), Number=Sing (368; 84%).
NOUN tokens may have the following values of Gender:
Fem(54; 12% of non-emptyGender): भद्रे, भार्या, संसदि, अटवीम्, अटव्याम्, इच्छया, इच्छा, उत्पत्तिः, कन्या, कीलिकाMasc(261; 60% of non-emptyGender): अर्थम्, देव, अर्थाः, राजा, कौलिकः, लोके, अर्थः, उपायम्, ब्राह्मणः, भद्रNeut(121; 28% of non-emptyGender): नाम, अर्थम्, नमः, शास्त्रम्, कथामुखम्, करणात्, क्षीरम्, नगरम्, पुस्तकम्, प्रयोजनम्EMPTY(124): मास, वणिक्, शास्त्र, सिंह, अर्थ, उदक, कर्म, काल, गुण, नगर
| Paradigm अर्थ | Masc | Neut |
|---|---|---|
| Case=Acc|Number=Sing | अर्थम् | अर्थम् |
| Case=Gen|Number=Sing | अर्थस्य | |
| Case=Ins|Number=Sing | अर्थेन | |
| Case=Nom|Number=Sing | अर्थः | |
| Case=Nom|Number=Plur | अर्थाः |
Gender seems to be lexical feature of NOUN. 94% lemmas (283) occur only with one value of Gender.
PRON
120 PRON tokens (67% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (105; 88%), Person=EMPTY (100; 83%), PronType=Dem (78; 65%).
PRON tokens may have the following values of Gender:
Fem(9; 8% of non-emptyGender): सा, तया, अस्याम्, एनाम्, तस्याः, याMasc(71; 59% of non-emptyGender): तस्य, स, सः, भवान्, यस्या, अयम्, असौ, एतान्, तस्मै, यःNeut(40; 33% of non-emptyGender): तत्, किम्, एतत्, इदम्, किं, तस्मात्, यत्, एतद्, एतेषां, किंचिद्EMPTY(59): अहम्, मम, मया, अस्मत्, त्वम्, अस्माकम्, तव, त्वत्, त्वाम्, मे
| Paradigm तद् | Masc | Fem | Neut |
|---|---|---|---|
| Case=Abl|Number=Sing|PronType=Dem | तस्मात् | तस्याः | तस्मात् |
| Case=Acc|Number=Sing|PronType=Dem | तम् | तत् | |
| Case=Acc|Number=Plur|PronType=Dem | तान् | तानि | |
| Case=Dat|Number=Sing|PronType=Dem | तस्मै | ||
| Case=Gen|Number=Sing|Person=3|PronType=Dem | तस्य | तस्य | |
| Case=Gen|Number=Sing|Poss=Yes|PronType=Dem | तस्य | ||
| Case=Gen|Number=Sing|PronType=Dem | तस्य | ||
| Case=Gen|Number=Dual|PronType=Dem | तयोर् | ||
| Case=Gen|Number=Plur|PronType=Dem | तेषाम् | ||
| Case=Ins|Number=Sing|PronType=Dem | तेन | तया | |
| Case=Nom|Number=Sing|Person=3|PronType=Dem | तत् | ||
| Case=Nom|Number=Sing|PronType=Dem | स, सः, सह् | सा | तत्, तद् |
| Case=Nom|Number=Dual|Person=3|PronType=Dem | तौ | ||
| Case=Nom|Number=Dual|Person=3|PronType=Prs | तौ | ||
| Case=Nom|Number=Plur|PronType=Dem | ते |
VERB
98 VERB tokens (31% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Mood=EMPTY (98; 100%), Person=EMPTY (98; 100%), VerbForm=Part (98; 100%), Voice=Pass (88; 90%), Case=Nom (85; 87%), Number=Sing (82; 84%), Tense=Past (67; 68%).
VERB tokens may have the following values of Gender:
Fem(6; 6% of non-emptyGender): अनुगृहीता, असंभाव्यां, करणीया, जनिता, परिणीता, समुत्पन्नाMasc(59; 60% of non-emptyGender): गतः, प्रस्थितः, अगतः, अधिरूढः, अनुज्ञातः, अनुमतः, अन्वितः, अपृष्टः, अप्रयुज्यमानः, अभीष्टNeut(33; 34% of non-emptyGender): उक्तं, आरब्धम्, अभिहितम्, उक्ते, अगम्यम्, अभिहितं, आलम्बितम्, कर्तव्यम्, कार्यम्, कृतम्EMPTY(216): अब्रवीत्, आह, भवति, गत्वा, करिष्यामि, श्रुत्वा, उच्यते, करोमि, प्रोवाच, अनुष्ठीयताम्
| Paradigm कृ | Masc | Neut |
|---|---|---|
| Number=Sing|Tense=Fut | कर्तव्यः | कर्तव्यम्, कार्यम् |
| Number=Sing|Tense=Past | कृतः | कृतम् |
| Number=Plur|Tense=Fut | कर्तव्याः |
ADJ
77 ADJ tokens (68% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Compound=EMPTY (77; 100%), Number=Sing (65; 84%), Case=Nom (41; 53%).
ADJ tokens may have the following values of Gender:
Fem(8; 10% of non-emptyGender): एकाकिनी, कन्या, परां, मानुषी, वन्ध्या, शुभायाम्, श्लक्ष्णया, सकलाम्Masc(52; 68% of non-emptyGender): महान्, अजातौ, अतिरस्कृतः, अत्यन्तं, अद्यतनः, अप्रधानः, अप्राप्तस्य, अविद्वान्, अशाश्वतो, आद्यःNeut(17; 22% of non-emptyGender): प्रथमम्, अगामीनि, अङ्गी, ज्ञातम्, दाक्षिणात्ये, नित्यम्, परम्, पीड्यमानानि, पूरम्, प्रभूतेEMPTY(36): गम्भीर, महा, सकल, सर्व, अजात, अनन्त, अनुचित, अप्राप्त, अहीन, आकर्ण्य
| Paradigm महत् | Masc | Neut |
|---|---|---|
| महान् | महत् |
Gender seems to be lexical feature of ADJ. 97% lemmas (66) occur only with one value of Gender.
PROPN
72 PROPN tokens (77% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Compound=EMPTY (72; 100%), Number=Sing (62; 86%), Case=Nom (48; 67%).
PROPN tokens may have the following values of Gender:
Fem(5; 7% of non-emptyGender): आद्या, चंडिका, दितिर्, मथुरा, श्रीर्Masc(51; 71% of non-emptyGender): दमनकः, पिङ्गलकः, करटकः, विष्णुशर्मा, सञ्जीवकस्य, अनन्तशक्तिश्, अमरशक्तिर्, आदित्यौ, इद्रः, उग्रशक्तिःNeut(16; 22% of non-emptyGender): कामशास्त्राणि, महिलारोप्यं, अपरीक्षितकारकाणि, अर्थशास्त्रं, अर्थशास्त्राणि, चाणक्यादीनि, धर्मशास्त्राणि, नीतिशस्त्रम्, पञ्चतन्त्रकम्, पञ्चतन्त्रम्EMPTY(22): सरस्वती, अदिति, अर्थ, अर्थशास्त्र, काकोलूकीय, गणपति, चन्द्र, धर्म, नन्दक, नयशास्त्र
Gender seems to be lexical feature of PROPN. 100% lemmas (57) occur only with one value of Gender.
DET
64 DET tokens (91% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Number=Sing (57; 89%), PronType=Dem (45; 70%).
DET tokens may have the following values of Gender:
Fem(6; 9% of non-emptyGender): तया, असौ, एषा, तस्याम्, तांMasc(36; 56% of non-emptyGender): अयम्, तम्, स, एनम्, कः, तस्य, तान्, ते, अनेन, असौNeut(22; 34% of non-emptyGender): तत्, इदम्, किम्, एतत्, एतस्मिन्, कस्मिंश्चिद्, किं, किंचिद्, तेन, यत्EMPTY(6): कतिभिः, किंचिद्, तत्, तद्, सर्व, स्व
| Paradigm तद् | Masc | Fem | Neut |
|---|---|---|---|
| Case=Abl|Number=Sing | तस्मात् | ||
| Case=Acc|Number=Sing|Person=3 | तत् | ||
| Case=Acc|Number=Sing | तम् | तां | तत् |
| Case=Acc|Number=Plur | तान् | ||
| Case=Gen|Number=Sing|Person=3 | तस्य | ||
| Case=Gen|Number=Sing | तस्य | ||
| Case=Ins|Number=Sing|Person=3 | तया | ||
| Case=Ins|Number=Sing | तेन | तया | तेन |
| Case=Loc|Number=Sing | तस्याम् | ||
| Case=Nom|Number=Sing|Person=3 | तत् | ||
| Case=Nom|Number=Sing | स, सः | तत् | |
| Case=Nom|Number=Plur | ते |
NUM
10 NUM tokens (56% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Compound=EMPTY (10; 100%), NumType=Card (10; 100%), Number=Sing (7; 70%), Case=Nom (6; 60%).
NUM tokens may have the following values of Gender:
Fem(2; 20% of non-emptyGender): तिस्रः, पञ्चशतीMasc(6; 60% of non-emptyGender): एकः, त्रयः, एकम्, षट्केनNeut(2; 20% of non-emptyGender): शतेनEMPTY(8): अशीति, एक, त्रि, द्वादशभिर्, पञ्चभिः, षट्, षड्भिः, सप्त
| Paradigm त्रि | Masc | Fem |
|---|---|---|
| त्रयः | तिस्रः |
ADV
2 ADV tokens (1% of all ADV tokens) have a non-empty value of Gender.
ADV tokens may have the following values of Gender:
Neut(2; 100% of non-emptyGender): आदि, यतःEMPTY(192): अपि, अथ, इति, एवम्, ततः, तत्र, यथा, अत्र, तथा, कथम्
AUX
1 AUX tokens (6% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: Mood=EMPTY (1; 100%), Number=Sing (1; 100%), Person=EMPTY (1; 100%), Tense=Pres (1; 100%), VerbForm=Part (1; 100%), Voice=Act (1; 100%).
AUX tokens may have the following values of Gender:
Neut(1; 100% of non-emptyGender): सत्त्वम्EMPTY(15): अस्ति, अस्तु, अस्मि, भवति, स्यात्
PART
1 PART tokens (3% of all PART tokens) have a non-empty value of Gender.
The most frequent other feature values with which PART and Gender co-occurred: Polarity=EMPTY (1; 100%).
PART tokens may have the following values of Gender:
Neut(1; 100% of non-emptyGender): किम्EMPTY(36): न, किम्, नहि, मा
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[det]–> DET (42; 84%),
NOUN –[amod]–> ADJ (32; 53%),
PROPN –[conj]–> PROPN (13; 65%),
NOUN –[acl]–> VERB (12; 75%),
NOUN –[nsubj]–> NOUN (7; 70%),
ADJ –[conj]–> ADJ (5; 71%),
PRON –[nsubj:cop]–> NOUN (5; 83%),
VERB –[conj]–> VERB (5; 71%),
NOUN –[det]–> PRON (4; 80%),
PRON –[acl]–> PRON (4; 100%).