Treebank Statistics: UD_Marathi-UFAL: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
1747 tokens (45%) have a non-empty value of Gender
.
670 types (61%) occur at least once with a non-empty value of Gender
.
459 lemmas (66%) occur at least once with a non-empty value of Gender
.
The feature is used with 9 part-of-speech tags: NOUN (829; 22% instances), VERB (360; 9% instances), PRON (200; 5% instances), ADP (116; 3% instances), AUX (71; 2% instances), ADJ (58; 2% instances), DET (57; 1% instances), PROPN (55; 1% instances), NUM (1; 0% instances).
NOUN
829 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (699; 84%).
NOUN
tokens may have the following values of Gender
:
Fem
(226; 27% of non-emptyGender
): बहीण, आई, जमीन, राणी, आईला, भूक, हरिणी, मांडी, राख, रात्रMasc
(460; 55% of non-emptyGender
): राजपुत्र, भाऊ, राजा, लाडू, दादा, राजपुत्राने, राजाने, राजाला, राजपुत्राला, देवNeut
(143; 17% of non-emptyGender
): राजा, फुले, शेत, उत्तर, मनात, अंतरा, घरात, झाडा, तोंडात, मांजर
Paradigm राजा | Masc | Neut |
---|---|---|
Case=Abs | राजा | |
Case=Dat | राजाला | |
Case=Erg | राजाने | |
Case=Nom | राजा | राजा |
Gender
seems to be lexical feature of NOUN
. 96% lemmas (313) occur only with one value of Gender
.
VERB
360 VERB tokens (50% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: VerbForm=Fin (346; 96%), Mood=EMPTY (344; 96%), Person=3 (338; 94%), Number=Sing (313; 87%), Aspect=Perf (303; 84%).
VERB
tokens may have the following values of Gender
:
Fem
(86; 24% of non-emptyGender
): आली, म्हणाली, झाली, गेली, बघते, केली, देते, निघाली, बसली, म्हणतेMasc
(195; 54% of non-emptyGender
): म्हणाला, आला, गेला, बसला, निघाला, मेला, लागला, झाले, बनला, आलेNeut
(79; 22% of non-emptyGender
): विचारले, लागली, धरले, वाटले, सांगितले, केले, झाले, दिले, निघाली, निघालेEMPTY
(361): येत, घेऊन, दे, करून, जा, निघून, येऊन, जाऊन, म्हणून, होऊ
Paradigm येणे | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin | येतो | ||
Aspect=Imp|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin | येतो | येते | येते |
Aspect=Perf|Number=Sing|Person=1|VerbForm=Fin | आलो | ||
Aspect=Perf|Number=Sing|Person=2|VerbForm=Fin | आलास | ||
Aspect=Perf|Number=Sing|Person=3|VerbForm=Fin | आला | आली | आले |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | आलेला | आलेली | |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Fin | आले, आली | ||
Mood=Sub|Number=Sing|Person=3|VerbForm=Fin | यावे |
PRON
200 PRON tokens (53% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=Dem (195; 98%), Person=3 (194; 97%), Deixis=Remt (182; 91%), Number=Sing (178; 89%).
PRON
tokens may have the following values of Gender
:
Fem
(57; 28% of non-emptyGender
): ती, ति, तिला, तिने, हीMasc
(115; 57% of non-emptyGender
): तो, त्या, त्याला, त्याने, ते, त्यां, त्यांना, त्यांनी, जो, कोणताNeut
(28; 14% of non-emptyGender
): ते, हे, त्या, त्याला, काही, ती, त्यां, त्यांना, त्यांनी, त्यानेEMPTY
(179): मी, माझ, मला, तुझ, काय, तुम, तुला, तू, आपल, कोण
Paradigm तो | Masc | Fem | Neut |
---|---|---|---|
Case=Abs|Number=Sing | त्या | ति | त्या |
Case=Abs|Number=Plur | त्यां | ||
Case=Acc|Number=Sing | त्याला, तो | ती | ते, त्याला |
Case=Dat|Number=Sing | त्याला | तिला | त्याला |
Case=Dat|Number=Plur | त्यांना | त्यांना | |
Case=Erg|Number=Sing | त्याने | तिने | |
Case=Erg|Number=Plur | त्यांनी | त्यांनी | |
Case=Ins|Number=Sing | त्याने | त्याने | |
Case=Nom|Number=Sing | तो | ती | ते |
Case=Nom|Number=Plur | ते | ती | |
Number=Sing | त्या, तो | ति | त्या, ते |
Number=Plur | त्यां | त्यां |
ADP
116 ADP tokens (40% of all ADP
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADP
and Gender
co-occurred: Case=EMPTY (113; 97%), Number=Sing (100; 86%).
ADP
tokens may have the following values of Gender
:
Fem
(49; 42% of non-emptyGender
): चीMasc
(41; 35% of non-emptyGender
): चा, चेNeut
(26; 22% of non-emptyGender
): चे, ची, चंEMPTY
(176): च्या, वर, कडे, साठी, तील, तून, बरोबर, बाहेर, प्रमाणे, जवळ
Paradigm चा | Masc | Fem | Neut |
---|---|---|---|
Case=Nom|Number=Sing | चा | ची | |
Number=Sing | चा | ची | चे, चं |
Number=Plur | चे | ची |
AUX
71 AUX tokens (36% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: VerbForm=Fin (70; 99%), Person=3 (68; 96%), Polarity=Pos (63; 89%), Tense=Past (59; 83%), Number=Sing (53; 75%).
AUX
tokens may have the following values of Gender
:
Fem
(11; 15% of non-emptyGender
): होती, असलेली, आलीMasc
(37; 52% of non-emptyGender
): होता, होते, असतो, आला, होती, होतो, गेला, शकले, होतासNeut
(23; 32% of non-emptyGender
): होते, होती, आले, असले, नव्हतेEMPTY
(129): आहे, नाही, आहेत, नका, नाहीत, नको, शकत, असेल, नकोस, असतील
Paradigm असणे | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Number=Sing|Person=3|Polarity=Pos|Tense=Pres|VerbForm=Fin | असतो | ||
Aspect=Perf|Number=Sing|Person=3|Polarity=Pos|VerbForm=Fin | असले | ||
Aspect=Perf|Number=Sing|Person=3|Polarity=Pos|VerbForm=Part | असलेली | ||
Number=Sing|Person=1|Polarity=Pos|Tense=Past|VerbForm=Fin | होतो | ||
Number=Sing|Person=2|Polarity=Pos|Tense=Past|VerbForm=Fin | होतास | ||
Number=Sing|Person=3|Polarity=Neg|Tense=Past|VerbForm=Fin | नव्हते | ||
Number=Sing|Person=3|Polarity=Pos|Tense=Past|VerbForm=Fin | होता | होती | होते |
Number=Plur|Person=3|Polarity=Pos|Tense=Past|VerbForm=Fin | होते, होती | होती |
ADJ
58 ADJ tokens (48% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Case=Nom (58; 100%), Number=Sing (48; 83%).
ADJ
tokens may have the following values of Gender
:
Fem
(19; 33% of non-emptyGender
): सारी, इतकी, उभी, एवढी, कायमची, केवढी, गिधाडी, छोटी, बरी, भोळीMasc
(23; 40% of non-emptyGender
): अर्धा, असा, एकटा, छोटा, शहाणा, सारे, उभा, एकुलता, कुठला, जुनेNeut
(16; 28% of non-emptyGender
): असे, खरे, चांगले, पांढरी, आडवे, खोटे, जागे, जुने, दुसरी, मेलेEMPTY
(63): थोड्या, सुखी, अंधाऱ्या, काही, जुन्या, तेथील, दूर, मोठ्या, लहान, साऱ्या
Paradigm असा | Masc | Neut |
---|---|---|
असा | असे |
DET
57 DET tokens (50% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: PronType=Dem (55; 96%), Number=Sing (47; 82%), Case=EMPTY (44; 77%), Deixis=Remt (29; 51%).
DET
tokens may have the following values of Gender
:
Fem
(21; 37% of non-emptyGender
): ती, ही, त्याMasc
(23; 40% of non-emptyGender
): तो, हाNeut
(13; 23% of non-emptyGender
): ती, हे, काही, ते, या, हीEMPTY
(57): एक, त्या, या, एका, आम्ही, काही, कोणी, तुम्हा, दोघा, दोघे
Paradigm तो | Masc | Fem | Neut |
---|---|---|---|
Case=Nom|Deixis=Prox|Number=Sing | तो | ती | |
Case=Nom|Deixis=Prox|Number=Plur | त्या | ती | |
Case=Nom|Deixis=Remt|Number=Sing | ती | ||
Deixis=Remt|Number=Sing | तो | ती | ते |
Deixis=Remt|Number=Plur | त्या |
PROPN
55 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (53; 96%), Case=Nom (29; 53%).
PROPN
tokens may have the following values of Gender
:
Fem
(11; 20% of non-emptyGender
): मेरी, मेरीला, भीमीMasc
(44; 80% of non-emptyGender
): भीमा, जेम्स, केशवचंद्राने, केशवचंद्र, केशवचंद्रां, जेम्सला, केशवचंद्रा, केशवचंद्रांना, केशवचंद्राला, केशवबाबा
NUM
1 NUM tokens (3% of all NUM
tokens) have a non-empty value of Gender
.
NUM
tokens may have the following values of Gender
:
Neut
(1; 100% of non-emptyGender
): चौघेEMPTY
(33): दोन, हजार, एक, चार, दुसरा, पाचपन्नास, चाळीस, दहा, दुसऱ्या, दोन्ही
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
VERB –[nsubj]–> NOUN (107; 51%),
VERB –[nsubj]–> PROPN (13; 62%),
AUX –[nsubj]–> NOUN (3; 75%),
NOUN –[acl:relcl]–> VERB (3; 75%),
NOUN –[compound]–> NOUN (3; 75%),
NOUN –[vocative]–> NOUN (3; 100%),
PROPN –[nsubj]–> PRON (2; 100%),
VERB –[compound:lvc]–> ADJ (2; 67%),
VERB –[discourse]–> NOUN (2; 67%),
VERB –[parataxis]–> NOUN (2; 100%).