Treebank Statistics: UD_Marathi-UFAL: Features: Gender
This feature is universal.
It occurs with 3 different values: Fem
, Masc
, Neut
.
1747 tokens (45%) have a non-empty value of Gender
.
566 types (60%) occur at least once with a non-empty value of Gender
.
461 lemmas (66%) occur at least once with a non-empty value of Gender
.
The feature is used with 8 part-of-speech tags: NOUN (829; 22% instances), VERB (344; 9% instances), PRON (200; 5% instances), ADP (116; 3% instances), AUX (87; 2% instances), ADJ (59; 2% instances), DET (57; 1% instances), PROPN (55; 1% instances).
NOUN
829 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (699; 84%).
NOUN
tokens may have the following values of Gender
:
Fem
(226; 27% of non-emptyGender
): _, बहीण, जमीन, आई, राणी, आईला, भूक, हरिणी, राख, आठवणMasc
(460; 55% of non-emptyGender
): _, राजपुत्र, भाऊ, लाडू, दादा, राजपुत्राने, राजाने, राजाला, राजपुत्राला, देवNeut
(143; 17% of non-emptyGender
): _, राजा, फुले, शेत, उत्तर, मनात, घरात, तोंडात, मांजर, रत्ने
Paradigm राजा | Masc | Neut |
---|---|---|
Case=Abs | _ | |
Case=Dat | राजाला | |
Case=Erg | राजाने | |
Case=Nom | राजा, _ | राजा, _ |
Gender
seems to be lexical feature of NOUN
. 96% lemmas (313) occur only with one value of Gender
.
VERB
344 VERB tokens (49% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: VerbForm=Fin (330; 96%), Mood=EMPTY (328; 95%), Person=3 (323; 94%), Number=Sing (306; 89%), Aspect=Perf (287; 83%).
VERB
tokens may have the following values of Gender
:
Fem
(83; 24% of non-emptyGender
): आली, म्हणाली, गेली, बघते, केली, झाली, देते, निघाली, बसली, म्हणतेMasc
(187; 54% of non-emptyGender
): म्हणाला, आला, गेला, बसला, निघाला, मेला, बनला, आले, गेले, झालेNeut
(74; 22% of non-emptyGender
): विचारले, आले, धरले, वाटले, सांगितले, केले, झाले, निघाली, निघाले, पाठविलेEMPTY
(359): _, येत, घेऊन, दे, करून, जा, निघून, येऊन, जाऊन, म्हणून
Paradigm येणे | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin | येतो | ||
Aspect=Imp|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin | येतो | येते | येते |
Aspect=Perf|Number=Sing|Person=1|VerbForm=Fin | आलो | ||
Aspect=Perf|Number=Sing|Person=2|VerbForm=Fin | आलास | ||
Aspect=Perf|Number=Sing|Person=3|VerbForm=Fin | आला | आली | आले |
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | आलेला | आलेली | |
Aspect=Perf|Number=Plur|Person=3|VerbForm=Fin | आले, आली | ||
Mood=Sub|Number=Sing|Person=3|VerbForm=Fin | यावे |
PRON
200 PRON tokens (53% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=EMPTY (196; 98%), Person=3 (194; 97%), Deixis=Remt (182; 91%), Number=Sing (178; 89%).
PRON
tokens may have the following values of Gender
:
Fem
(57; 28% of non-emptyGender
): ती, _, तिला, तिने, हीMasc
(115; 57% of non-emptyGender
): तो, _, त्याला, त्याने, ते, त्यांना, त्यांनी, जो, कोणता, दोघंNeut
(28; 14% of non-emptyGender
): _, हे, ते, त्याला, काही, ती, त्यांना, त्यांनी, दोघेEMPTY
(179): _, मी, काय, मला, तुला, कोण, तुम्ही, तू, आपण, कोणी
Paradigm तो | Masc | Fem | Neut |
---|---|---|---|
Case=Abs|Number=Sing | _ | _ | _ |
Case=Abs|Number=Plur | _ | ||
Case=Acc|Number=Sing | _, तो, त्याला | ती | ते, त्याला |
Case=Dat|Number=Sing | त्याला | तिला | त्याला |
Case=Dat|Number=Plur | त्यांना | त्यांना | |
Case=Erg|Number=Sing | त्याने | तिने | |
Case=Erg|Number=Plur | त्यांनी | त्यांनी | |
Case=Ins|Number=Sing | त्याने | _ | |
Case=Nom|Number=Sing | तो, _ | ती | ते, _ |
Case=Nom|Number=Plur | ते | ती | |
Case=Nom|Number=Plur|PronType=Rel | ते | ||
Number=Sing | _, तो | _ | _, ते |
Number=Plur | _ | _ |
ADP
116 ADP tokens (39% of all ADP
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADP
and Gender
co-occurred: Case=EMPTY (113; 97%), Number=Sing (100; 86%).
ADP
tokens may have the following values of Gender
:
Fem
(49; 42% of non-emptyGender
): _Masc
(41; 35% of non-emptyGender
): _Neut
(26; 22% of non-emptyGender
): _EMPTY
(182): _, बाहेर, पुढे, पलीकडे, मध्ये, मागे
Paradigm चा | Masc | Fem | Neut |
---|---|---|---|
Case=Nom|Number=Sing | _ | _ | |
Number=Sing | _ | _ | _ |
Number=Plur | _ | _ |
AUX
87 AUX tokens (40% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Polarity=EMPTY (87; 100%), VerbForm=Fin (86; 99%), Person=3 (83; 95%), Number=Sing (60; 69%), Aspect=EMPTY (59; 68%), Tense=Past (59; 68%).
AUX
tokens may have the following values of Gender
:
Fem
(14; 16% of non-emptyGender
): होती, झाली, असलेली, आलीMasc
(45; 52% of non-emptyGender
): होता, होते, लागला, असतो, आला, लागले, होती, होतो, झाले, झालोNeut
(28; 32% of non-emptyGender
): होते, होती, लागली, असले, दिले, नव्हतेEMPTY
(131): आहे, नाही, आहेत, नका, नाहीत, नको, असेल, नकोस, _, असतील
Paradigm असणे | Masc | Fem | Neut |
---|---|---|---|
Aspect=Imp|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin | असतो | ||
Aspect=Perf|Number=Sing|Person=3|VerbForm=Fin | असले | ||
Aspect=Perf|Number=Sing|Person=3|VerbForm=Part | असलेली | ||
Number=Sing|Person=1|Tense=Past|VerbForm=Fin | होतो | ||
Number=Sing|Person=2|Tense=Past|VerbForm=Fin | होतास | ||
Number=Sing|Person=3|Tense=Past|VerbForm=Fin | होता | होती | होते |
Number=Plur|Person=3|Tense=Past|VerbForm=Fin | होते, होती | होती |
ADJ
59 ADJ tokens (48% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Case=Nom (59; 100%), Number=Sing (48; 81%).
ADJ
tokens may have the following values of Gender
:
Fem
(19; 32% of non-emptyGender
): सारी, _, इतकी, उभी, एवढी, कायमची, केवढी, गिधाडी, छोटी, बरीMasc
(23; 39% of non-emptyGender
): अर्धा, _, छोटा, शहाणा, सारे, असा, उभा, एकटा, एकुलता, कुठलाNeut
(17; 29% of non-emptyGender
): असे, चांगले, पांढरी, _, आडवे, खरे, खोटे, चौघे, जागे, जुनेEMPTY
(65): थोड्या, सुखी, अंधाऱ्या, काही, जुन्या, तेथील, दूर, मोठ्या, लहान, साऱ्या
Paradigm असा | Masc | Neut |
---|---|---|
_, असा | असे |
DET
57 DET tokens (51% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: PronType=Dem (55; 96%), Number=Sing (47; 82%), Case=EMPTY (44; 77%), Deixis=Remt (29; 51%).
DET
tokens may have the following values of Gender
:
Fem
(21; 37% of non-emptyGender
): ती, ही, त्या, _Masc
(23; 40% of non-emptyGender
): तो, हा, _Neut
(13; 23% of non-emptyGender
): ती, हे, काही, ते, या, हीEMPTY
(55): एक, त्या, या, एका, _, आम्ही, तुम्हा, दोघा, दोघे, ह्या
Paradigm तो | Masc | Fem | Neut |
---|---|---|---|
Case=Nom|Deixis=Prox|Number=Sing | तो | ती | |
Case=Nom|Deixis=Prox|Number=Plur | त्या | ती | |
Case=Nom|Deixis=Remt|Number=Sing | ती | ||
Deixis=Remt|Number=Sing | तो, _ | ती | ते |
Deixis=Remt|Number=Plur | त्या, _ |
PROPN
55 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Number=Sing (53; 96%), Case=Nom (29; 53%).
PROPN
tokens may have the following values of Gender
:
Fem
(11; 20% of non-emptyGender
): मेरी, _, मेरीला, भीमीMasc
(44; 80% of non-emptyGender
): _, भीमा, जेम्स, केशवचंद्राने, केशवचंद्र, जेम्सला, केशवचंद्रांना, केशवचंद्राला, केशवबाबा, भीमाला
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
VERB –[nsubj]–> PROPN (13; 59%),
NOUN –[acl:relcl]–> VERB (3; 75%),
NOUN –[compound]–> NOUN (3; 75%),
NOUN –[vocative]–> NOUN (3; 100%),
PROPN –[nsubj]–> PRON (2; 100%),
VERB –[compound:lvc]–> ADJ (2; 67%),
VERB –[discourse]–> NOUN (2; 67%),
VERB –[parataxis]–> NOUN (2; 100%),
ADJ –[compound:redup]–> ADJ (1; 100%),
ADJ –[compound]–> ADJ (1; 100%).