Treebank Statistics: UD_Odia-ODTB: Features: Gender
This feature is universal.
It occurs with 4 different values: Com, Fem, Masc, Neut.
1260 tokens (22%) have a non-empty value of Gender.
782 types (30%) occur at least once with a non-empty value of Gender.
277 lemmas (34%) occur at least once with a non-empty value of Gender.
The feature is used with 6 part-of-speech tags: NOUN (732; 13% instances), PROPN (326; 6% instances), PRON (133; 2% instances), VERB (45; 1% instances), ADJ (23; 0% instances), DET (1; 0% instances).
NOUN
732 NOUN tokens (42% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (671; 92%), Case=Nom (384; 52%).
NOUN tokens may have the following values of Gender:
Com(29; 4% of non-emptyGender): ବୟସରେ, ଅଧ୍ୟାପକ, ଆଦିବାସୀ, ସଂଗ୍ରାମୀ, ଅଧିକାରୀ, ଗୁରୁରୁପେ, ଙ୍କଠାରୁ, ଜନସାଧାରଣଙ୍କର, ଜୀବନସାଥୀ, ଦମ୍ପତିFem(150; 20% of non-emptyGender): ଶିକ୍ଷା, କବିତା, ସେବା, ପରୀକ୍ଷା, ପ୍ରତିଷ୍ଠା, ଭାଷା, ଭାଷାରେ, ମସିହାରେ, ମିଥିଲି, ସ୍ୱାଧୀନତାMasc(306; 42% of non-emptyGender): ପିତା, ଭାଇ, ମସିହାରେ, ପରିବାର, ବିଜ୍ଞାନ, ବିବାହ, ମସିହା, ସମାଜ, କବି, କଲେକ୍ଟରNeut(247; 34% of non-emptyGender): ବର୍ଷ, ବହି, ପଦାର୍ଥ, ବୟସରେ, ମସିହାରେ, ଶିଳ୍ପ, ଅଗଷ୍ଟ, ଆନ୍ଦୋଳନରେ, ଉଦ୍ୟାନ, ଏଣ୍ଟ୍ରାନ୍ସEMPTY(1029): ଗଳ୍ପ, କବିତା, ବର୍ଷ, ସମୟରେ, ନାମ, ପ୍ରଧାନମନ୍ତ୍ରୀ, ଯୋଗ, କଥା, ନିର୍ବାଚନ, ପୁରସ୍କାର
Gender seems to be lexical feature of NOUN. 94% lemmas (188) occur only with one value of Gender.
PROPN
326 PROPN tokens (49% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (324; 99%), Case=Nom (205; 63%).
PROPN tokens may have the following values of Gender:
Com(2; 1% of non-emptyGender): ରାମସୀତାଙ୍କର, ଶିବମୂର୍ତ୍ତିFem(74; 23% of non-emptyGender): ଦେବୀ, ରମାଦେବୀ, ଶାନ୍ତି, ଅନ୍ନପୂର୍ଣ୍ଣା, ଇନ୍ଦିରା, କୁମାରୀ, ଗଙ୍ଗା, ବଙ୍ଗଳା, ରମାଦେବୀଙ୍କ, ଅପ୍ରେଲMasc(201; 62% of non-emptyGender): ଟାଗୋର, ଟାଗୋରଙ୍କ, ନରେନ୍ଦ୍ର, ନରେନ୍ଦ୍ରନାଥ, ଗାନ୍ଧୀ, ଗୋପବନ୍ଧୁ, ଦତ୍ତ, ନରେନ୍ଦ୍ରଙ୍କର, ରମଣ, ଗୋପାଳNeut(49; 15% of non-emptyGender): କଟକ, ଭାରତ, ଭାରତର, ଆମେରିକାରୁ, ଆଶ୍ରମ, ଆସେମ୍ବ୍ଲିଜ୍, ଇଣ୍ଟରମିଡିଏଟ, ଇନ୍ଷ୍ଟିଚିଉସନ୍ରେ, ଇସ୍ରାଏଲ୍ର, ଏପ୍ରିଲEMPTY(342): ଭାରତର, ମାଡ୍ରାସ, ଏ, ଚୀନ, ଦତ୍ତ, ନୋବେଲ, ରମଣ, ରମଣଙ୍କ, ଅଳେଇଚ, ଏସ୍
Gender seems to be lexical feature of PROPN. 95% lemmas (60) occur only with one value of Gender.
PRON
133 PRON tokens (35% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (133; 100%), PronType=Prs (128; 96%), Person=3 (117; 88%), Case=Nom (70; 53%).
PRON tokens may have the following values of Gender:
Com(27; 20% of non-emptyGender): ତାଙ୍କ, ସେ, ତାଙ୍କର, ତାଙ୍କୁ, ତା, ତାଙ୍କଠାରୁFem(7; 5% of non-emptyGender): ସେ, ତାଙ୍କୁ, ତା, ଯା’Masc(96; 72% of non-emptyGender): ସେ, ତାଙ୍କ, ତାଙ୍କର, ମୋ, ମୁଁ, ତାଙ୍କୁ, ବିଲେ, ତା, ଙ୍କ, ନିଜNeut(3; 2% of non-emptyGender): ତାହା, ଏନେଇEMPTY(243): ସେ, ତାଙ୍କ, ତାଙ୍କର, ତାଙ୍କୁ, ମୁଁ, ନିଜର, ନିଜ, ଯାହା, ତାହା, ଯେଉଁ
VERB
45 VERB tokens (5% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=3 (45; 100%), Tense=Past (45; 100%), Voice=EMPTY (44; 98%), Number=Sing (43; 96%), VerbForm=EMPTY (30; 67%), Aspect=EMPTY (29; 64%), Mood=EMPTY (29; 64%).
VERB tokens may have the following values of Gender:
Com(4; 9% of non-emptyGender): କରିଥିଲେ, ଥିଲେ, ହୋଇଥିଲେFem(5; 11% of non-emptyGender): କରିଥିଲେ, ଗଢ଼ିଥିଲେ, ଥିଲେ, ପକାଇଥିଲା, ଶୁଣାଉଥିଲେMasc(36; 80% of non-emptyGender): କରିଥିଲେ, ଲେଖିଥିଲେ, ହୋଇଥିଲା, ଥିଲା, ଥିଲେ, ଦେଇଥିଲେ, ହୋଇଥିଲେ, କରାଇଥିଲେ, କରାଯାଇଥିଲା, କରୁଥିଲେEMPTY(775): କରିଥିଲେ, ଥିଲେ, କରି, ଥିଲା, ହେଲା, ହୋଇଥିଲା, ହୋଇଥିଲେ, କରିବା, କଲେ, ନେଇ
ADJ
23 ADJ tokens (5% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Degree=Pos (12; 52%).
ADJ tokens may have the following values of Gender:
Com(4; 17% of non-emptyGender): ଓଡ଼ିଆ, ଗାନ୍ଧିବାଦୀ, ପିଲାଟି, ଭାରତୀୟFem(3; 13% of non-emptyGender): ଓଡ଼ିଆ, ପରୀ, ଲମ୍ବାMasc(9; 39% of non-emptyGender): ଅଶିକ୍ଷିତ, ତତ୍କାଳୀନ, ଦୁଃସ୍ଥ, ଦୁଷ୍ଟ, ବଡ଼, ବ୍ରାହ୍ମସମାଜଭୁକ୍ତ, ମୁଖ୍ୟ, ମୁଗ୍ଧ, ସୁନାNeut(7; 30% of non-emptyGender): ଅଦ୍ଭୁତ, ତରଳ, ତଳର, ନିକଟସ୍ଥ, ନିର୍ମଳ, ସ୍ୱଦେଶୀ, ସ୍ୱର୍ଣ୍ଣEMPTY(413): ପ୍ରଥମ, ଭଲ, ଛୋଟ, ବିଶେଷ, ନାମକ, ବଡ, ମୁଖ୍ୟ, ଶେଷ, ପରିଚିତ, ପ୍ରିୟ
DET
1 DET tokens (1% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: PronType=Ind (1; 100%).
DET tokens may have the following values of Gender:
Com(1; 100% of non-emptyGender): ଜଣେEMPTY(168): ଏହି, ଜଣେ, ଏକ, ସେହି, ଏ, କିଛି, ସବୁ, କେତେ, ଅନେକ, କୌଣସି
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[compound]–> NOUN (56; 54%),
PROPN –[compound]–> PROPN (50; 83%),
NOUN –[conj]–> NOUN (30; 53%),
PROPN –[compound]–> NOUN (16; 76%),
PROPN –[conj]–> PROPN (15; 54%),
PROPN –[flat]–> PROPN (8; 89%),
NOUN –[appos]–> PROPN (5; 83%),
PROPN –[nmod]–> NOUN (5; 56%),
PROPN –[nmod]–> PROPN (4; 67%),
VERB –[conj]–> VERB (3; 100%).