Treebank Statistics: UD_Tamil-MWTT: Features: Gender
This feature is universal.
It occurs with 4 different values: Com, Fem, Masc, Neut.
615 tokens (24%) have a non-empty value of Gender.
266 types (32%) occur at least once with a non-empty value of Gender.
125 lemmas (28%) occur at least once with a non-empty value of Gender.
The feature is used with 5 part-of-speech tags: VERB (351; 14% instances), PRON (153; 6% instances), AUX (71; 3% instances), NOUN (38; 1% instances), PROPN (2; 0% instances).
VERB
351 VERB tokens (69% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=3 (324; 92%), Mood=EMPTY (309; 88%), Polarity=EMPTY (309; 88%), VerbForm=EMPTY (309; 88%), Number=Sing (299; 85%), Tense=Past (211; 60%).
VERB tokens may have the following values of Gender:
Com(81; 23% of non-emptyGender): கொடுத்தார், வந்தார்கள், வேண்டும், பிடிக்கும், வருவார்கள், எழுதினேன், பாடுகிறார்கள், போனேன், போவோம், வாங்கினேன்Fem(3; 1% of non-emptyGender): இருக்கிறாள், பாடினாள், வெறுக்கிறாள்Masc(185; 53% of non-emptyGender): வந்தான், இருக்கிறான், சாப்பிட்டான், உட்கார்ந்தான், பேசினான், கேட்டான், போனான், வாங்கினான், இருந்தான், கொடுத்தான்Neut(82; 23% of non-emptyGender): இருக்கிறது, வரவில்லை, வந்தது, வந்தன, இருக்கின்றன, ஓடுகிறது, திறந்தது, தொங்குகிறது, நேர்ந்தது, அரித்ததுEMPTY(161): வந்து, வர, வா, உண்டு, படித்து, போய், வேண்டாம், அடிக்கப், உட்கார்ந்து, எடுக்க
| Paradigm இரு | Masc | Fem | Neut | Com |
|---|---|---|---|---|
| Mood=Ind|Number=Plur|Person=3|Polarity=Pos|Polite=Form|Tense=Pres|VerbForm=Fin|Voice=Act | இருக்கின்றன | |||
| Number=Sing|Person=1|Tense=Pres | இருக்கிறேன் | |||
| Number=Sing|Person=3|Tense=Fut | இருப்பான் | |||
| Number=Sing|Person=3|Tense=Past | இருந்தான் | இருந்தது | ||
| Number=Sing|Person=3|Tense=Pres | இருக்கிறான் | இருக்கிறாள் | இருக்கிறது | |
| Number=Plur|Person=3|Tense=Pres | இருக்கின்றன | இருக்கிறார்கள் |
PRON
153 PRON tokens (89% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Number=Sing (127; 83%), Animacy=EMPTY (117; 76%), PronType=EMPTY (108; 71%), Case=Nom (86; 56%).
PRON tokens may have the following values of Gender:
Com(98; 64% of non-emptyGender): நான், தன், தன்னை, நீ, என், எங்கள், என்னை, நீங்கள், அவர்கள், நாங்கள்Fem(2; 1% of non-emptyGender): அவள், இவள்Masc(35; 23% of non-emptyGender): அவன், அவனுக்கு, இவன், அவனிடம், அவனுடைய, அவளை, அவள், எவன், அவனாக, அவளுக்குNeut(18; 12% of non-emptyGender): அது, இது, இதை, இதைப், அதுக்கு, அவைகள், இதைத், இவைகள், எதுவும்EMPTY(18): எல்லோரும், என்ன, ஒவ்வொருவருக்கும், எது, சிலவற்றை, சிலவற்றைப், பலவற்றை
| Paradigm அவள் | Masc | Fem |
|---|---|---|
| Case=Acc | அவளை | |
| Case=Dat | அவளுக்கு | |
| Case=Nom | அவள் | அவள் |
Gender seems to be lexical feature of PRON. 95% lemmas (19) occur only with one value of Gender.
AUX
71 AUX tokens (83% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: VerbForm=EMPTY (69; 97%), Person=3 (68; 96%), Polarity=EMPTY (67; 94%), Number=Sing (64; 90%).
AUX tokens may have the following values of Gender:
Com(28; 39% of non-emptyGender): வேண்டும், இருக்கிறார்கள், முடியும், வந்தார்கள், வரும், இருக்கிறார், இருக்கும், இருப்பார்கள், கூடும், போகும்Masc(35; 49% of non-emptyGender): இருக்கிறான், விட்டான், வைத்தான், இருந்தான், இருப்பான், கொண்டான், பட்டான், மாட்டான், உள்ளேன், படுகிறான்Neut(8; 11% of non-emptyGender): ஆயிற்று, முடிந்தது, இருக்கிறது, படுகிறது, போகிறது, வேண்டியதுEMPTY(15): கொண்டு, கூடாது, மாட்டேன், ஆகாது, கொடுக்க, கொண்டே, விட்டு, வேண்டி
| Paradigm இரு | Masc | Neut | Com |
|---|---|---|---|
| Number=Sing|Polite=Form|Tense=Pres | இருக்கிறார் | ||
| Number=Sing|Tense=Fut | இருப்பான் | இருக்கும் | |
| Number=Sing|Tense=Past | இருந்தான் | ||
| Number=Sing|Tense=Pres | இருக்கிறான் | இருக்கிறது | |
| Number=Plur|Tense=Fut | இருப்பார்கள் | ||
| Number=Plur|Tense=Pres | இருக்கிறார்கள் |
NOUN
38 NOUN tokens (7% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Person=3 (38; 100%), Number=Sing (33; 87%), Case=Nom (20; 53%).
NOUN tokens may have the following values of Gender:
Com(1; 3% of non-emptyGender): மாணவர்கள்Masc(12; 32% of non-emptyGender): அப்பாவிடம், அப்பாவுக்கு, மாணவன், தலைவன், பையனைப், பையன், பையன்கள், மாப்பிள்ளையைத், வேலைக்காரன்Neut(25; 66% of non-emptyGender): கடிதம், கதவைத், நாய்கள், இட்லி, இட்லியைச், உடம்புக்கு, ஊருக்குப், கதவு, சாவி, சாவியால்EMPTY(496): வீடு, பரிசு, குழந்தைக்கு, மந்திரி, வீட்டுக்கு, பையன், பணம், புத்தகம், பெண், மணிக்கு
Gender seems to be lexical feature of NOUN. 100% lemmas (22) occur only with one value of Gender.
PROPN
2 PROPN tokens (1% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (2; 100%), Person=3 (2; 100%), Polite=EMPTY (2; 100%).
PROPN tokens may have the following values of Gender:
Neut(2; 100% of non-emptyGender): சென்னைக்கு, பாண்டிச்சேரிEMPTY(313): குமார், குமாருக்கு, குமாரை, ராஜா, ராஜாவை, குமாருக்குத், குமாருக்குப், ராஜாவுக்கு, அமெரிகாவுக்கு, குமாருக்குச்
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
VERB –[nsubj]–> PRON (37; 53%),
PRON –[nsubj]–> PRON (6; 100%),
VERB –[obl]–> PRON (3; 75%),
VERB –[nsubj:nc]–> PRON (2; 67%),
VERB –[xcomp]–> NOUN (2; 100%),
PRON –[nmod]–> PRON (1; 100%),
PROPN –[obl]–> PROPN (1; 100%).