Gender
: gender
This document is a placeholder for the language-specific documentation
for Gender
.
Treebank Statistics (UD_Tamil)
This feature is universal.
It occurs with 3 different values: Com
, Masc
, Neut
.
5292 tokens (55%) have a non-empty value of Gender
.
2504 types (70%) occur at least once with a non-empty value of Gender
.
1505 lemmas (74%) occur at least once with a non-empty value of Gender
.
The feature is used with 7 part-of-speech tags: NOUN (2753; 29% instances), PROPN (1370; 14% instances), AUX (476; 5% instances), VERB (426; 4% instances), PRON (236; 2% instances), NUM (16; 0% instances), PART (15; 0% instances).
NOUN
2753 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Person=3 (2753; 100%), Number=Sing (2146; 78%), Case=Nom (1808; 66%).
NOUN
tokens may have the following values of Gender
:
Com
(472; 17% of non-emptyGender
): தலைவர், செயலாளர், முதல்வர், பேர், மக்கள், அதிகாரிகள், அமைச்சர், அதிபர், உறுப்பினர், புலிகள்Masc
(2; 0% of non-emptyGender
): அற்றவன், ஆடவனின்Neut
(2279; 83% of non-emptyGender
): அரசு, நாடுகள், ஆண்டு, கட்சி, தலைமைச், நிலையில், அணு, அறிக்கையில், அரசின், பகுதியில்
Paradigm மக்கள் | Neut | Com |
---|---|---|
Animacy=Anim|Case=Acc|Number=Plur | மக்களைக், மக்களை | |
Animacy=Anim|Case=Dat|Number=Plur | மக்களுக்கு | |
Animacy=Anim|Case=Gen|Number=Plur | மக்களின் | |
Animacy=Anim|Case=Loc|Number=Plur | மக்களிடம் | |
Animacy=Anim|Case=Nom|Number=Plur | மக்கள் | |
Case=Dat|Number=Sing | மக்களுக்க் | |
Case=Dat|Number=Sing|Polite=Pol | மக்களுக்குப் |
Gender
seems to be lexical feature of NOUN
. 98% lemmas (818) occur only with one value of Gender
.
PROPN
1370 PROPN tokens (100% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Person=3 (1370; 100%), Number=Sing (1337; 98%), Polite=EMPTY (1106; 81%), Case=Nom (839; 61%).
PROPN
tokens may have the following values of Gender
:
Com
(293; 21% of non-emptyGender
): ஒபாமா, ஜெயலலிதா, சிங், எடியூரப்பா, கருணாநிதி, மோடி, வைகோ, ஒபாமாவின், மாலதி, இந்தியர்கள்Neut
(1077; 79% of non-emptyGender
): இந்தியா, இந்திய, அமெரிக்க, இலங்கை, அதிமுக, பாகிஸ்தான், காங்கிரஸ், கிரிக்கெட், தமிழக, சர்வதேச
Paradigm தமிழர் | Neut | Com |
---|---|---|
Animacy=Anim|Case=Acc|Number=Plur | தமிழர்களை, தமிழர்களைச் | |
Animacy=Anim|Case=Dat|Number=Plur | தமிழர்களுக்க், தமிழர்களுக்குத், தமிழர்களுக்கு | |
Animacy=Anim|Case=Nom|Number=Plur | தமிழர்களின் | |
Case=Loc|Number=Plur | தமிழர்களிடம் | |
Case=Nom|Number=Sing | தமிழர் |
Gender
seems to be lexical feature of PROPN
. 99% lemmas (547) occur only with one value of Gender
.
AUX
476 AUX tokens (76% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Negative=Pos (465; 98%), Person=3 (459; 96%), VerbForm=Fin (418; 88%), Mood=Ind (418; 88%), Voice=Act (400; 84%), Polite=EMPTY (391; 82%), Number=Sing (355; 75%).
AUX
tokens may have the following values of Gender
:
Com
(126; 26% of non-emptyGender
): உள்ளார், உள்ளனர், வருகின்றனர், இருந்தார், உள்ளோம், கொண்டார், படுகின்றனர், பட்டனர், இருக்கிறார், உள்ளேன்Neut
(350; 74% of non-emptyGender
): உள்ளது, வேண்டும், இல்லை, பட்டது, உள்ளன, இருந்தது, ப்படும், வருகிறது, உள்ளத், படுகிறதுEMPTY
(151): பட்ட், பட்டு, கொண்டு, ப்பட, செய்து, கொண்ட், செய்த், விட்டு, செய்ய, செய்யப்
Paradigm உள் | Neut | Com |
---|---|---|
Animacy=Anim|Mood=Ind|Number=Sing|Person=1|VerbForm=Fin | உள்ளேன் | |
Animacy=Anim|Mood=Ind|Number=Plur|Person=1|VerbForm=Fin | உள்ளோம் | |
Animacy=Anim|Mood=Ind|Number=Plur|Person=3|VerbForm=Fin | உள்ளனர் | |
Case=Acc|Number=Sing|Person=3|VerbForm=Ger | உள்ளதைய் | |
Case=Ins|Number=Sing|Person=3|VerbForm=Ger | உள்ளதால் | |
Case=Nom|Number=Sing|Person=3|VerbForm=Ger | உள்ளத், உள்ளது | |
Mood=Ind|Number=Sing|Person=3|Polite=Pol|VerbForm=Fin | உள்ளார் | |
Mood=Ind|Number=Sing|Person=3|VerbForm=Fin | உள்ளது | |
Mood=Ind|Number=Plur|Person=3|VerbForm=Fin | உள்ளன |
VERB
426 VERB tokens (36% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Negative=Pos (424; 100%), Voice=Act (423; 99%), Person=3 (415; 97%), Number=Sing (351; 82%), Case=EMPTY (289; 68%), VerbForm=Fin (289; 68%), Mood=Ind (288; 68%), Polite=EMPTY (283; 66%), Tense=Past (232; 54%).
VERB
tokens may have the following values of Gender
:
Com
(155; 36% of non-emptyGender
): தெரிவித்தார், என்றார், கூறினார், உயிரிழந்தனர், இருந்தார், தெரிவித்தனர், காயமடைந்தனர், பார்வையிட்டார், பெற்றார், பேசினார்Neut
(271; 64% of non-emptyGender
): உள்ளது, தெரிகிறது, தெரிவித்தன, நடைபெறும், இருக்கும், இல்லை, கூறியத், நடைபெற்றது, உயிரிழந்தத், உயிரிழப்பத்EMPTY
(745): தெரிவித்த், செய்து, தெரிவிக்கப், செய்யப், கொண்டு, கலந்து, கூறிய், வெளியிட்ட், வழங்கப், நியமிக்கப்
Paradigm தெரிவி | Neut | Com |
---|---|---|
Case=Dat|Number=Sing|Tense=Past|VerbForm=Ger | தெரிவித்ததற்க் | |
Mood=Ind|Number=Sing|Polite=Pol|Tense=Past|VerbForm=Fin | தெரிவித்தார் | |
Mood=Ind|Number=Sing|Tense=Past|VerbForm=Fin | தெரிவித்தது | |
Mood=Ind|Number=Sing|Tense=Pres|VerbForm=Fin | தெரிவிக்கிறது | |
Mood=Ind|Number=Plur|Polite=Pol|Tense=Past|VerbForm=Fin | தெரிவித்தனர் | |
Mood=Ind|Number=Plur|Polite=Pol|Tense=Pres|VerbForm=Fin | தெரிவிக்கின்றனர் | |
Mood=Ind|Number=Plur|Tense=Past|VerbForm=Fin | தெரிவித்தன |
PRON
236 PRON tokens (95% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: PronType=Prs (222; 94%), Person=3 (196; 83%), Number=Sing (175; 74%), Polite=EMPTY (166; 70%), Animacy=EMPTY (135; 57%), Case=Nom (134; 57%).
PRON
tokens may have the following values of Gender
:
Com
(171; 72% of non-emptyGender
): அவர், அனைவரும், அவர்கள், தனது, நான், அவரது, அவர்களை, அவர்களுக்கு, அவருக்கு, அவர்களதுNeut
(65; 28% of non-emptyGender
): இது, அது, அதை, இதை, அதில், இதன், அதற்க், அனைத்தும், எதுவும், அதனைத்EMPTY
(12): அதிகம், இந்த, மிகவும், முழுவதும், அந்தத், குறைவாகவே, கொஞ்சம், முழுக்
Gender
seems to be lexical feature of PRON
. 100% lemmas (25) occur only with one value of Gender
.
NUM
16 NUM tokens (6% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: NumType=EMPTY (9; 56%), NumForm=Digit (9; 56%).
NUM
tokens may have the following values of Gender
:
Com
(1; 6% of non-emptyGender
): ஒருவர்Neut
(15; 94% of non-emptyGender
): ஒன்றை, 10-க்க், 1200க்க், 15-ல், 18-ல், 1992-96ல், 1995ல், 2009-ல், 444-ல், ஆயிரத்த்EMPTY
(236): இரு, 2, ஆயிரம், மூன்று, லட்சம், 10, 20, 3, 80, இரண்டு
Gender
seems to be lexical feature of NUM
. 100% lemmas (13) occur only with one value of Gender
.
PART
15 PART tokens (2% of all PART
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PART
and Gender
co-occurred: VerbForm=Ger (15; 100%), Negative=Pos (15; 100%).
PART
tokens may have the following values of Gender
:
Neut
(15; 100% of non-emptyGender
): என்பது, என்பதை, என்பதால், எடுப்பத், என்பதைய், கொடுப்பத்EMPTY
(639): உம், ஆன, என்று, ஆக, என, என்ற், ஆகவ், போது, என்ற, தான்
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[nmod]–> NOUN (526; 73%),
NOUN –[nmod]–> PROPN (473; 69%),
PROPN –[nmod]–> NOUN (115; 79%),
NOUN –[conj]–> NOUN (89; 95%),
PROPN –[conj]–> PROPN (77; 94%),
NOUN –[dobj]–> NOUN (19; 58%),
NOUN –[nsubj]–> PROPN (14; 70%),
NOUN –[nsubj]–> NOUN (14; 52%),
PROPN –[conj]–> NOUN (12; 75%),
NUM –[nmod]–> NOUN (9; 82%).
Gender in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]