Treebank Statistics: UD_Tamil-TTB: POS Tags: AUX
There are 29 AUX
lemmas (1%), 134 AUX
types (4%) and 634 AUX
tokens (7%).
Out of 14 observed tags, the rank of AUX
is: 8 in number of lemmas, 7 in number of types and 6 in number of tokens.
The 10 most frequent AUX
lemmas: உள், படு, வேண்டு, இரு, வரு, கொள், இல், செய், விடு, வா
The 10 most frequent AUX
types: உள்ளது, பட்ட், வேண்டும், உள்ளார், இல்லை, பட்டது, பட்டு, உள்ளனர், உள்ளன, வருகின்றனர்
The 10 most frequent ambiguous lemmas: உள் (AUX 168, ADJ 41, VERB 16, ADP 14), படு (AUX 155, ADJ 6, VERB 1), வேண்டு (AUX 51, VERB 6), இரு (AUX 48, NUM 23, VERB 23, ADJ 19, ADP 13, NOUN 1), வரு (AUX 40, ADJ 10, VERB 6), கொள் (AUX 34, VERB 16, ADP 4, ADJ 2), இல் (AUX 26, VERB 7, ADP 6), செய் (VERB 46, AUX 23, ADJ 7, NOUN 2), விடு (AUX 21, VERB 12, PART 1), வா (VERB 17, AUX 13, ADJ 9)
The 10 most frequent ambiguous types: உள்ளது (AUX 78, VERB 10), வேண்டும் (AUX 49, VERB 1), இல்லை (AUX 26, VERB 4), உள்ளன (AUX 14, VERB 2), இருந்தது (AUX 12, VERB 2), கொண்டு (VERB 10, AUX 9), உள்ளத் (AUX 8, VERB 1), இருந்தார் (AUX 7, VERB 4), செய்து (VERB 12, AUX 6), இருக்கிறது (AUX 5, VERB 1)
- உள்ளது
- வேண்டும்
- இல்லை
- உள்ளன
- இருந்தது
- கொண்டு
- உள்ளத்
- இருந்தார்
- செய்து
- இருக்கிறது
Morphology
The form / lemma ratio of AUX
is 4.620690 (the average of all parts of speech is 1.576386).
The 1st highest number of forms (22) was observed with the lemma “படு”: பட, படக், படவ், படாது, படுகின்றன, படுகின்றனர், படுகிறது, படும், படுவார்கள், பட்ட, பட்டதற்கு, பட்டது, பட்டத், பட்டன, பட்டனர், பட்டார், பட்டால், பட்டு, பட்ட், ப்பட, ப்படும், ப்பட்ட்.
The 2nd highest number of forms (18) was observed with the lemma “இரு”: இருக்கினறனர், இருக்கின்றன, இருக்கிறது, இருக்கிறார், இருக்கிறார்கள், இருக்கிறீர்கள், இருக்கிறேன், இருக்கிறோம், இருந்தது, இருந்தத், இருந்தன, இருந்தார், இருந்தால், இருந்து, இருந்த், இருப்பது, இருப்பத், இருப்பின்.
The 3rd highest number of forms (14) was observed with the lemma “கொள்”: கொண்ட, கொண்டதற்க், கொண்டது, கொண்டத், கொண்டனர், கொண்டார், கொண்டு, கொண்ட், கொள்கிறேன், கொள்ள, கொள்ளல், கொள்வது, கொள்வதைய், கொள்வார்.
AUX
occurs with 11 features: Polarity (634; 100% instances), VerbForm (634; 100% instances), Voice (617; 97% instances), Gender (477; 75% instances), Number (477; 75% instances), Person (477; 75% instances), Mood (431; 68% instances), Tense (263; 41% instances), Polite (85; 13% instances), Case (58; 9% instances), Animacy (41; 6% instances)
AUX
occurs with 26 feature-value pairs: Animacy=Anim
, Case=Acc
, Case=Dat
, Case=Ins
, Case=Nom
, Gender=Com
, Gender=Neut
, Mood=Cnd
, Mood=Ind
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, Polarity=Neg
, Polarity=Pos
, Polite=Form
, Tense=Fut
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Ger
, VerbForm=Inf
, VerbForm=Part
, Voice=Act
, Voice=Pass
AUX
occurs with 52 feature combinations.
The most frequent feature combination is Gender=Neut|Mood=Ind|Number=Sing|Person=3|Polarity=Pos|VerbForm=Fin|Voice=Act
(83 tokens).
Examples: உள்ளது, ஆம், பெற்றுள்ளது
Relations
AUX
nodes are attached to their parents using 8 different relations: aux (608; 96% instances), root (14; 2% instances), acl (4; 1% instances), parataxis (3; 0% instances), advcl (2; 0% instances), ccomp (1; 0% instances), cop (1; 0% instances), csubj (1; 0% instances)
Parents of AUX
nodes belong to 4 different parts of speech: VERB (550; 87% instances), NOUN (69; 11% instances), (14; 2% instances), AUX (1; 0% instances)
615 (97%) AUX
nodes are leaves.
2 (0%) AUX
nodes have one child.
4 (1%) AUX
nodes have two children.
13 (2%) AUX
nodes have three or more children.
The highest child degree of a AUX
node is 6.
Children of AUX
nodes are attached using 14 different relations: punct (20; 33% instances), advcl (6; 10% instances), nsubj (6; 10% instances), advmod (5; 8% instances), obl (5; 8% instances), ccomp (4; 7% instances), obj (4; 7% instances), mark (3; 5% instances), advmod:emph (2; 3% instances), obl:arg (2; 3% instances), aux (1; 2% instances), conj (1; 2% instances), nmod (1; 2% instances), nsubj:pass (1; 2% instances)
Children of AUX
nodes belong to 9 different parts of speech: PUNCT (20; 33% instances), NOUN (15; 25% instances), VERB (10; 16% instances), ADV (5; 8% instances), PART (4; 7% instances), PROPN (4; 7% instances), ADP (1; 2% instances), AUX (1; 2% instances), PRON (1; 2% instances)