home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Tamil-TTB: POS Tags: AUX

There are 29 AUX lemmas (1%), 134 AUX types (4%) and 634 AUX tokens (7%). Out of 14 observed tags, the rank of AUX is: 8 in number of lemmas, 7 in number of types and 6 in number of tokens.

The 10 most frequent AUX lemmas: உள், படு, வேண்டு, இரு, வரு, கொள், இல், செய், விடு, வா

The 10 most frequent AUX types: உள்ளது, பட்ட், வேண்டும், உள்ளார், இல்லை, பட்டது, பட்டு, உள்ளனர், உள்ளன, வருகின்றனர்

The 10 most frequent ambiguous lemmas: உள் (AUX 168, ADJ 41, VERB 16, ADP 14), படு (AUX 155, ADJ 6, VERB 1), வேண்டு (AUX 51, VERB 6), இரு (AUX 48, NUM 23, VERB 23, ADJ 19, ADP 13, NOUN 1), வரு (AUX 40, ADJ 10, VERB 6), கொள் (AUX 34, VERB 16, ADP 4, ADJ 2), இல் (AUX 26, VERB 7, ADP 6), செய் (VERB 46, AUX 23, ADJ 7, NOUN 2), விடு (AUX 21, VERB 12, PART 1), வா (VERB 17, AUX 13, ADJ 9)

The 10 most frequent ambiguous types: உள்ளது (AUX 78, VERB 10), வேண்டும் (AUX 49, VERB 1), இல்லை (AUX 26, VERB 4), உள்ளன (AUX 14, VERB 2), இருந்தது (AUX 12, VERB 2), கொண்டு (VERB 10, AUX 9), உள்ளத் (AUX 8, VERB 1), இருந்தார் (AUX 7, VERB 4), செய்து (VERB 12, AUX 6), இருக்கிறது (AUX 5, VERB 1)

Morphology

The form / lemma ratio of AUX is 4.620690 (the average of all parts of speech is 1.576386).

The 1st highest number of forms (22) was observed with the lemma “படு”: பட, படக், படவ், படாது, படுகின்றன, படுகின்றனர், படுகிறது, படும், படுவார்கள், பட்ட, பட்டதற்கு, பட்டது, பட்டத், பட்டன, பட்டனர், பட்டார், பட்டால், பட்டு, பட்ட், ப்பட, ப்படும், ப்பட்ட்.

The 2nd highest number of forms (18) was observed with the lemma “இரு”: இருக்கினறனர், இருக்கின்றன, இருக்கிறது, இருக்கிறார், இருக்கிறார்கள், இருக்கிறீர்கள், இருக்கிறேன், இருக்கிறோம், இருந்தது, இருந்தத், இருந்தன, இருந்தார், இருந்தால், இருந்து, இருந்த், இருப்பது, இருப்பத், இருப்பின்.

The 3rd highest number of forms (14) was observed with the lemma “கொள்”: கொண்ட, கொண்டதற்க், கொண்டது, கொண்டத், கொண்டனர், கொண்டார், கொண்டு, கொண்ட், கொள்கிறேன், கொள்ள, கொள்ளல், கொள்வது, கொள்வதைய், கொள்வார்.

AUX occurs with 11 features: Polarity (634; 100% instances), VerbForm (634; 100% instances), Voice (617; 97% instances), Gender (477; 75% instances), Number (477; 75% instances), Person (477; 75% instances), Mood (431; 68% instances), Tense (263; 41% instances), Polite (85; 13% instances), Case (58; 9% instances), Animacy (41; 6% instances)

AUX occurs with 26 feature-value pairs: Animacy=Anim, Case=Acc, Case=Dat, Case=Ins, Case=Nom, Gender=Com, Gender=Neut, Mood=Cnd, Mood=Ind, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Neg, Polarity=Pos, Polite=Form, Tense=Fut, Tense=Past, Tense=Pres, VerbForm=Fin, VerbForm=Ger, VerbForm=Inf, VerbForm=Part, Voice=Act, Voice=Pass

AUX occurs with 52 feature combinations. The most frequent feature combination is Gender=Neut|Mood=Ind|Number=Sing|Person=3|Polarity=Pos|VerbForm=Fin|Voice=Act (83 tokens). Examples: உள்ளது, ஆம், பெற்றுள்ளது

Relations

AUX nodes are attached to their parents using 8 different relations: aux (608; 96% instances), root (14; 2% instances), acl (4; 1% instances), parataxis (3; 0% instances), advcl (2; 0% instances), ccomp (1; 0% instances), cop (1; 0% instances), csubj (1; 0% instances)

Parents of AUX nodes belong to 4 different parts of speech: VERB (550; 87% instances), NOUN (69; 11% instances), (14; 2% instances), AUX (1; 0% instances)

615 (97%) AUX nodes are leaves.

2 (0%) AUX nodes have one child.

4 (1%) AUX nodes have two children.

13 (2%) AUX nodes have three or more children.

The highest child degree of a AUX node is 6.

Children of AUX nodes are attached using 14 different relations: punct (20; 33% instances), advcl (6; 10% instances), nsubj (6; 10% instances), advmod (5; 8% instances), obl (5; 8% instances), ccomp (4; 7% instances), obj (4; 7% instances), mark (3; 5% instances), advmod:emph (2; 3% instances), obl:arg (2; 3% instances), aux (1; 2% instances), conj (1; 2% instances), nmod (1; 2% instances), nsubj:pass (1; 2% instances)

Children of AUX nodes belong to 9 different parts of speech: PUNCT (20; 33% instances), NOUN (15; 25% instances), VERB (10; 16% instances), ADV (5; 8% instances), PART (4; 7% instances), PROPN (4; 7% instances), ADP (1; 2% instances), AUX (1; 2% instances), PRON (1; 2% instances)