Treebank Statistics: UD_Catalan-AnCora: POS Tags: AUX
There are 6 AUX
lemmas (0%), 126 AUX
types (0%) and 22052 AUX
tokens (4%).
Out of 16 observed tags, the rank of AUX
is: 15 in number of lemmas, 8 in number of types and 9 in number of tokens.
The 10 most frequent AUX
lemmas: haver, anar, ser, poder, estar, saber
The 10 most frequent AUX
types: va, ha, és, van, han, ser, estat, són, està, havia
The 10 most frequent ambiguous lemmas: haver (AUX 7473, VERB 780), anar (AUX 6936, VERB 328, NOUN 1), ser (AUX 5267, VERB 88, PROPN 4), poder (AUX 1264, NOUN 56, VERB 25, PROPN 3), estar (AUX 1075, VERB 175, NOUN 1), saber (VERB 148, AUX 37)
The 10 most frequent ambiguous types: va (AUX 5151, VERB 51, NOUN 3, PROPN 1), ha (AUX 4592, VERB 453, PROPN 2), és (AUX 1981, VERB 60, NOUN 45, PROPN 8), van (AUX 1542, VERB 40, PROPN 2), ser (AUX 997, VERB 5, PROPN 3), estat (AUX 542, NOUN 103, VERB 23, PROPN 1), són (AUX 514, VERB 6, PROPN 1), està (AUX 472, VERB 52), havia (AUX 334, VERB 71), pot (AUX 311, VERB 8, PROPN 2, NOUN 1)
- va
- AUX 5151: Se sospita que el metge els va assassinar .
- VERB 51: Si la cosa de el sexe va bé , la resta també va bé “ .
- NOUN 3: No en va , la Gran Bretanya va ser la potència que va controlar Palestina fins a el 1948 .
- PROPN 1: Epstein va firmar una cinquantena de guions , entre ells els de pel·lícules com ‘ L’ home que va venir a sopar ‘ i ‘ The strawberry blonde ‘ .
- ha
- és
- AUX 1981: El pressupost base de el concurs és de 1.173.978,53 euros .
- VERB 60: Precisament un de els objectius de el pla urbanístic és rebaixar lo .
- NOUN 45: El gos ( és a dir , indirectament l’ amo ) era reincident .
- PROPN 8: Alguns de els lemes més corejats són ‘ Lo riu és vida , no a el transvasament ‘ , ‘ Aznar , machote , trasvásate el bigote ‘ o ‘ El Pirineo será nuesto Vietnam ‘ .
- van
- AUX 1542: Conté els casos de 17 pacients més de el doctor que també van morir .
- VERB 40: El dubte i el repte van íntimament units a una forta confiança en si mateix .
- PROPN 2: Les obres i els autors són ‘ Douche ‘ de Marijke van Wanderman ( Holanda ) ; ‘ Sustain ‘ d’ Edward Stewart ( Irlanda de el Nord ) , ‘ Atlàntic ‘ de Sam Tylor-Wood ( Britànic ) ; ‘ Ever is over all ‘ de Pipilotti Rist ( Suïssa ) i Javier Codesal ( Osca ) .
- ser
- AUX 997: El trasplantat va morir , i aquesta pràctica va passar a ser tabú .
- VERB 5: L’ empresari va ser , segons els altres imputats , qui va prendre la polèmica decisió de bloquejar el correu per accedir a el seu interior .
- PROPN 3: Ara l’ èxit són els concursos a l’ estil Quiere ser millonario ? : totes les TV tenen variants d’ aquests formats .
- estat
- AUX 542: Els més importants han estat de dramatúrgia i de ritme .
- NOUN 103: L’ equip de Trifón Poch va tornar a fer evident el seu estat de gràcia .
- VERB 23: El director no ha estat a la presentació .
- PROPN 1: En relació amb aquest estudi , aquest matí s’ ha defensat , en el marc de la UdG , el treball de recerca de el Programa de Doctorat en Medi Ambient : “ Anàlisi de la qualitat de l’ aigua i el sediment de els recs i rieres de Banyoles per a determinar -ne l’ estat ecològic i la seva utilitat com a corredors biològics “ realitzat per Carles Feo Quer , sota la direcció de el Catedràtic d’ Ecologia Dr. Ramon Moreno-Amich .
- són
- AUX 514: Ara són possiblement la primera banda de rock de el país .
- VERB 6: Conèixer la gastronomia i els jocs d’ altres països de el món són alguns altres de els temes escollits en el programari de tallers .
- PROPN 1: Segons aquesta normativa , els governs poden elegir entre diferents frases , com “ fumar mata “ , “ fumar pot matar “ i “ fumar perjudica greument la seva salut i la d’ aquells que són a el seu voltant “ .
- està
- havia
- pot
- AUX 311: D’ aquí a poc temps pot tenir complicacions “ , va vaticinar .
- VERB 8: Cadascú exporta el que pot .
- PROPN 2: Segons aquesta normativa , els governs poden elegir entre diferents frases , com “ fumar mata “ , “ fumar pot matar “ i “ fumar perjudica greument la seva salut i la d’ aquells que són a el seu voltant “ .
- NOUN 1: La jove va demanar li que la deixés fer una vida tranquil·la , i el processat va començar a prendre pastilles que tenia en un pot blanc , tot marxant de nou en cotxe .
Morphology
The form / lemma ratio of AUX
is 21.000000 (the average of all parts of speech is 1.416814).
The 1st highest number of forms (29) was observed with the lemma “ser”: Serem, era, eren, es, essent, estat, ets, foren, fos, fossin, fou, s, sent, ser, seran, seria, serien, serà, seré, seríem, siguem, sigui, siguin, sigut, som, sóc, són, érem, és.
The 2nd highest number of forms (28) was observed with the lemma “haver”: ha, hagi, hagin, haguem, haguessin, hagut, hagués, haguéssim, haguéssin, han, has, hauran, haurem, haureu, hauria, haurien, haurà, hauré, hauríem, havent, haver, havia, havien, havíem, he, hem, heu, hàgim.
The 3rd highest number of forms (24) was observed with the lemma “poder”: podem, poden, podent, poder, podeu, podia, podien, podran, podrem, podria, podrien, podrà, podríem, podíem, poguem, poguessin, pogut, pogués, poguéssim, pot, pots, puc, pugui, puguin.
AUX
occurs with 7 features: VerbForm (22052; 100% instances), Number (20479; 93% instances), Tense (20053; 91% instances), Mood (19830; 90% instances), Person (19830; 90% instances), Gender (650; 3% instances), Foreign (1; 0% instances)
AUX
occurs with 19 feature-value pairs: Foreign=Yes
, Gender=Masc
, Mood=Cnd
, Mood=Imp
, Mood=Ind
, Mood=Sub
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, Tense=Fut
, Tense=Imp
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Ger
, VerbForm=Inf
, VerbForm=Part
AUX
occurs with 36 feature combinations.
The most frequent feature combination is Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin
(12779 tokens).
Examples: va, ha, és, està, pot, s
Relations
AUX
nodes are attached to their parents using 12 different relations: aux (16750; 76% instances), cop (4679; 21% instances), root (293; 1% instances), ccomp (110; 0% instances), conj (70; 0% instances), advcl (61; 0% instances), acl (53; 0% instances), xcomp (19; 0% instances), csubj (6; 0% instances), acl:relcl (5; 0% instances), parataxis (5; 0% instances), compound (1; 0% instances)
Parents of AUX
nodes belong to 14 different parts of speech: VERB (16176; 73% instances), NOUN (2540; 12% instances), ADJ (2238; 10% instances), (293; 1% instances), PRON (271; 1% instances), PROPN (154; 1% instances), NUM (106; 0% instances), ADV (87; 0% instances), DET (64; 0% instances), AUX (62; 0% instances), SYM (32; 0% instances), ADP (14; 0% instances), SCONJ (12; 0% instances), CCONJ (3; 0% instances)
21408 (97%) AUX
nodes are leaves.
44 (0%) AUX
nodes have one child.
51 (0%) AUX
nodes have two children.
549 (2%) AUX
nodes have three or more children.
The highest child degree of a AUX
node is 8.
Children of AUX
nodes are attached using 20 different relations: punct (567; 24% instances), nsubj (451; 19% instances), ccomp (347; 15% instances), mark (173; 7% instances), obj (164; 7% instances), advmod (139; 6% instances), obl (97; 4% instances), cc (85; 4% instances), conj (66; 3% instances), advcl (64; 3% instances), obl:arg (62; 3% instances), aux (48; 2% instances), csubj (32; 1% instances), det (11; 0% instances), parataxis (6; 0% instances), amod (5; 0% instances), compound (5; 0% instances), xcomp (5; 0% instances), case (2; 0% instances), dep (1; 0% instances)
Children of AUX
nodes belong to 14 different parts of speech: PUNCT (567; 24% instances), VERB (453; 19% instances), NOUN (447; 19% instances), PRON (138; 6% instances), SCONJ (137; 6% instances), DET (127; 5% instances), ADV (124; 5% instances), CCONJ (96; 4% instances), ADJ (63; 3% instances), AUX (62; 3% instances), PROPN (62; 3% instances), ADP (41; 2% instances), NUM (11; 0% instances), PART (2; 0% instances)