Treebank Statistics: UD_Catalan: POS Tags: AUX
There are 332 AUX
lemmas (1%), 639 AUX
types (2%) and 24026 AUX
tokens (5%).
Out of 17 observed tags, the rank of AUX
is: 7 in number of lemmas, 6 in number of types and 8 in number of tokens.
The 10 most frequent AUX
lemmas: haver, anar, ser, poder, estar, fer, tornar, començar, deixar, continuar
The 10 most frequent AUX
types: va, ha, és, van, han, ser, estat, són, està, havia
The 10 most frequent ambiguous lemmas: haver (AUX 7478, VERB 775), anar (AUX 6940, VERB 323, NOUN 1), ser (AUX 5254, VERB 100, PROPN 4), poder (AUX 1265, NOUN 56, VERB 24, PROPN 3), estar (AUX 1072, VERB 178, NOUN 1), fer (VERB 1546, AUX 393, ADJ 2, ADP 1, NOUN 1), tornar (AUX 123, VERB 82), començar (VERB 185, AUX 107), deixar (VERB 175, AUX 100), continuar (AUX 90, VERB 80)
The 10 most frequent ambiguous types: va (AUX 5152, VERB 50, NOUN 3, PROPN 1), ha (AUX 4592, VERB 453, PROPN 2), és (AUX 1975, VERB 66, NOUN 45, PROPN 8), van (AUX 1544, VERB 38, PROPN 2), ser (AUX 996, VERB 6, PROPN 3), estat (AUX 540, NOUN 103, VERB 25, PROPN 1), són (AUX 513, VERB 7, PROPN 1), està (AUX 472, VERB 52), havia (AUX 334, VERB 71), pot (AUX 311, VERB 8, PROPN 2, NOUN 1)
- va
- AUX 5152: De fet , en va ser el progenitor intel·lectual i emocional .
- VERB 50: El més de juny no li va bé a TV-3 .
- NOUN 3: No en va , la Gran Bretanya va ser la potència que va controlar Palestina fins al 1948 .
- PROPN 1: Epstein va firmar una cinquantena de guions , entre ells els de pel·lícules com ‘ L’ home que va venir a sopar ‘ i ‘ The strawberry blonde ‘ .
- ha
- és
- AUX 1975: El pressupost base del concurs és de 1.173.978,53 euros .
- VERB 66: Precisament un dels objectius del pla urbanístic és rebaixar lo .
- NOUN 45: El gos ( és a dir , indirectament l’ amo ) era reincident .
- PROPN 8: Alguns dels lemes més corejats són ‘ Lo riu és vida , no al transvasament ‘ , ‘ Aznar , machote , trasvásate el bigote ‘ o ‘ El Pirineo será nuesto Vietnam ‘ .
- van
- AUX 1544: Conté els casos de 17 pacients més del doctor que també van morir .
- VERB 38: El dubte i el repte van íntimament units a una forta confiança en si mateix .
- PROPN 2: Les obres i els autors són ‘ Douche ‘ de Marijke van Wanderman ( Holanda ) ; ‘ Sustain ‘ d’ Edward Stewart ( Irlanda del Nord ) , ‘ Atlàntic ‘ de Sam Tylor-Wood ( Britànic ) ; ‘ Ever is over all ‘ de Pipilotti Rist ( Suïssa ) i Javier Codesal ( Osca ) .
- ser
- AUX 996: De fet , en va ser el progenitor intel·lectual i emocional .
- VERB 6: L’ empresari va ser , segons els altres imputats , qui va prendre la polèmica decisió de bloquejar el correu per accedir al seu interior .
- PROPN 3: Ara l’ èxit són els concursos a l’ estil Quiere ser millonario ? : totes les TV tenen variants d’ aquests formats .
- estat
- AUX 540: Els més importants han estat de dramatúrgia i de ritme .
- NOUN 103: L’ equip de Trifón Poch va tornar a fer evident el seu estat de gràcia .
- VERB 25: El director no ha estat a la presentació .
- PROPN 1: En relació amb aquest estudi , aquest matí s’ ha defensat , en el marc de la UdG , el treball de recerca del Programa de Doctorat en Medi Ambient : “ Anàlisi de la qualitat de l’ aigua i el sediment dels recs i rieres de Banyoles per a determinar -ne l’ estat ecològic i la seva utilitat com a corredors biològics “ realitzat per Carles Feo Quer , sota la direcció del Catedràtic d’ Ecologia Dr. Ramon Moreno-Amich .
- són
- AUX 513: Ara són possiblement la primera banda de rock del país .
- VERB 7: Conèixer la gastronomia i els jocs d’ altres països del món són alguns altres dels temes escollits en el programari de tallers .
- PROPN 1: Segons aquesta normativa , els governs poden elegir entre diferents frases , com “ fumar mata “ , “ fumar pot matar “ i “ fumar perjudica greument la seva salut i la d’ aquells que són al seu voltant “ .
- està
- havia
- pot
- AUX 311: D’ aquí a poc temps pot tenir complicacions “ , va vaticinar .
- VERB 8: Cadascú exporta el que pot .
- PROPN 2: Segons aquesta normativa , els governs poden elegir entre diferents frases , com “ fumar mata “ , “ fumar pot matar “ i “ fumar perjudica greument la seva salut i la d’ aquells que són al seu voltant “ .
- NOUN 1: La jove va demanar li que la deixés fer una vida tranquil·la , i el processat va començar a prendre pastilles que tenia en un pot blanc , tot marxant de nou en cotxe .
Morphology
The form / lemma ratio of AUX
is 1.924699 (the average of all parts of speech is 1.413188).
The 1st highest number of forms (28) was observed with the lemma “haver”: ha, hagi, hagin, haguem, haguessin, hagut, hagués, haguéssim, haguéssin, han, has, hauran, haurem, haureu, hauria, haurien, haurà, hauré, hauríem, havent, haver, havia, havien, havíem, he, hem, heu, hàgim.
The 2nd highest number of forms (28) was observed with the lemma “ser”: Serem, era, eren, essent, estat, ets, foren, fos, fossin, fou, s, sent, ser, seran, seria, serien, serà, seré, seríem, siguem, sigui, siguin, sigut, som, sóc, són, érem, és.
The 3rd highest number of forms (24) was observed with the lemma “poder”: podem, poden, podent, poder, podeu, podia, podien, podran, podrem, podria, podrien, podrà, podríem, podíem, poguem, poguessin, pogut, pogués, poguéssim, pot, pots, puc, pugui, puguin.
AUX
occurs with 6 features: VerbForm (24026; 100% instances), Number (21349; 89% instances), Tense (20904; 87% instances), Mood (20554; 86% instances), Person (20554; 86% instances), Gender (796; 3% instances)
AUX
occurs with 19 feature-value pairs: Gender=Fem
, Gender=Masc
, Mood=Cnd
, Mood=Imp
, Mood=Ind
, Mood=Sub
, Number=Plur
, Number=Sing
, Person=1
, Person=2
, Person=3
, Tense=Fut
, Tense=Imp
, Tense=Past
, Tense=Pres
, VerbForm=Fin
, VerbForm=Ger
, VerbForm=Inf
, VerbForm=Part
AUX
occurs with 42 feature combinations.
The most frequent feature combination is Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin
(13195 tokens).
Examples: va, ha, és, està, pot, fa, sembla, continua, acaba, segueix
Relations
AUX
nodes are attached to their parents using 12 different relations: aux (18633; 78% instances), cop (4733; 20% instances), root (317; 1% instances), ccomp (114; 0% instances), conj (74; 0% instances), advcl (64; 0% instances), acl (59; 0% instances), xcomp (16; 0% instances), csubj (8; 0% instances), parataxis (5; 0% instances), compound (2; 0% instances), case (1; 0% instances)
Parents of AUX
nodes belong to 14 different parts of speech: VERB (17560; 73% instances), NOUN (2886; 12% instances), ADJ (2459; 10% instances), (317; 1% instances), PRON (282; 1% instances), PROPN (165; 1% instances), NUM (112; 0% instances), ADV (100; 0% instances), AUX (70; 0% instances), SYM (32; 0% instances), ADP (19; 0% instances), SCONJ (14; 0% instances), CCONJ (6; 0% instances), DET (4; 0% instances)
23341 (97%) AUX
nodes are leaves.
45 (0%) AUX
nodes have one child.
46 (0%) AUX
nodes have two children.
594 (2%) AUX
nodes have three or more children.
The highest child degree of a AUX
node is 10.
Children of AUX
nodes are attached using 20 different relations: punct (545; 22% instances), nsubj (444; 18% instances), ccomp (424; 17% instances), mark (195; 8% instances), advmod (161; 6% instances), obj (155; 6% instances), obl (104; 4% instances), cc (83; 3% instances), csubj (81; 3% instances), advcl (70; 3% instances), conj (65; 3% instances), aux (54; 2% instances), nmod (48; 2% instances), det (40; 2% instances), compound (23; 1% instances), parataxis (6; 0% instances), amod (5; 0% instances), iobj (3; 0% instances), xcomp (3; 0% instances), dep (2; 0% instances)
Children of AUX
nodes belong to 15 different parts of speech: VERB (564; 22% instances), PUNCT (545; 22% instances), NOUN (528; 21% instances), PRON (146; 6% instances), SCONJ (144; 6% instances), ADV (134; 5% instances), CCONJ (103; 4% instances), ADJ (76; 3% instances), PROPN (73; 3% instances), AUX (70; 3% instances), ADP (52; 2% instances), SYM (47; 2% instances), DET (15; 1% instances), NUM (12; 0% instances), PART (2; 0% instances)