Treebank Statistics: UD_Catalan: POS Tags: DET
There are 59 DET
lemmas (0%), 102 DET
types (0%) and 72596 DET
tokens (14%).
Out of 17 observed tags, the rank of DET
is: 11 in number of lemmas, 10 in number of types and 3 in number of tokens.
The 10 most frequent DET
lemmas: el, un, aquest, seu, la, tot, altre, l’, mateix, algun
The 10 most frequent DET
types: la, el, l’, les, els, un, una, aquest, seva, aquesta
The 10 most frequent ambiguous lemmas: el (DET 51645, PRON 4), un (DET 8696, PRON 952, NUM 320), aquest (DET 3220, PRON 212, NOUN 1, PROPN 1), seu (DET 2886, NOUN 82, PRON 32, ADJ 3), la (DET 710, PROPN 2), tot (DET 906, PRON 542, ADV 48), altre (DET 662, PRON 278, NOUN 3, PROPN 1), mateix (DET 409, NOUN 66, PRON 58, ADV 18, ADJ 1), algun (DET 271, PRON 138), divers (DET 223, ADJ 30, PRON 2)
The 10 most frequent ambiguous types: la (DET 17342, PRON 230), el (DET 10133, PRON 206), l’ (DET 8936, PRON 169), les (DET 5545, PRON 107), els (DET 4201, PRON 246), un (DET 4480, PRON 593, NUM 176), una (DET 3653, NUM 140, PRON 111, NOUN 3), aquest (DET 1290, PRON 53, NOUN 1, PROPN 1), seva (DET 1209, ADJ 2, PRON 2, NOUN 1), aquesta (DET 984, PRON 52, PROPN 1)
- la
- el
- l’
- les
- els
- un
- una
- DET 3653: Bankinter tindrà una marca per a aliances internacionals .
- NUM 140: També s’ ha fet una ofrena simbòlica a ‘ la Moreneta ‘ .
- PRON 111: El CAP era una de les reivindicacions pendents de les Roquetes .
- NOUN 3: ’ Lligams ‘ es podrà visitar fins el dia 25 de gener , de dilluns a divendres de nou a una i de quatre a nou a la sala d’ exposicions de l’ Escola d’ Art .
- aquest
- DET 1290: La restauració es farà durant la segona quinzena d’ aquest mes de juny .
- PRON 53: Per això aquest és un sector que s’ ha de cuidar i estimular .
- NOUN 1: A tres quarts de deu d’ aquest matí tres individus han entrat armats a la seu del diari ‘ El Mundo ‘ a Barcelona , al carrer Diputació , i després d’ encanonar un guarda de seguretat i un empleat han pujat al primer pis i han advertit que havien col·locat un paquet bomba que explotaria al cap de deu minuts .
- PROPN 1: D’ altra banda , les lletres de cançons ja editades sel·leccionades pel jurat i que opten al premi de votació popular organitzat conjuntament amb Catalunya Ràdio , són : Platja de llum ( Rafa Xambó ) , Com si res ( Gossos ) , Sense terra ( Obrint pas ) , De muda en muda ( Adrià Puntí ) , Somiatruites ( Albert Pla ) , Caos n.13 ( Falsterbo-Marí ) , Ens veiem a Folegandres ( Lluís Llach ) , Merry Christmes ( Eduard Canimas ) , Dins aquest iglú ( Antònia Font ) , Remigi ( Òscar Briz ) , Quan dic l’ Escala ( Josep Tero ) , En la rebequeria ( Roger Mas ) .
- seva
- DET 1209: Com que no ho estava , va demanar el seu telèfon i la seva adreça .
- ADJ 2: ” Programa , programa , programa “ , va dir Trias , fent seva una frase a què recorre habitualment Julio Anguita .
- PRON 2: La teoria és que una de les causes de la caiguda d’ un 61% dels beneficis de BA el 1998 han estat les pèrdues de la seva subsidiària barata , que competeix directament amb easyJet en un segment del comerç aeri que fa tres anys ni existia .
- NOUN 1: La gran part de les informacions , grans o petites , que els lectors de tot el món llegeixen al “ seu “ diari , escolten a la “ seva “ emissora de ràdio o veuen a la “ seva “ televisió procedeixen , no dels “ seus “ periodistes , sinó d’ una agència de notícies , a la qual no poden dir seva perquè no saben ni que existeix , o si ho saben , no saben exactament a què es dedica .
- aquesta
- DET 984: El trasplantat va morir , i aquesta pràctica va passar a ser tabú .
- PRON 52: Segons el conseller aquesta és una xifra de satisfacció ‘ inaudita ‘ .
- PROPN 1: Entre els temes de l’ àlbum hi ha cançons compostes per Francesc Ribera i Marcel Casellas al costat de temes reversionats , com el ‘ Tot explota ‘ d’ Ovidi Montllor o la cançó de Maria del Mar Bonet ‘ Què volen aquesta gent ? ‘ .
Morphology
The form / lemma ratio of DET
is 1.728814 (the average of all parts of speech is 1.413188).
The 1st highest number of forms (6) was observed with the lemma “el”: el, els, l, l’, la, les.
The 2nd highest number of forms (4) was observed with the lemma “algun”: algun, alguna, algunes, alguns.
The 3rd highest number of forms (4) was observed with the lemma “aquell”: aquell, aquella, aquelles, aquells.
DET
occurs with 7 features: PronType (72596; 100% instances), Number (72502; 100% instances), Gender (61191; 84% instances), Definite (48988; 67% instances), Person (3140; 4% instances), Poss (3140; 4% instances), Number[psor] (223; 0% instances)
DET
occurs with 19 feature-value pairs: Definite=Def
, Definite=Ind
, Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, Number[psor]=Plur
, Number[psor]=Sing
, Person=1
, Person=2
, Person=3
, Poss=Yes
, PronType=Art
, PronType=Dem
, PronType=Ind
, PronType=Int
, PronType=Prs
, PronType=Rel
, PronType=Tot
DET
occurs with 49 feature combinations.
The most frequent feature combination is Definite=Def|Gender=Fem|Number=Sing|PronType=Art
(17092 tokens).
Examples: la, L’
Relations
DET
nodes are attached to their parents using 16 different relations: det (72146; 99% instances), fixed (129; 0% instances), advmod (76; 0% instances), conj (61; 0% instances), mark (52; 0% instances), compound (48; 0% instances), cop (38; 0% instances), case (10; 0% instances), flat (10; 0% instances), nmod (6; 0% instances), obl (6; 0% instances), obj (5; 0% instances), root (4; 0% instances), appos (2; 0% instances), nsubj (2; 0% instances), ccomp (1; 0% instances)
Parents of DET
nodes belong to 15 different parts of speech: NOUN (58713; 81% instances), PROPN (8916; 12% instances), DET (1508; 2% instances), NUM (993; 1% instances), PRON (752; 1% instances), ADJ (703; 1% instances), VERB (616; 1% instances), SYM (201; 0% instances), ADP (134; 0% instances), ADV (35; 0% instances), AUX (15; 0% instances), (4; 0% instances), CCONJ (2; 0% instances), PUNCT (2; 0% instances), X (2; 0% instances)
69686 (96%) DET
nodes are leaves.
2238 (3%) DET
nodes have one child.
324 (0%) DET
nodes have two children.
348 (0%) DET
nodes have three or more children.
The highest child degree of a DET
node is 28.
Children of DET
nodes are attached using 25 different relations: det (1450; 34% instances), nummod (562; 13% instances), case (405; 10% instances), nmod (396; 9% instances), punct (285; 7% instances), flat (268; 6% instances), fixed (157; 4% instances), appos (141; 3% instances), advmod (97; 2% instances), cc (64; 2% instances), compound (64; 2% instances), mark (64; 2% instances), amod (53; 1% instances), nsubj (53; 1% instances), obj (45; 1% instances), conj (34; 1% instances), obl (31; 1% instances), acl (14; 0% instances), ccomp (6; 0% instances), parataxis (4; 0% instances), cop (3; 0% instances), dep (3; 0% instances), advcl (2; 0% instances), xcomp (2; 0% instances), aux (1; 0% instances)
Children of DET
nodes belong to 15 different parts of speech: DET (1508; 36% instances), NUM (581; 14% instances), PROPN (487; 12% instances), ADP (427; 10% instances), NOUN (309; 7% instances), PUNCT (286; 7% instances), SYM (232; 6% instances), ADV (94; 2% instances), CCONJ (89; 2% instances), SCONJ (87; 2% instances), ADJ (63; 1% instances), VERB (26; 1% instances), PRON (10; 0% instances), AUX (4; 0% instances), PART (1; 0% instances)