Treebank Statistics: UD_Catalan-AnCora: POS Tags: DET
There are 54 DET
lemmas (0%), 104 DET
types (0%) and 87267 DET
tokens (16%).
Out of 16 observed tags, the rank of DET
is: 7 in number of lemmas, 9 in number of types and 3 in number of tokens.
The 10 most frequent DET
lemmas: el, un, aquest, seu, la, tot, altre, mateix, algun, divers
The 10 most frequent DET
types: el, la, l’, els, les, un, una, aquest, seva, aquesta
The 10 most frequent ambiguous lemmas: un (DET 8780, PRON 951, NUM 321), aquest (DET 3220, PRON 212, NOUN 1, PROPN 1), seu (DET 2907, NOUN 82, PRON 33, ADJ 3), tot (DET 909, PRON 542, ADV 48), altre (DET 662, PRON 278, NOUN 3, PROPN 1), mateix (DET 410, NOUN 65, PRON 58, ADV 18, ADJ 1), algun (DET 271, PRON 138), divers (DET 223, ADJ 30, PRON 2), cap (NOUN 323, DET 215, PRON 23, ADP 7, PROPN 4), cada (DET 206, NOUN 13, PRON 12, NUM 2)
The 10 most frequent ambiguous types: el (DET 20947, PRON 206), la (DET 17342, PRON 230), l’ (DET 8936, PRON 169), els (DET 8050, PRON 246), les (DET 5545, PRON 107), un (DET 4481, PRON 592, NUM 176), una (DET 3653, NUM 140, PRON 111, NOUN 3), aquest (DET 1290, PRON 53, NOUN 1, PROPN 1), seva (DET 1209, ADJ 2, PRON 2, NOUN 1), aquesta (DET 984, PRON 52, PROPN 1)
- el
- la
- l’
- els
- les
- un
- una
- DET 3653: Bankinter tindrà una marca per a aliances internacionals .
- NUM 140: També s’ ha fet una ofrena simbòlica a ‘ la Moreneta ‘ .
- PRON 111: El CAP era una de les reivindicacions pendents de les Roquetes .
- NOUN 3: ’ Lligams ‘ es podrà visitar fins el dia 25 de gener , de dilluns a divendres de nou a una i de quatre a nou a la sala d’ exposicions de l’ Escola d’ Art .
- aquest
- DET 1290: La restauració es farà durant la segona quinzena d’ aquest mes de juny .
- PRON 53: Per això aquest és un sector que s’ ha de cuidar i estimular .
- NOUN 1: A tres quarts de deu d’ aquest matí tres individus han entrat armats a la seu de el diari ‘ El Mundo ‘ a Barcelona , a el carrer Diputació , i després d’ encanonar un guarda de seguretat i un empleat han pujat a el primer pis i han advertit que havien col·locat un paquet bomba que explotaria a el cap de deu minuts .
- PROPN 1: D’ altra banda , les lletres de cançons ja editades sel·leccionades per el jurat i que opten a el premi de votació popular organitzat conjuntament amb Catalunya Ràdio , són : Platja de llum ( Rafa Xambó ) , Com si res ( Gossos ) , Sense terra ( Obrint pas ) , De muda en muda ( Adrià Puntí ) , Somiatruites ( Albert Pla ) , Caos n.13 ( Falsterbo-Marí ) , Ens veiem a Folegandres ( Lluís Llach ) , Merry Christmes ( Eduard Canimas ) , Dins aquest iglú ( Antònia Font ) , Remigi ( Òscar Briz ) , Quan dic l’ Escala ( Josep Tero ) , En la rebequeria ( Roger Mas ) .
- seva
- DET 1209: Com que no ho estava , va demanar el seu telèfon i la seva adreça .
- ADJ 2: ” Programa , programa , programa “ , va dir Trias , fent seva una frase a què recorre habitualment Julio Anguita .
- PRON 2: La teoria és que una de les causes de la caiguda d’ un 61 % de els beneficis de BA el 1998 han estat les pèrdues de la seva subsidiària barata , que competeix directament amb easyJet en un segment de el comerç aeri que fa tres anys ni existia .
- NOUN 1: La gran part de les informacions , grans o petites , que els lectors de tot el món llegeixen a el “ seu “ diari , escolten a la “ seva “ emissora de ràdio o veuen a la “ seva “ televisió procedeixen , no de els “ seus “ periodistes , sinó d’ una agència de notícies , a la qual no poden dir seva perquè no saben ni que existeix , o si ho saben , no saben exactament a què es dedica .
- aquesta
- DET 984: El trasplantat va morir , i aquesta pràctica va passar a ser tabú .
- PRON 52: Segons el conseller aquesta és una xifra de satisfacció ‘ inaudita ‘ .
- PROPN 1: Entre els temes de l’ àlbum hi ha cançons compostes per Francesc Ribera i Marcel Casellas a el costat de temes reversionats , com el ‘ Tot explota ‘ d’ Ovidi Montllor o la cançó de Maria de el Mar Bonet ‘ Què volen aquesta gent ? ‘ .
Morphology
The form / lemma ratio of DET
is 1.925926 (the average of all parts of speech is 1.416814).
The 1st highest number of forms (6) was observed with the lemma “el”: el, els, l, l’, la, les.
The 2nd highest number of forms (4) was observed with the lemma “algun”: algun, alguna, algunes, alguns.
The 3rd highest number of forms (4) was observed with the lemma “aquell”: aquell, aquella, aquelles, aquells.
DET
occurs with 8 features: PronType (87262; 100% instances), Number (87168; 100% instances), Gender (75857; 87% instances), Definite (63654; 73% instances), Person (3139; 4% instances), Poss (3139; 4% instances), Number[psor] (223; 0% instances), Foreign (4; 0% instances)
DET
occurs with 20 feature-value pairs: Definite=Def
, Definite=Ind
, Foreign=Yes
, Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, Number[psor]=Plur
, Number[psor]=Sing
, Person=1
, Person=2
, Person=3
, Poss=Yes
, PronType=Art
, PronType=Dem
, PronType=Ind
, PronType=Int
, PronType=Prs
, PronType=Rel
, PronType=Tot
DET
occurs with 53 feature combinations.
The most frequent feature combination is Definite=Def|Gender=Masc|Number=Sing|PronType=Art
(22744 tokens).
Examples: el
Relations
DET
nodes are attached to their parents using 21 different relations: det (86230; 99% instances), obj (163; 0% instances), nmod (157; 0% instances), fixed (131; 0% instances), nsubj (128; 0% instances), conj (96; 0% instances), obl (83; 0% instances), advmod (75; 0% instances), mark (53; 0% instances), compound (48; 0% instances), root (37; 0% instances), xcomp (24; 0% instances), appos (14; 0% instances), flat (10; 0% instances), acl (5; 0% instances), ccomp (5; 0% instances), advcl (2; 0% instances), csubj (2; 0% instances), nsubj:outer (2; 0% instances), expl (1; 0% instances), obl:arg (1; 0% instances)
Parents of DET
nodes belong to 13 different parts of speech: NOUN (68549; 79% instances), PROPN (12459; 14% instances), DET (1578; 2% instances), NUM (1391; 2% instances), PRON (958; 1% instances), ADJ (921; 1% instances), VERB (599; 1% instances), SYM (355; 0% instances), ADP (153; 0% instances), ADV (137; 0% instances), AUX (127; 0% instances), (37; 0% instances), CCONJ (3; 0% instances)
83849 (96%) DET
nodes are leaves.
2502 (3%) DET
nodes have one child.
542 (1%) DET
nodes have two children.
374 (0%) DET
nodes have three or more children.
The highest child degree of a DET
node is 15.
Children of DET
nodes are attached using 26 different relations: det (1516; 30% instances), case (623; 12% instances), acl:relcl (587; 12% instances), nummod (559; 11% instances), flat (264; 5% instances), punct (242; 5% instances), nmod (202; 4% instances), fixed (157; 3% instances), appos (141; 3% instances), mark (107; 2% instances), advmod (102; 2% instances), nsubj (95; 2% instances), cc (94; 2% instances), compound (64; 1% instances), amod (56; 1% instances), cop (48; 1% instances), obj (44; 1% instances), conj (43; 1% instances), obl (37; 1% instances), acl (16; 0% instances), aux (11; 0% instances), advcl (9; 0% instances), ccomp (6; 0% instances), parataxis (4; 0% instances), dep (3; 0% instances), xcomp (2; 0% instances)
Children of DET
nodes belong to 15 different parts of speech: DET (1578; 31% instances), ADP (650; 13% instances), NUM (581; 12% instances), VERB (560; 11% instances), PROPN (489; 10% instances), NOUN (401; 8% instances), PUNCT (242; 5% instances), SCONJ (123; 2% instances), CCONJ (115; 2% instances), ADV (107; 2% instances), ADJ (96; 2% instances), AUX (64; 1% instances), PRON (22; 0% instances), SYM (3; 0% instances), PART (1; 0% instances)