Treebank Statistics: UD_Catalan: POS Tags: PROPN
There are 10097 PROPN
lemmas (38%), 10093 PROPN
types (27%) and 46732 PROPN
tokens (9%).
Out of 17 observed tags, the rank of PROPN
is: 1 in number of lemmas, 1 in number of types and 5 in number of tokens.
The 10 most frequent PROPN
lemmas: Catalunya, barcelona, generalitat, Govern, sant, ajuntament, Girona, Josep, CiU, PP
The 10 most frequent PROPN
types: Catalunya, Barcelona, Generalitat, Govern, sant, Ajuntament, Girona, Josep, CiU, PP
The 10 most frequent ambiguous lemmas: generalitat (NOUN 2, PROPN 1), sant (NOUN 3, ADJ 1, PROPN 1), ajuntament (NOUN 143, PROPN 1), estat (NOUN 123, PROPN 5), consell (NOUN 68, PROPN 3), Pla (PROPN 150, NOUN 1), cultura (NOUN 78, PROPN 4), ambient (NOUN 40, PROPN 24, ADJ 3), medi (NOUN 34, PROPN 22), civil (ADJ 52, NOUN 3, PROPN 1)
The 10 most frequent ambiguous types: Catalunya (PROPN 781, NOUN 1), Govern (PROPN 442, NOUN 1), sant (NOUN 2, PROPN 1), Ajuntament (PROPN 295, NOUN 2), estat (AUX 540, NOUN 103, VERB 25, PROPN 1), Pla (PROPN 150, NOUN 2), cultura (NOUN 71, PROPN 4), Santa (PROPN 98, NOUN 1), Medi (PROPN 95, NOUN 1), ambient (NOUN 37, ADJ 3, PROPN 2)
- Catalunya
- Govern
- PROPN 442: El Govern frenarà la promesa reducció de tarifes telefòniques .
- NOUN 1: La moció ha estat aprovada per unanimitat , després d’ una esmena del Partit Popular que feia referència al passatge ‘ Demanar al Govern Central de l’ Estat espanyol que no posi impediments perquè el català sigui reconegut com a llengua oficial ‘ .
- sant
- Ajuntament
- estat
- AUX 540: Els més importants han estat de dramatúrgia i de ritme .
- NOUN 103: L’ equip de Trifón Poch va tornar a fer evident el seu estat de gràcia .
- VERB 25: El director no ha estat a la presentació .
- PROPN 1: En relació amb aquest estudi , aquest matí s’ ha defensat , en el marc de la UdG , el treball de recerca del Programa de Doctorat en Medi Ambient : “ Anàlisi de la qualitat de l’ aigua i el sediment dels recs i rieres de Banyoles per a determinar -ne l’ estat ecològic i la seva utilitat com a corredors biològics “ realitzat per Carles Feo Quer , sota la direcció del Catedràtic d’ Ecologia Dr. Ramon Moreno-Amich .
- Pla
- cultura
- Santa
- Medi
- PROPN 95: ” El conseller de Medi Ambient , Felip Puig , va insistir que el projecte “ no està tancat .
- NOUN 1: Segons Josep Amat , vicepresident primer del CILMA . , aquest programa “ té com a objectiu preservar els espais perifèrics d’ aquestes poblacions , que no són urbanitzables , però que també se ‘ls pot treure un rendiment amb la creació de rutes turístiques , i altres activitats compatibles amb el Medi Ambient “ .
- ambient
- NOUN 37: L’ ambient es caldejava .
- ADJ 3: Recentment s’ ha descobert un material que produeix bastant fred a temperatura ambient .
- PROPN 2: La proposició presentada per Joan Boada , diputat-portaveu d’ IC-V , considera que cal donar un ús social i públic a tot l’ espai expropiat - no només als habitatges - els anys seixanta , evitant ‘ una simple cessió dels habitatges per part de Medi ambient a entitats o institucions ‘ .
Morphology
The form / lemma ratio of PROPN
is 0.999604 (the average of all parts of speech is 1.413188).
The 1st highest number of forms (2) was observed with the lemma “B”: 4B, B.
The 2nd highest number of forms (2) was observed with the lemma “CE”: 2001/37/CE, CE.
The 3rd highest number of forms (2) was observed with the lemma “Carrer”: Carrer, Madrazo.
PROPN
occurs with 2 features: Gender (1; 0% instances), Number (1; 0% instances)
PROPN
occurs with 2 feature-value pairs: Gender=Masc
, Number=Sing
PROPN
occurs with 2 feature combinations.
The most frequent feature combination is _
(46731 tokens).
Examples: Catalunya, Barcelona, Generalitat, Govern, sant, Ajuntament, Girona, Josep, CiU, PP
Relations
PROPN
nodes are attached to their parents using 20 different relations: flat (17915; 38% instances), nmod (10759; 23% instances), nsubj (5524; 12% instances), appos (3834; 8% instances), conj (3461; 7% instances), obl (2747; 6% instances), obj (2068; 4% instances), iobj (195; 0% instances), root (148; 0% instances), acl (18; 0% instances), dep (15; 0% instances), ccomp (13; 0% instances), parataxis (10; 0% instances), advcl (9; 0% instances), det (8; 0% instances), csubj (3; 0% instances), nsubj:pass (2; 0% instances), cc (1; 0% instances), orphan (1; 0% instances), xcomp (1; 0% instances)
Parents of PROPN
nodes belong to 16 different parts of speech: PROPN (21585; 46% instances), NOUN (13485; 29% instances), VERB (8963; 19% instances), ADJ (1288; 3% instances), DET (487; 1% instances), ADV (236; 1% instances), NUM (188; 0% instances), (148; 0% instances), PRON (110; 0% instances), AUX (73; 0% instances), ADP (56; 0% instances), SYM (50; 0% instances), CCONJ (25; 0% instances), PUNCT (24; 0% instances), PART (12; 0% instances), SCONJ (2; 0% instances)
14399 (31%) PROPN
nodes are leaves.
14269 (31%) PROPN
nodes have one child.
9366 (20%) PROPN
nodes have two children.
8698 (19%) PROPN
nodes have three or more children.
The highest child degree of a PROPN
node is 29.
Children of PROPN
nodes are attached using 24 different relations: case (20235; 31% instances), flat (17490; 26% instances), det (8888; 13% instances), punct (7328; 11% instances), conj (3532; 5% instances), cc (2522; 4% instances), nmod (2417; 4% instances), appos (1076; 2% instances), amod (829; 1% instances), acl (724; 1% instances), mark (250; 0% instances), nummod (233; 0% instances), cop (141; 0% instances), advmod (129; 0% instances), nsubj (105; 0% instances), obl (38; 0% instances), aux (31; 0% instances), dep (12; 0% instances), advcl (11; 0% instances), obj (7; 0% instances), parataxis (7; 0% instances), csubj (6; 0% instances), ccomp (1; 0% instances), orphan (1; 0% instances)
Children of PROPN
nodes belong to 15 different parts of speech: PROPN (21585; 33% instances), ADP (20144; 31% instances), DET (8916; 14% instances), PUNCT (7330; 11% instances), CCONJ (2472; 4% instances), NOUN (1856; 3% instances), ADJ (976; 1% instances), SYM (879; 1% instances), VERB (695; 1% instances), NUM (370; 1% instances), SCONJ (324; 0% instances), ADV (195; 0% instances), AUX (165; 0% instances), PRON (103; 0% instances), PART (3; 0% instances)