Treebank Statistics: UD_Catalan-AnCora: POS Tags: PROPN
There are 10040 PROPN lemmas (39%), 10043 PROPN types (27%) and 46590 PROPN tokens (9%).
Out of 16 observed tags, the rank of PROPN is: 1 in number of lemmas, 1 in number of types and 5 in number of tokens.
The 10 most frequent PROPN lemmas: Catalunya, barcelona, generalitat, Govern, sant, ajuntament, Girona, Josep, CiU, PP
The 10 most frequent PROPN types: Catalunya, Barcelona, Generalitat, Govern, sant, Ajuntament, Girona, Josep, CiU, PP
The 10 most frequent ambiguous lemmas: generalitat (NOUN 2, PROPN 1), sant (NOUN 3, ADJ 1, PROPN 1), ajuntament (NOUN 143, PROPN 1), estat (NOUN 123, PROPN 5), consell (NOUN 68, PROPN 3), cultura (NOUN 78, PROPN 4), ambient (NOUN 40, PROPN 24, ADJ 3), medi (NOUN 34, PROPN 22), civil (ADJ 52, NOUN 3, PROPN 1), general (ADJ 297, NOUN 25, PROPN 1)
The 10 most frequent ambiguous types: Catalunya (PROPN 781, NOUN 1), Govern (PROPN 442, NOUN 1), sant (NOUN 2, PROPN 1), Ajuntament (PROPN 295, NOUN 2), estat (AUX 543, NOUN 103, VERB 22, PROPN 1), Pla (PROPN 150, NOUN 2), cultura (NOUN 71, PROPN 4), Santa (PROPN 98, NOUN 1), Medi (PROPN 95, NOUN 1), ambient (NOUN 37, ADJ 3, PROPN 2)
- Catalunya
- Govern
- PROPN 442: El Govern frenarà la promesa reducció de tarifes telefòniques .
- NOUN 1: La moció ha estat aprovada per unanimitat , després d’ una esmena de el Partit Popular que feia referència a el passatge ‘ Demanar a el Govern Central de l’ Estat espanyol que no posi impediments perquè el català sigui reconegut com a llengua oficial ‘ .
- sant
- Ajuntament
- estat
- AUX 543: Els més importants han estat de dramatúrgia i de ritme .
- NOUN 103: L’ equip de Trifón Poch va tornar a fer evident el seu estat de gràcia .
- VERB 22: El director no ha estat a la presentació .
- PROPN 1: En relació amb aquest estudi , aquest matí s’ ha defensat , en el marc de la UdG , el treball de recerca de el Programa de Doctorat en Medi Ambient : “ Anàlisi de la qualitat de l’ aigua i el sediment de els recs i rieres de Banyoles per a determinar -ne l’ estat ecològic i la seva utilitat com a corredors biològics “ realitzat per Carles Feo Quer , sota la direcció de el Catedràtic d’ Ecologia Dr. Ramon Moreno-Amich .
- Pla
- cultura
- Santa
- Medi
- PROPN 95: El conseller de Medi Ambient , Felip Puig , va insistir que el projecte “ no està tancat “ .
- NOUN 1: Segons Josep Amat , vicepresident primer de el CILMA . , aquest programa “ té com a objectiu preservar els espais perifèrics d’ aquestes poblacions , que no són urbanitzables , però que també se ‘ls pot treure un rendiment amb la creació de rutes turístiques , i altres activitats compatibles amb el Medi Ambient “ .
- ambient
- NOUN 37: L’ ambient es caldejava .
- ADJ 3: Recentment s’ ha descobert un material que produeix bastant fred a temperatura ambient .
- PROPN 2: La proposició presentada per Joan Boada , diputat-portaveu d’ IC-V , considera que cal donar un ús social i públic a tot l’ espai expropiat - no només a els habitatges - els anys seixanta , evitant ‘ una simple cessió de els habitatges per part de Medi ambient a entitats o institucions ‘ .
Morphology
The form / lemma ratio of PROPN is 1.000299 (the average of all parts of speech is 1.416814).
The 1st highest number of forms (2) was observed with the lemma “B”: 4B, B.
The 2nd highest number of forms (2) was observed with the lemma “CE”: 2001/37/CE, CE.
The 3rd highest number of forms (2) was observed with the lemma “matar”: matar, maten.
PROPN occurs with 2 features: Gender (8; 0% instances), Number (8; 0% instances)
PROPN occurs with 3 feature-value pairs: Gender=Fem, Gender=Masc, Number=Sing
PROPN occurs with 3 feature combinations.
The most frequent feature combination is _ (46582 tokens).
Examples: Catalunya, Barcelona, Generalitat, Govern, sant, Ajuntament, Girona, Josep, CiU, PP
Relations
PROPN nodes are attached to their parents using 21 different relations: flat (17795; 38% instances), nmod (10793; 23% instances), nsubj (5488; 12% instances), appos (3804; 8% instances), conj (3506; 8% instances), obl (2738; 6% instances), obj (905; 2% instances), obl:arg (897; 2% instances), obl:agent (442; 1% instances), root (146; 0% instances), acl (16; 0% instances), ccomp (14; 0% instances), dep (14; 0% instances), parataxis (11; 0% instances), advcl (7; 0% instances), xcomp (7; 0% instances), acl:relcl (2; 0% instances), nsubj:pass (2; 0% instances), csubj (1; 0% instances), dislocated (1; 0% instances), vocative (1; 0% instances)
Parents of PROPN nodes belong to 15 different parts of speech: PROPN (21512; 46% instances), NOUN (13489; 29% instances), VERB (8994; 19% instances), ADJ (1275; 3% instances), DET (399; 1% instances), NUM (253; 1% instances), ADV (217; 0% instances), (146; 0% instances), PRON (140; 0% instances), AUX (62; 0% instances), ADP (38; 0% instances), SYM (33; 0% instances), CCONJ (17; 0% instances), PART (12; 0% instances), SCONJ (3; 0% instances)
14118 (30%) PROPN nodes are leaves.
12390 (27%) PROPN nodes have one child.
10048 (22%) PROPN nodes have two children.
10034 (22%) PROPN nodes have three or more children.
The highest child degree of a PROPN node is 20.
Children of PROPN nodes are attached using 25 different relations: case (20245; 29% instances), flat (17373; 25% instances), det (12493; 18% instances), punct (8646; 12% instances), conj (3563; 5% instances), cc (2548; 4% instances), nmod (1611; 2% instances), appos (1159; 2% instances), amod (840; 1% instances), acl (728; 1% instances), mark (248; 0% instances), nummod (229; 0% instances), cop (129; 0% instances), advmod (113; 0% instances), nsubj (103; 0% instances), obl (49; 0% instances), aux (21; 0% instances), advcl (12; 0% instances), dep (11; 0% instances), parataxis (8; 0% instances), csubj (4; 0% instances), obj (3; 0% instances), obl:arg (3; 0% instances), acl:relcl (1; 0% instances), ccomp (1; 0% instances)
Children of PROPN nodes belong to 15 different parts of speech: PROPN (21512; 31% instances), ADP (20163; 29% instances), DET (12512; 18% instances), PUNCT (8646; 12% instances), CCONJ (2471; 4% instances), NOUN (1895; 3% instances), ADJ (989; 1% instances), VERB (700; 1% instances), NUM (415; 1% instances), SCONJ (325; 0% instances), ADV (202; 0% instances), AUX (154; 0% instances), PRON (128; 0% instances), SYM (24; 0% instances), PART (5; 0% instances)