Treebank Statistics: UD_Portuguese-PetroGold: POS Tags: PROPN
There are 3135 PROPN
lemmas (27%), 3154 PROPN
types (19%) and 12013 PROPN
tokens (5%).
Out of 16 observed tags, the rank of PROPN
is: 2 in number of lemmas, 3 in number of types and 7 in number of tokens.
The 10 most frequent PROPN
lemmas: CO2, et, bacia, al., Cabo, Santos, Campos, Formação, Frio, NE-SW
The 10 most frequent PROPN
types: CO2, et, Bacia, al., Cabo, Santos, Campos, Formação, Frio, NE-SW
The 10 most frequent ambiguous lemmas: bacia (NOUN 179, PROPN 2), & (PROPN 70, PUNCT 1), ilha (NOUN 12, PROPN 1), i (PROPN 6, NOUN 1), . (PUNCT 7995, PROPN 34, X 3), co (ADP 1, PROPN 1), serra (NOUN 6, PROPN 5), b (NOUN 18, PROPN 18, NUM 4), deconvolução (NOUN 10, PROPN 1), 3D (PROPN 24, NUM 10, NOUN 6, ADJ 1)
The 10 most frequent ambiguous types: Bacia (PROPN 203, NOUN 3), Formação (PROPN 87, NOUN 1), Frio (PROPN 87, NOUN 1), & (PROPN 70, PUNCT 1), C (PROPN 65, NOUN 6, NUM 1), São (PROPN 59, AUX 32), grande (ADJ 178, PROPN 2), barra (PROPN 2, NOUN 1), Grupo (PROPN 48, NOUN 2), ilha (NOUN 7, PROPN 1)
- Bacia
- Formação
- PROPN 87: O Grupo Itararé e a Formação Aquidauana interdigitam se .
- NOUN 1: Formação de o aluno em a área de asfaltos ; 2. - Realizar revisão bibliográfica sobre asfaltos e emulsões ; 3. - Preparar asfaltos modificados por vermiculita e avaliar os produtos obtidos fazendo uso de os seguintes ensaios : penetração , ponto de fulgor , ponto de amolecimento , ductilidade e viscosidade Saybolt-Furol .
- Frio
- PROPN 87: Ma para Cabo Frio .
- NOUN 1: Frio e adjacências , envolvendo as bacias de Campos e Santos , sugerem que as reativações Cretáceo-Terciárias de o embasamento teriam sido fortemente condicionadas a as zonas de transferência , de direção NW-SE associadas a a fase rifte , que teriam rompido a crosta e atingido o manto superior .
- &
- C
- PROPN 65: Conforme a norma , este ensaio pode ser realizado entre 20 e 30 ° C .
- NOUN 6: C = fator de contato de o CO2 com o óleo
- NUM 1: Onde mAG , é a massa molar de o ácido graxo , o valor 1 subtraído corresponde a a massa molar de um hidrogênio ( de o grupo hidroxila ) , o qual é removido de o ácido graxo para que ele forme um triglicerídeo , C % é a contribuição percentual de o ácido graxo em a composição de o óleo , obtida por CG-FID , O valor 3 está associado a a combinação de 3 ácidos graxos para formação de um triglicerídeo e 41 é a massa molar de a cadeia - CH2CHCH2 - que liga os três ácidos graxos para formar o triglicerídeo , observado em a Figura 5 .
- São
- grande
- ADJ 178: Nenhum pico de grande pressão , que poderia danificar o circuito , foi observado .
- PROPN 2: Este capítulo traz cinco seções , onde a 1ª ( primeiro ) aborda sobre a origem de o petróleo e suas propriedades físico químicas , bem como seu comportamento de a macha de óleo em o meio ambiente , em a seção 2ª ( segundo ) aborda sobra a área de estudo , especificadamente o estuário barra grande , em o município de Icapuí em o estado de o Ceará .
- barra
- PROPN 2: Este capítulo traz cinco seções , onde a 1ª ( primeiro ) aborda sobre a origem de o petróleo e suas propriedades físico químicas , bem como seu comportamento de a macha de óleo em o meio ambiente , em a seção 2ª ( segundo ) aborda sobra a área de estudo , especificadamente o estuário barra grande , em o município de Icapuí em o estado de o Ceará .
- NOUN 1: O ecossistema de manguezal é de grande importância para o equilíbrio de a biodiversidade de a faixa costeira de Icapuí bem como dentro de o estuário de barra grande , pois as atividades socioeconômicas giram em torno de essa área .
- Grupo
- ilha
- NOUN 7: Seguindo a descrição de Ferrari ( 2001 ) , a suíte alcalina de a Ilha de Cabo Frio apresenta sua maior área de ocorrência em esta ilha que tem pouco mais de 6 km² de área .
- PROPN 1: Mapa geológico de a região de Arraial de o Cabo , destacando o complexo alcalino de a ilha de Cabo Frio , modificado de Lima e Chievegatto ( 1974 ) , Reis et al. ( 1976 ) e Araujo ( 1995 ) .
Morphology
The form / lemma ratio of PROPN
is 1.006061 (the average of all parts of speech is 1.452143).
The 1st highest number of forms (3) was observed with the lemma “Ceará”: C, Ceará, ceara.
The 2nd highest number of forms (2) was observed with the lemma “Abaeté”: ABAETÉ, Abaeté.
The 3rd highest number of forms (2) was observed with the lemma “Areado”: AREADO, Areado.
PROPN
occurs with 3 features: Number (11944; 99% instances), Gender (8299; 69% instances), Typo (2; 0% instances)
PROPN
occurs with 5 feature-value pairs: Gender=Fem
, Gender=Masc
, Number=Plur
, Number=Sing
, Typo=Yes
PROPN
occurs with 7 feature combinations.
The most frequent feature combination is Gender=Masc|Number=Sing
(5479 tokens).
Examples: CO2, C, Membro, Brasil, Rio, Grupo, PHPA, GX, MDL, Campos
Relations
PROPN
nodes are attached to their parents using 17 different relations: flat:name (3843; 32% instances), nmod (3421; 28% instances), conj (1109; 9% instances), appos (912; 8% instances), obl (752; 6% instances), parataxis (713; 6% instances), nsubj (397; 3% instances), root (376; 3% instances), obl:agent (173; 1% instances), obj (116; 1% instances), nsubj:pass (100; 1% instances), obl:arg (46; 0% instances), xcomp (39; 0% instances), advcl (10; 0% instances), acl:relcl (2; 0% instances), ccomp (2; 0% instances), orphan (2; 0% instances)
Parents of PROPN
nodes belong to 10 different parts of speech: PROPN (5271; 44% instances), NOUN (4071; 34% instances), VERB (1937; 16% instances), (376; 3% instances), ADJ (180; 1% instances), SYM (67; 1% instances), ADV (38; 0% instances), NUM (34; 0% instances), PRON (33; 0% instances), X (6; 0% instances)
4788 (40%) PROPN
nodes are leaves.
1807 (15%) PROPN
nodes have one child.
1887 (16%) PROPN
nodes have two children.
3531 (29%) PROPN
nodes have three or more children.
The highest child degree of a PROPN
node is 14.
Children of PROPN
nodes are attached using 21 different relations: flat:name (5698; 28% instances), punct (4331; 21% instances), case (3270; 16% instances), det (2132; 11% instances), nmod (1598; 8% instances), conj (1152; 6% instances), cc (598; 3% instances), appos (474; 2% instances), nummod (334; 2% instances), amod (144; 1% instances), acl (136; 1% instances), acl:relcl (103; 1% instances), cop (75; 0% instances), nsubj (72; 0% instances), advmod (61; 0% instances), parataxis (60; 0% instances), advcl (23; 0% instances), obl (17; 0% instances), mark (10; 0% instances), orphan (4; 0% instances), goeswith (1; 0% instances)
Children of PROPN
nodes belong to 15 different parts of speech: PROPN (5271; 26% instances), PUNCT (4331; 21% instances), ADP (4298; 21% instances), DET (2500; 12% instances), NUM (1806; 9% instances), CCONJ (759; 4% instances), NOUN (658; 3% instances), VERB (252; 1% instances), ADJ (160; 1% instances), SYM (77; 0% instances), AUX (76; 0% instances), ADV (69; 0% instances), PRON (18; 0% instances), X (10; 0% instances), SCONJ (8; 0% instances)