home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

UD Galician TreeGal

Language: Galician (code: gl)
Family: IE

This treebank has been part of Universal Dependencies since the UD v1.4 release.

The following people have contributed to making this treebank part of UD: Marcos Garcia, Xulia Sánchez-Rodríguez, Albina Sarymsakova.

Repository: UD_Galician-TreeGal
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.18

License: LGPL-LR

Genre: news

Questions, comments? General annotation questions (either Galician-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [marcos • garcia • gonzalez (æt) usc • gal]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.

Annotation	Source
Lemmas	annotated manually
UPOS	annotated manually, natively in UD style
XPOS	annotated manually
Features	annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion
Relations	annotated manually, natively in UD style

Description

The Galician-TreeGal is a treebank for Galician developed at LyS Group (Universidade da Coruña) and at CiTIUS (Universidade de Santiago de Compostela).

The resource derives from a subset (called xeral) of the XIADA corpus (v2.6), created at the Centro Ramón Piñeiro para a Investigación en Humanidades (http://corpus.cirp.es/xiada/).

All the information except the syntactic one was semi-automatically converted to UD from the original resource. The dependency labels were assigned using cross-lingual parsing techniques, and then manually corrected by a linguist (see the references for more information). At the end of this process, several corrections were carried out in order to agree with the UD guidelines.

Galician-TreeGal v0.42 contains 1000 sentences of the xeral corpus (~25k tokens), and it is divided 60-40 splits (train-test).

Acknowledgments

Garcia, Marcos, 2016. Universal Dependencies Guidelines for the Galician-TreeGal Treebank. Technical Report. LyS Group, Universidade da Coruña.
Garcia, Marcos, Carlos Gómez-Rodríguez and Miguel A. Alonso, 2018. New treebank or repurposed? On the feasibility of cross-lingual parsing of Romance languages with Universal Dependencies. Natural Language Engineering, 24(1): 91-122.
Rojo, Guillermo, Marisol López Martínez, Eva Domínguez Noya and Fco. Mario Barcala, 2015. Corpus de adestramento do Etiquetador/Lematizador do Galego Actual (XIADA), v2.6. Centro Ramón Piñeiro para a Investigación en Humanidades.

Statistics of UD Galician TreeGal

POS Tags

ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X

Features

AdpType – Case – Clitic – Definite – Degree – ExtPos – Foreign – Gender – Mood – Number – Number[psor] – NumType – Person – Polarity – Poss – PronType – Tense – VerbForm

Relations

acl – advcl – advmod – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – dep – det – discourse – expl – fixed – flat:foreign – flat:name – iobj – list – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – orphan – parataxis – punct – root – vocative – xcomp

Tokenization and Word Segmentation

This corpus contains 1000 sentences, 23479 tokens and 25548 syntactic words.

This corpus contains 2682 tokens (11%) that are not followed by a space.

This corpus contains 1 types of words with spaces. Examples: 687 614 874

This corpus contains 32 types of words that contain both letters and punctuation. Examples: PSdeG-PSOE, etc., Costa-Gavras, (in)cultura, BNG-PSOE, Barros', CIG-ensino, Campos', Cunqueiro:, D., Dulcinea,, F., Galego-portuguesa, Oops..., P., PSOE-BNG, Qué!, R., S., Silencio,, again!, best-sellers, centro-esquerda, cow-boy, d'Estudis, económico-financeira, galego-portugués-brasileiro, manuelmaria@as-pg.com, sex-shop, www.bng-galiza.org, www.novoestatuto.com, xurídico-público

This corpus contains 2059 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
There are 301 types of multi-word tokens. Examples: do, da, no, na, dos, ao, á, das, polo, nas, coa, nos, co, dun, pola, ás, aos, dunha, nunha, cos, coas, nun, polos, cun, deste, neste, nesta, polas, desta, darlle, delas, dese, cunha, doutras, nesa, trátase, dela, deles, destes, doutros, entenderse, nese, 'García, Barros', Constrúese, Gustaríame, corresponderalle, coñecelo, cúmprense, daqueles.

Morphology

Nominal Features

Gender

Com
- ADJ: obstante, embargante, coincidente, diferentes, Simple, Visitábel, bípedes, capaz, conscientes, fráxil
- NOUN: nacionalistas, socialistas, galeguista, guitarristas, prol, xornalistas, Babecas, Finalistas, alcalde, antípoda
- NUM: 13.000, cen
- PRON: se, nos, que, me, quen, lle, eu, nós, vostede, alguén

Fem
- ADJ: galega, política, europea, nova, social, Franca, actual, cultural, laboral, mellor
- DET: a, as, unha, súa, esta, la, nosa, súas, esa, outra
- NOUN: cidade, música, parte, obra, vida, empresa, proposta, arte, bases, obras
- NUM: primeira, dúas, segunda, 21, catro, tres, unha, cinco, terceira, 12
- PRON: que, a, lle, as, unha, elas, ela, esta, na, ningunha
- PROPN: UE, CIG, ONU, CIG-ensino, EMALCSA, ETEA, OTAN, SA, SEPI, TVG
- VERB-Part: recibida, dirixida, destinadas, feita, feitas, prometidas, realizada, vencellada, Configurada, Nacida

Masc
- ADJ: novo, galego, español, galegos, socialista, constitucional, difícil, gran, mellor, claro
- DET: o, os, un, lo, seu, este, seus, todo, todos, ese
- NOUN: anos, goberno, traballo, Estado, estatuto, tempo, dereito, mundo, país, proxecto
- NUM: dous, un, primeiro, catro, dez, 1990, 25, cinco, quince, tres
- PRON: que, o, lle, lo, os, todo, un, algo, algúns, lles
- PROPN: BNG, PP, PSOE, PSdeG, PSdeG-PSOE, PSC, SXG, FIDAC, IBBY, INEM
- VERB-Part: debido, baseado, elaborado, elixido, afectado, apresentado, atendidos, chamado, considerado, dirixido

Neut
- PRON: iso, isto

Number

Plur
- ADJ: galegos, diferentes, distintos, maiores, últimos, autonómicas, grandes, económicos, internacionais, novos
- AUX: son, están, poden, estamos, foron, serán, van, deben, eran, estaban
- AUX-Fin: son, están, poden, estamos, foron, serán, van, deben, eran, estaban
- AUX-Inf: seren, sermos
- DET: os, as, seus, súas, todos, los, outros, outras, estes, uns
- NOUN: anos, socialistas, medios, bases, obras, nacionalistas, persoas, días, eleccións, fuxidos
- NUM: catro, dous, tres, dúas, dez, cinco, 21, quince, oito, 300
- PRON: que, nos, os, lles, algúns, as, outros, elas, nós, eles
- VERB-Fin: teñen, fan, temos, existen, chegaron, dan, fagan, fixemos, integran, queremos
- VERB-Inf: teren, chegaren, colaboraren, compartiren, completarmos, decidiren, desviaren, formaren, forzaren, integrarmos
- VERB-Part: atendidos, destinadas, empeñados, feitas, obrigados, prometidas, Decididos, afectados, apresentadas, asinados

Sing
- ADJ: galega, novo, galego, español, mellor, política, social, xeral, actual, difícil
- AUX-Fin: é, foi, está, pode, era, sería, vai, será, ten, sexa
- DET: o, a, un, unha, súa, lo, seu, esta, este, la
- NOUN: goberno, traballo, Estado, cidade, estatuto, música, tempo, dereito, mundo, país
- NUM: primeira, un, primeiro, segunda, 1990, 1917, 1999, 2018, 25, 28
- PRON: que, o, lle, a, me, iso, lo, todo, quen, un
- PROPN: BNG, PP, PSOE, PSdeG, UE, PSdeG-PSOE, CIG, ONU, PSC, SXG
- VERB-Fin: hai, ten, fai, fixo, quere, considera, di, dá, vén, pasa
- VERB-Part: debido, recibida, baseado, dirixida, elaborado, elixido, afectado, apresentado, chamado, considerado

Case

Acc
- PRON: o, nos, lo, a, as, os, me, no, los, na

Dat
- PRON: lle, nos, lles, me, che

Nom
- PRON: eu, el, vostede, nós, ti, eles

Definite

Def
- DET: o, a, os, as, lo, la, los, las
- PRON: a

Ind
- DET: un, unha, uns, unhas

Degree and Polarity

Degree

Cmp
- ADJ: mellor, maior, maiores, peor, meirande, mellores, menor

Sup
- ADJ: máximo, altísimo, importantísima, máxima

Polarity

Neg
- ADP: sen
- ADV: non, nunca, tampouco, Nin, endexamais
- CCONJ: nin

Verbal Features

Mood

Cnd,Ind
- AUX: sería, debería, podería, habería, poderían, tería, deberiamos
- AUX-Fin: sería, debería, podería, habería, poderían, tería
- VERB-Fin: gustaría, tería, Diría, Quedaría, correspondería, empobrecería, escluiría, faltaría, gostaría, instalaría

Imp
- VERB-Fin: Explica, Imaxina

Ind
- AUX-Fin: é, foi, está, son, pode, están, era, vai, será, poden
- VERB-Fin: hai, ten, teñen, fai, fixo, quere, considera, di, vén, dá

Sub
- AUX-Fin: sexa, fose, sexan, estea, estivese, poidan, teña, estean, for, fosen
- VERB-Fin: sexa, fagan, diga, cumpran, faga, fixese, haxa, inclúa, mostren, pese

Tense

Fut
- AUX-Fin: será, serán, haberá, poderá, poderán, acabarán, for, irá
- VERB-Fin: terá, contará, corresponderá, decidirá, ocupará, pasarán, recollerá, terán, Atribuirá, Lograrán

Imp
- AUX-Fin: era, estaba, ía, eran, estaban, podía, Podiamos, debían, podia, tiña
- VERB-Fin: había, tiña, sabía, facía, quería, daba, defendiamos, dicía, escribía, falaba

Past
- AUX-Fin: foi, foron, fose, estivese, estivo, puido, Viñeron, estiveron, fosen, puidemos
- VERB-Fin: fixo, deu, dixo, houbo, publicou, tivo, chegaron, conseguiu, fixemos, comezou

Pqp
- AUX-Fin: fora, deberan, foran
- VERB-Fin: quixera, cometeran, comunicara, escribiran, houbera, reflectira, rematara, valera, vira

Pres
- AUX-Fin: é, está, son, pode, están, vai, poden, ten, sexa, hai
- VERB-Fin: hai, ten, teñen, fai, quere, considera, di, vén, dá, fan

Pronouns, Determiners, Quantifiers

PronType

Art
- DET: o, a, os, as, un, unha, lo, la, los, uns
- PRON: o, a, os, as

Dem
- DET: esta, este, ese, esa, estes, estas, aqueles, esas, eses, aquel
- PRON: iso, isto, este, estes, esta, aqueles, Ese, aquel, aquela, esa

Ind
- DET: todo, todos, mesmo, outra, outro, outros, outras, toda, cada, calquera
- PRON: algo, todo, un, algúns, nada, unha, outros, outro, alguén, mesmo

Int
- ADV: como, cómo, onde
- DET: que
- PRON: que, Cal, Quen, canto, Cales, Cantos

Prs
- DET: súa, seu, seus, nosa, súas, noso, meu, miña, nosos, meus
- PRON: se, lle, nos, o, me, lo, lles, a, elas, nós

Rel
- ADV: como, cando, onde
- DET: cantas, cuxa, cuxas
- PRON: que, quen, cales, cantos

NumType

Card
- NUM: catro, dous, tres, un, dúas, cinco, dez, 1990, 21, 25

Ord
- NUM: primeira, primeiro, segunda, II, IX, terceira, terceiro, V, primeiras, primeiros

Poss

Yes
- DET: súa, seu, seus, nosa, súas, noso, meu, miña, nosos, meus
- PRON: seu, nosa

Person

1
- AUX: estamos, somos, estou, teño, vou, Podiamos, Sigo, deberiamos, imos, podemos
- AUX-Fin: estamos, somos, estou, teño, vou, Podiamos, Sigo, imos, podemos, podía
- AUX-Inf: sermos
- DET: nosa, noso, meu, miña, nosos, meus, nosas
- PRON: nos, me, nós, eu, min, nosa
- VERB-Fin: temos, fixemos, queremos, digo, quixera, chegamos, creo, defendiamos, deixamos, entendemos
- VERB-Inf: completarmos, integrarmos, irmos, termos

1,3
- VERB-Fin: Diría

2
- AUX-Fin: Vas
- PRON: te, che, ti
- VERB-Fin: Explica, Imaxina, aceptas, alboreas, atoparás, buscas, chegas, escoites, escureces, miras

3
- AUX-Fin: é, foi, está, son, pode, están, era, sería, vai, será
- AUX-Inf: seren
- DET: súa, seu, seus, súas, os, sua
- PRON: se, o, lle, a, lo, os, lles, as, elas, el
- VERB-Fin: hai, ten, teñen, fai, fixo, quere, considera, di, vén, dá
- VERB-Inf: teren, chegaren, colaboraren, compartiren, decidiren, desviaren, formaren, forzaren, iren, mostraren

Number[psor]

Plur
- DET: nosa, súa, seu, noso, súas, seus, nosos, nosas
- PRON: nosa

Sing
- DET: súa, seu, seus, súas, meu, miña, meus, sua
- PRON: seu

Other Features

AdpType
- Prep
  - ADP: de, en, a, por, con, para, sobre, entre, sen, desde

Clitic
- Yes
  - PRON: se, lle, nos, o, me, lo, lles, a, as, os

ExtPos
- ADJ
  - ADP: en
- ADP
  - ADJ: xunto
  - ADP: a, en, de, por
  - ADV: dentro, arredor
  - NOUN: fronte, cara, respecto, Grazas, camiño
  - VERB-Fin: pese
- ADV
  - ADP: en, a, por, de, Con, sen, Dende
  - ADV: non, aínda, cando, hoxe, arredor, así, claro, despois, detrás, máis
  - AUX-Fin: é
  - CCONJ: Ou, e, nin
  - PRON: iso, isto
- CCONJ
  - ADP: por
  - ADV: ademais, así, aínda
  - CCONJ: e, ou, nin
- INTJ
  - INTJ: ha
- PRON
  - DET: cada
  - PRON: nada
- SCONJ
  - ADP: por, de, en
  - ADV: aínda, xa, así, antes, ben
  - SCONJ: senón, Se
  - VERB-Fin: É

Foreign
- Yes
  - X: best, iudice, sellers, sub

Syntax

Auxiliary Verbs and Copula

This corpus uses 2 lemmas as copulas (cop). Examples: ser, estar.

This corpus uses 13 lemmas as auxiliaries (aux). Examples: poder, ir, ter, estar, deber, haber, vir, seguir, acabar, deixar, levar, querer, semellar.
This corpus uses 3 lemmas as passive auxiliaries (aux:pass). Examples: ser, estar, quedar.

Core Arguments, Oblique Arguments and Adjuncts

Here we consider only relations between verbs (parent) and nouns or pronouns (child).

nsubj
- VERB-Fin--NOUN (382)
- VERB-Fin--NOUN-ADP(arredor) (1)
- VERB-Fin--NOUN-ADP(de) (2)
- VERB-Fin--PRON (286)
- VERB-Fin--PRON-ADP(con) (1)
- VERB-Fin--PRON-ADP(en) (1)
- VERB-Fin--PRON-ADP(por) (1)
- VERB-Fin--PRON-Acc (1)
- VERB-Fin--PRON-Dat (4)
- VERB-Fin--PRON-Nom (20)
- VERB-Ger--NOUN (7)
- VERB-Ger--PRON (5)
- VERB-Inf--NOUN (36)
- VERB-Inf--PRON (30)
- VERB-Inf--PRON-ADP(de) (1)
- VERB-Inf--PRON-Acc (1)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--NOUN (17)
- VERB-Part--PRON (10)
- VERB-Part--PRON-Nom (1)

obj
- VERB-Fin--NOUN (505)
- VERB-Fin--NOUN-ADP(a) (7)
- VERB-Fin--NOUN-ADP(arredor) (1)
- VERB-Fin--NOUN-ADP(de) (1)
- VERB-Fin--PRON (114)
- VERB-Fin--PRON-ADP(a) (2)
- VERB-Fin--PRON-ADP(de) (1)
- VERB-Fin--PRON-ADP(pesar) (1)
- VERB-Fin--PRON-Acc (54)
- VERB-Fin--PRON-Dat (6)
- VERB-Ger--NOUN (53)
- VERB-Ger--NOUN-ADP(a) (1)
- VERB-Ger--PRON (3)
- VERB-Ger--PRON-Acc (4)
- VERB-Inf--NOUN (286)
- VERB-Inf--NOUN-ADP(a) (1)
- VERB-Inf--NOUN-ADP(de) (1)
- VERB-Inf--PRON (34)
- VERB-Inf--PRON-ADP(a) (1)
- VERB-Inf--PRON-Acc (31)
- VERB-Part--NOUN (7)
- VERB-Part--PRON (1)
- VERB-Part--PRON-ADP(a) (1)
- VERB-Part--PRON-Acc (2)

iobj
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-ADP(a) (28)
- VERB-Fin--NOUN-ADP(para) (1)
- VERB-Fin--PRON (4)
- VERB-Fin--PRON-ADP(a) (5)
- VERB-Fin--PRON-Acc (2)
- VERB-Fin--PRON-Dat (46)
- VERB-Ger--NOUN-ADP(a) (1)
- VERB-Ger--PRON-Dat (4)
- VERB-Inf--NOUN-ADP(a) (8)
- VERB-Inf--PRON (1)
- VERB-Inf--PRON-ADP(a) (3)
- VERB-Inf--PRON-Dat (13)

Relations Overview

This corpus uses 4 relation subtypes: aux:pass, flat:foreign, flat:name, nsubj:pass
The following 1 main types are not used alone, they are always subtyped: flat
The following 4 relation types are not used in this corpus at all: dislocated, clf, goeswith, reparandum