home edit page issue tracker

This page pertains to UD version 2.
</table>

UD_Galician

UD_Galician-TreeGal

Tokenization and Word Segmentation

Tokenization and Word Segmentation

  • This corpus contains 3993 sentences, 126011 tokens and 138837 syntactic words.
  • This corpus contains 1000 sentences, 23479 tokens and 25548 syntactic words.
  • This corpus contains 13812 tokens (11%) that are not followed by a space.
  • This corpus contains 2682 tokens (11%) that are not followed by a space.
  • This corpus does not contain words with spaces.
  • This corpus contains 1 types of words with spaces. Examples: 687 614 874
  • This corpus contains 242 types of words that contain both letters and punctuation. Examples: etc., AA., CC., C., S.A., a., art., pp., d/105, L., 1.ª, 2.a, 2.º, 5.º, 80/68/CEE, 92/43/CEE, B., C.H., Castela-A, E., EE.UU., I., J., Timbre-Real, c​o​n​t​e​n​c​i​o​s​o​-​a​d​m​i​n​i​s​t​r​a​t​i​v​o, gr., m/105h, marítimo-terrestre, ptas., v​a​r​i​a​n​z​a​s​-​c​o​v​a​r​i​a​n​z​a​s, -n/2, 08.05.432A.740.0, 1%dos, 1.1.-España, 1.Programa, 1.a, 101/97/CE, 12.1.e, 123.A, 149.1.21.ª, 1999/519/EC, 2.o, 2000/76/CE, 2005,mais, 21.Un, 3.º, 35.3.n, 4.º, 620.1.º, 76/464/CEE
  • This corpus contains 32 types of words that contain both letters and punctuation. Examples: PSdeG-PSOE, etc., Costa-Gavras, (in)cultura, BNG-PSOE, Barros', CIG-ensino, Campos', Cunqueiro:, D., Dulcinea,, F., Galego-portuguesa, Oops..., P., PSOE-BNG, Qué!, R., S., Silencio,, again!, best-sellers, centro-esquerda, cow-boy, d'Estudis, económico-financeira, g​a​l​e​g​o​-​p​o​r​t​u​g​u​é​s​-​b​r​a​s​i​l​e​i​r​o, m​a​n​u​e​l​m​a​r​i​a​@​a​s​-​p​g​.​c​o​m, sex-shop, www.bng-galiza.org, www.novoestatuto.com, xurídico-público
  • This corpus contains 12750 multi-word tokens. On average, one multi-word token consists of 2.01 syntactic words.
  • There are 1211 types of multi-word tokens. Examples: do, da, no, dos, na, das, ao, á, nos, ó, polo, nas, co, pola, dun, coa, dunha, neste, aos, ós, nun, deste, desta, nunha, polos, cos, cunha, nesta, coas, cun, termos, polas, tódolos, destes, destas, nestes, deles, pódese, noutros, tódalas, delas, doutros, doutras, trátase, del, nese, débese, modifícase, nalgúns, desa.
  • This corpus contains 2059 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
  • There are 301 types of multi-word tokens. Examples: do, da, no, na, dos, ao, á, das, polo, nas, coa, nos, co, dun, pola, ás, aos, dunha, nunha, cos, coas, nun, polos, cun, deste, neste, nesta, polas, desta, darlle, delas, dese, cunha, doutras, nesa, trátase, dela, deles, destes, doutros, entenderse, nese, 'García, Barros', Constrúese, Gustaríame, corresponderalle, coñecelo, cúmprense, daqueles.

Morphology

Tags

Morphology

Tags

  • This corpus contains 5 word types tagged as particles (PART): Ln, föhn, non, on, senon
  • This corpus contains 35 lemmas tagged as pronouns (PRON): algo, alguén, aquel, aquilo, cal, cando, canto, che, como, consigo, cuxo, el, este, eu, iso, isto, lle, me, min, nada, ninguén, nos, nós, o, onde, que, quen, quén, se, si, te, ti, un, vos, vostede
  • This corpus contains 40 lemmas tagged as pronouns (PRON): algo, alguén, algún, ambos, aquel, cal, canto, che, demais, el, ese, este, eu, lle, me, mesmo, min, moito, nada, ninguén, ningún, nos, noso, nós, o, outro, pouco, propio, que, quen, se, seu, si, tal, tanto, te, ti, todo, un, vostede
  • This corpus contains 29 lemmas tagged as determiners (DET): algún, ambos, aquel, cada, calquera, canto, certo, demais, entrambos, ese, este, mesmo, meu, moito, ningún, noso, o, outro, pouco, propio, que, senllos, seu, tal, tanto, teu, todo, un, varios
  • This corpus contains 34 lemmas tagged as determiners (DET): algún, ambos, aquel, cada, calquer, calquera, canto, certo, cuxo, demais, demasiado, determinado, el, ese, este, la, los, mesmo, meu, moito, ningún, noso, o, outras, outro, pouco, propio, que, seu, tal, tanto, todo, un, varios
  • Out of the above, 6 lemmas occurred sometimes as PRON and sometimes as DET: aquel, canto, este, o, que, un
  • Out of the above, 22 lemmas occurred sometimes as PRON and sometimes as DET: algún, ambos, aquel, canto, demais, el, ese, este, mesmo, moito, ningún, noso, o, outro, pouco, propio, que, seu, tal, tanto, todo, un
  • This corpus contains 2 lemmas tagged as auxiliaries (AUX): estar, ser
  • This corpus contains 25 lemmas tagged as auxiliaries (AUX): acabar, acertar, adoitar, considerar, deber, deixar, eis, estar, haber, ir, levar, parecer, pasar, permanecer, poder, quedar, querer, resultar, seguir, semellar, ser, ter, tratar, ver, vir
  • Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: estar, ser
  • Out of the above, 22 lemmas occurred sometimes as AUX and sometimes as VERB: acabar, considerar, deber, deixar, estar, haber, ir, levar, parecer, pasar, permanecer, poder, quedar, querer, resultar, seguir, semellar, ser, ter, tratar, ver, vir
  • This corpus does not use the VerbForm feature.
  • Fin
    • AUX: é, foi, está, son, pode, están, era, sería, vai, será
    • VERB: hai, ten, teñen, fai, fixo, quere, considera, di, dá, fan
  • Ger
    • AUX: sendo, podendo
    • VERB: afirmando, partindo, considerando, dando, pagando, recoñecendo, agardando, apuntando, chegando, cobrando
  • Inf
    • AUX: ser, poder, estar, ter, acabar, ir, parecer, quedar, seren, sermos
    • VERB: facer, ter, ver, falar, dar, pasar, traballar, seguir, dicir, gañar
  • Part
    • AUX: considerado
    • VERB: debido, recibida, baseado, dirixida, elaborado, elixido, afectado, apresentado, atendidos, chamado

Nominal Features

Nominal Features

  • Gender </td> </tr>
    • Com
      • ADJ: obstante, embargante, best, coincidente, diferentes, Simple, Visitábel, bípedes, capaz, conscientes
      • NOUN: nacionalistas, socialistas, galeguista, guitarristas, prol, xornalistas, Babecas, Finalistas, alcalde, antípoda
      • NUM: 13.000, cen
      • PRON: se, nos, que, me, quen, lle, eu, nós, vostede, alguén
    • Fem
      • ADJ: galega, política, europea, nova, social, Franca, actual, cultural, laboral, mellor
      • DET: a, as, unha, súa, esta, la, nosa, súas, esa, outra
      • NOUN: cidade, música, parte, obra, vida, proposta, arte, empresa, obras, lingua
      • NUM: primeira, dúas, segunda, catro, tres, cinco, terceira, 12, 15.000, 17
      • PRON: que, a, lle, as, unha, elas, ela, esta, na, ningunha
      • PROPN: Mercedes, Núñez, Unión, UE, Zona, Bases, Xunta, Constitución, Galiza, Academia
      • VERB-Part: recibida, dirixida, destinadas, feita, feitas, prometidas, realizada, vencellada, Configurada, Nacida
    • Masc
      • ADJ: novo, galego, español, galegos, socialista, constitucional, difícil, gran, mellor, claro
      • AUX-Part: considerado
      • DET: o, os, un, lo, seu, este, seus, todo, todos, ese
      • NOUN: anos, traballo, goberno, mundo, tempo, dereito, proxecto, país, medios, grupo
      • NUM: dous, un, primeiro, catro, dez, 1990, 25, cinco, quince, tres
      • PRON: que, o, lle, lo, os, todo, un, algo, algúns, lles
      • PROPN: BNG, Estado, Manuel, Xosé, Miguel, Anxo, Carlos, Estatuto, González, Francisco
      • VERB-Part: debido, baseado, elaborado, elixido, afectado, apresentado, atendidos, chamado, dirixido, empeñados
    • Neut
      • PRON: iso, isto
    </li>
  • Number </td> </tr>
    • Plur
      • ADJ: galegos, diferentes, distintos, maiores, últimos, autonómicas, grandes, económicos, internacionais, novos
      • AUX: son, están, poden, estamos, foron, serán, van, deben, eran, estaban
      • AUX-Fin: son, están, poden, estamos, foron, serán, van, deben, eran, estaban
      • AUX-Inf: seren, sermos
      • DET: os, as, seus, súas, todos, outros, los, outras, estes, uns
      • NOUN: anos, socialistas, medios, obras, nacionalistas, persoas, días, eleccións, veces, galegos
      • NUM: catro, dous, tres, dúas, dez, cinco, quince, oito, 300, 52
      • PRON: que, nos, os, lles, algúns, as, outros, elas, nós, eles
      • PROPN: Bases, Premios, Estados, Mateo, Mestre, 2004, Consellos, Irmandades, Letras, Oscars
      • VERB-Fin: teñen, fan, temos, existen, chegaron, dan, fagan, fixemos, integran, queremos
      • VERB-Inf: teren, chegaren, colaboraren, compartiren, completarmos, decidiren, desviaren, formaren, forzaren, integrarmos
      • VERB-Part: atendidos, destinadas, empeñados, feitas, obrigados, prometidas, Decididos, afectados, apresentadas, asinados
    • Sing
      • ADJ: galega, novo, galego, español, mellor, política, social, xeral, actual, difícil
      • AUX-Fin: é, foi, está, pode, era, sería, vai, será, ten, sexa
      • AUX-Part: considerado
      • DET: o, a, un, unha, súa, lo, seu, esta, este, la
      • NOUN: traballo, goberno, cidade, música, mundo, tempo, dereito, proxecto, país, parte
      • NUM: primeira, un, primeiro, segunda, 1990, 1917, 1999, 2018, 25, 28
      • PRON: que, o, lle, a, me, iso, lo, todo, quen, un
      • PROPN: BNG, Estado, Estatuto, Prestige, PP, Quixote, Consello, Unión, Galiza, PSOE
      • VERB-Fin: hai, ten, fai, fixo, quere, considera, di, dá, semella, afirma
      • VERB-Part: debido, recibida, baseado, dirixida, elaborado, elixido, afectado, apresentado, chamado, dirixido
    </li>
  • Case </td> </tr>
    • Acc
      • PRON: o, nos, lo, a, as, os, me, no, los, na
    • Dat
      • PRON: lle, nos, lles, me, che
    • Nom
      • PRON: eu, el, vostede, nós, ti, eles
    </li>
  • Definite </td> </tr>
    • Def
      • DET: o, a, os, as, lo, la, los, las
      • PRON: a
    • Ind
      • DET: un, unha, uns, unhas
    </li>

    Degree and Polarity

    Degree and Polarity

  • Degree </td> </tr>
    • Cmp
      • ADJ: mellor, maior, maiores, peor, meirande, mellores, menor
    • Sup
      • ADJ: máximo, altísimo, importantísima, máxima
    </li>
  • Polarity </td>
  • Polarity </td> </tr>
    • Neg
      • PART: non
    • Neg
      • ADP: sen
      • ADV: non, nunca, tampouco, Nin, endexamais
      • CCONJ: nin
    </li>
    </li>

    Verbal Features

    Verbal Features

  • Mood </td> </tr>
    • Cnd,Ind
      • AUX: sería, debería, podería, habería, poderían, tería, deberiamos, permanecería
      • AUX-Fin: sería, debería, podería, habería, poderían, tería, permanecería
      • VERB-Fin: gustaría, tería, Diría, Quedaría, correspondería, empobrecería, escluiría, faltaría, gostaría, instalaría
    • Imp
      • VERB-Fin: Explica, Imaxina
    • Ind
      • AUX-Fin: é, foi, está, son, pode, están, era, vai, será, poden
      • VERB-Fin: hai, ten, teñen, fai, fixo, quere, considera, di, dá, fan
    • Sub
      • AUX-Fin: sexa, fose, sexan, estea, estivese, poidan, teña, estean, for, fosen
      • VERB-Fin: sexa, fagan, diga, cumpran, faga, fixese, haxa, inclúa, mostren, pese
    </li>
  • Tense </td> </tr>
    • Fut
      • AUX-Fin: será, serán, haberá, poderá, poderán, Permanecerá, acabarán, for, irá, pasarán
      • VERB-Fin: terá, contará, corresponderá, decidirá, ocupará, recollerá, terán, Atribuirá, Lograrán, Pasarán
    • Imp
      • AUX-Fin: era, estaba, ía, eran, estaban, podía, Podiamos, debían, podia, tiña
      • VERB-Fin: había, tiña, sabía, facía, quería, daba, defendiamos, dicía, escribía, falaba
    • Past
      • AUX-Fin: foi, foron, fose, estivese, estivo, puido, viñeron, estiveron, fosen, puidemos
      • VERB-Fin: fixo, deu, dixo, houbo, publicou, tivo, chegaron, conseguiu, fixemos, comezou
    • Pqp
      • AUX-Fin: fora, deberan, foran
      • VERB-Fin: quixera, cometeran, comunicara, escribiran, houbera, reflectira, rematara, valera, vira
    • Pres
      • AUX-Fin: é, está, son, pode, están, vai, poden, ten, sexa, hai
      • VERB-Fin: hai, ten, teñen, fai, quere, considera, di, dá, fan, semella
    </li>

    Pronouns, Determiners, Quantifiers

    Pronouns, Determiners, Quantifiers

  • PronType </td> </tr>
    • Art
      • DET: o, a, os, as, un, unha, lo, la, los, uns
      • PRON: o, a, os, as
    • Dem
      • DET: esta, este, ese, esa, estes, estas, aqueles, esas, eses, aquel
      • PRON: iso, isto, este, estes, esta, aqueles, Ese, aquel, aquela, esa
    • Ind
      • DET: todo, todos, mesmo, outra, outro, outros, outras, toda, cada, calquera
      • PRON: algo, todo, nada, un, algúns, unha, outros, outro, alguén, mesmo
    • Int
      • ADV: como, cómo, onde
      • DET: que
      • PRON: que, Cal, Quen, canto, Cales, Cantos
    • Prs
      • DET: súa, seu, seus, nosa, súas, noso, meu, miña, nosos, meus
      • PRON: se, lle, nos, o, me, lo, lles, a, elas, nós
    • Rel
      • ADV: como, cando, onde
      • DET: cantas, cuxa, cuxas
      • PRON: que, quen, cales, cantos
    </li>
  • NumType </td> </tr>
    • Card
      • NUM: catro, dous, tres, un, dúas, cinco, dez, 1990, 25, 36
    • Ord
      • NUM: primeira, primeiro, segunda, II, IX, terceira, terceiro, V, primeiras, primeiros
    </li>
  • Poss </td> </tr>
    • Yes
      • DET: súa, seu, seus, nosa, súas, noso, meu, miña, nosos, meus
      • PRON: seu, nosa
    </li>
  • Person </td> </tr>
    • 1
      • AUX: estamos, somos, estou, teño, vou, Podiamos, Sigo, deberiamos, imos, podemos
      • AUX-Fin: estamos, somos, estou, teño, vou, Podiamos, Sigo, imos, podemos, podía
      • AUX-Inf: sermos
      • DET: nosa, noso, meu, miña, nosos, meus, nosas
      • PRON: nos, me, nós, eu, min, nosa
      • VERB-Fin: temos, fixemos, queremos, digo, quixera, chegamos, creo, defendiamos, deixamos, entendemos
      • VERB-Inf: completarmos, integrarmos, irmos, termos
    • 1,3
      • VERB-Fin: Diría
    • 2
      • AUX-Fin: Vas
      • PRON: te, che, ti
      • VERB-Fin: Explica, Imaxina, aceptas, alboreas, atoparás, buscas, chegas, escoites, escureces, miras
    • 3
      • AUX-Fin: é, foi, está, son, pode, están, era, sería, vai, será
      • AUX-Inf: seren
      • DET: súa, seu, seus, súas, os, sua
      • PRON: se, o, lle, a, lo, os, lles, as, elas, el
      • VERB-Fin: hai, ten, teñen, fai, fixo, quere, considera, di, dá, fan
      • VERB-Inf: teren, chegaren, colaboraren, compartiren, decidiren, desviaren, formaren, forzaren, iren, mostraren
    </li>
  • Number[psor] </td> </tr>
    • Plur
      • DET: nosa, súa, seu, noso, súas, seus, nosos, nosas
      • PRON: nosa
    • Sing
      • DET: súa, seu, seus, súas, meu, miña, meus, sua
      • PRON: seu
    </li>

    Other Features

    Other Features

  • AdpType
    • Prep
      • ADJ: por
      • ADP: de, en, a, por, con, para, sobre, entre, sen, desde
  • Clitic
    • Yes
      • PRON: se, lle, nos, o, me, lo, lles, a, as, os
  • Foreign
    • Yes
      • ADJ: obstante, apreciable, efectivo, funcional, vascularizados
      • ADP: de, en
      • ADV: concretamente
      • DET: a
      • NOUN: táboa, Capítulo, cadro, figura, figuras, Califf, Cantábrica-Rías, Lei, Parque, Punto
      • NUM: 1, 10, 20, 23, 70, -11,86, -36,03, -42,43, 105, 11
      • PART: non
      • PRON: como
      • PROPN: 1979a, BOE, Benson, Brassington, CV, Covarrubias, Exponse, Isla, Lim, Lin
      • SYM: +
      • VERB: di, Brooman, Cíes, FA+U, Hannan, IPa, MECACAR, Pasa, autoinmune, cae
  • Syntax

    Auxiliary Verbs and Copula

    • This corpus uses 2 lemmas as copulas (cop). Examples: ser, estar.

    Syntax

    Auxiliary Verbs and Copula

    • This corpus uses 9 lemmas as copulas (cop). Examples: ser, estar, resultar, parecer, considerar, permanecer, deixar, eis, ter.
    • This corpus uses 89 lemmas as auxiliaries (aux). Examples: poder, deber, ser, haber, estar, ter, ir, seguir, chegar, continuar, deixar, tender, vir, como, empezar, acabar, axudar, pasar, facer, tratar, comezar, adoitar, dar, proceder, a, caber, comenzar, contribuír, corresponder, custar, falar, interesar, necesitar, obrigar, outro, repartir, ver, volver, 16, abster, acceder, aceptar, acostumbrarse, analizar, apabulladas, aprender, aquel, bloquear, buscar, calquera.
    • This corpus uses 18 lemmas as auxiliaries (aux). Examples: poder, ir, ter, estar, deber, haber, vir, seguir, acabar, adoitar, pasar, ver, acertar, levar, quedar, querer, semellar, tratar.
    • This corpus uses 3 lemmas as passive auxiliaries (aux:pass). Examples: ser, estar, quedar.

    Core Arguments, Oblique Arguments and Adjuncts

    Here we consider only relations between verbs (parent) and nouns or pronouns (child).
    • nsubj
      • VERB--NOUN (3121)
      • VERB--NOUN-ADP(a) (2)
      • VERB--NOUN-ADP(ata) (2)
      • VERB--NOUN-ADP(aínda)-ADP(xa) (1)
      • VERB--NOUN-ADP(como) (8)
      • VERB--NOUN-ADP(de) (13)
      • VERB--NOUN-ADP(en) (4)
      • VERB--NOUN-ADP(entre) (1)
      • VERB--NOUN-ADP(sobre) (1)
      • VERB--PRON (1826)
      • VERB--PRON-ADP(de) (2)

    Core Arguments, Oblique Arguments and Adjuncts

    Here we consider only relations between verbs (parent) and nouns or pronouns (child).
    • nsubj
      • VERB-Fin--NOUN (336)
      • VERB-Fin--NOUN-ADP(arredor) (1)
      • VERB-Fin--NOUN-ADP(de) (2)
      • VERB-Fin--PRON (277)
      • VERB-Fin--PRON-ADP(con) (1)
      • VERB-Fin--PRON-ADP(en) (1)
      • VERB-Fin--PRON-ADP(por) (1)
      • VERB-Fin--PRON-Acc (1)
      • VERB-Fin--PRON-Dat (3)
      • VERB-Fin--PRON-Nom (20)
      • VERB-Ger--NOUN (7)
      • VERB-Ger--PRON (5)
      • VERB-Inf--NOUN (34)
      • VERB-Inf--PRON (32)
      • VERB-Inf--PRON-ADP(de) (1)
      • VERB-Inf--PRON-Acc (1)
      • VERB-Inf--PRON-Nom (1)
      • VERB-Part--NOUN (15)
      • VERB-Part--PRON (12)
      • VERB-Part--PRON-Nom (1)
    • obj
      • VERB--NOUN (4434)
      • VERB--NOUN-ADP(a) (1)
      • VERB--NOUN-ADP(como) (7)
      • VERB--NOUN-ADP(con) (2)
      • VERB--NOUN-ADP(de) (17)
      • VERB--NOUN-ADP(en) (3)
      • VERB--NOUN-ADP(falar) (1)
      • VERB--NOUN-ADP(historicamente) (1)
      • VERB--NOUN-ADP(investir) (1)
      • VERB--NOUN-ADP(medio) (1)
      • VERB--NOUN-ADP(mentres) (1)
      • VERB--NOUN-ADP(precisamente)-ADP(superior) (1)
      • VERB--NOUN-ADP(segundo) (1)
      • VERB--NOUN-ADP(sobre) (1)
      • VERB--NOUN-ADP(só) (1)
      • VERB--PRON (1608)
      • VERB--PRON-ADP(como) (1)
      • VERB--PRON-ADP(para) (1)
    • obj
      • VERB-Fin--NOUN (496)
      • VERB-Fin--NOUN-ADP(a) (7)
      • VERB-Fin--NOUN-ADP(arredor) (1)
      • VERB-Fin--NOUN-ADP(de) (1)
      • VERB-Fin--PRON (112)
      • VERB-Fin--PRON-ADP(a) (2)
      • VERB-Fin--PRON-ADP(de) (1)
      • VERB-Fin--PRON-ADP(pesar) (1)
      • VERB-Fin--PRON-Acc (54)
      • VERB-Fin--PRON-Dat (6)
      • VERB-Ger--NOUN (53)
      • VERB-Ger--NOUN-ADP(a) (1)
      • VERB-Ger--PRON (3)
      • VERB-Ger--PRON-Acc (4)
      • VERB-Inf--NOUN (283)
      • VERB-Inf--NOUN-ADP(a) (1)
      • VERB-Inf--NOUN-ADP(de) (1)
      • VERB-Inf--PRON (34)
      • VERB-Inf--PRON-ADP(a) (1)
      • VERB-Inf--PRON-Acc (30)
      • VERB-Part--NOUN (7)
      • VERB-Part--PRON (1)
      • VERB-Part--PRON-Acc (2)
    • iobj
      • VERB--PRON (276)
    • iobj
      • VERB-Fin--NOUN-ADP(a) (20)
      • VERB-Fin--PRON (3)
      • VERB-Fin--PRON-ADP(a) (5)
      • VERB-Fin--PRON-Acc (2)
      • VERB-Fin--PRON-Dat (45)
      • VERB-Ger--NOUN-ADP(a) (1)
      • VERB-Ger--PRON-Dat (4)
      • VERB-Inf--NOUN-ADP(a) (8)
      • VERB-Inf--PRON (1)
      • VERB-Inf--PRON-ADP(a) (3)
      • VERB-Inf--PRON-Dat (13)

    Relations Overview

    Relations Overview