home edit page issue tracker

This page pertains to UD version 2.

UD_Galician-CTG

UD_Galician-TreeGal

Tokenization and Word Segmentation

Tokenization and Word Segmentation

  • This corpus contains 3993 sentences, 126011 tokens and 138837 syntactic words.
  • This corpus contains 1000 sentences, 23479 tokens and 25548 syntactic words.
  • This corpus contains 13812 tokens (11%) that are not followed by a space.
  • This corpus contains 2682 tokens (11%) that are not followed by a space.
  • This corpus does not contain words with spaces.
  • This corpus contains 1 types of words with spaces. Examples: 687 614 874
  • This corpus contains 242 types of words that contain both letters and punctuation. Examples: etc., AA., CC., C., S.A., a., art., pp., d/105, L., 1.ª, 2.a, 2.º, 5.º, 80/68/CEE, 92/43/CEE, B., C.H., Castela-A, E., EE.UU., I., J., Timbre-Real, c​o​n​t​e​n​c​i​o​s​o​-​a​d​m​i​n​i​s​t​r​a​t​i​v​o, gr., m/105h, marítimo-terrestre, ptas., v​a​r​i​a​n​z​a​s​-​c​o​v​a​r​i​a​n​z​a​s, -n/2, 08.05.432A.740.0, 1%dos, 1.1.-España, 1.Programa, 1.a, 101/97/CE, 12.1.e, 123.A, 149.1.21.ª, 1999/519/EC, 2.o, 2000/76/CE, 2005,mais, 21.Un, 3.º, 35.3.n, 4.º, 620.1.º, 76/464/CEE
  • This corpus contains 32 types of words that contain both letters and punctuation. Examples: PSdeG-PSOE, etc., Costa-Gavras, (in)cultura, BNG-PSOE, Barros', CIG-ensino, Campos', Cunqueiro:, D., Dulcinea,, F., Galego-portuguesa, Oops..., P., PSOE-BNG, Qué!, R., S., Silencio,, again!, best-sellers, centro-esquerda, cow-boy, d'Estudis, económico-financeira, g​a​l​e​g​o​-​p​o​r​t​u​g​u​é​s​-​b​r​a​s​i​l​e​i​r​o, m​a​n​u​e​l​m​a​r​i​a​@​a​s​-​p​g​.​c​o​m, sex-shop, www.bng-galiza.org, www.novoestatuto.com, xurídico-público
  • This corpus contains 12750 multi-word tokens. On average, one multi-word token consists of 2.01 syntactic words.
  • There are 1211 types of multi-word tokens. Examples: do, da, no, dos, na, das, ao, á, nos, ó, polo, nas, co, pola, dun, coa, dunha, neste, aos, ós, nun, deste, desta, nunha, polos, cos, cunha, nesta, coas, cun, termos, polas, tódolos, destes, destas, nestes, deles, pódese, noutros, tódalas, delas, doutros, doutras, trátase, del, nese, débese, modifícase, nalgúns, desa.
  • This corpus contains 2059 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
  • There are 301 types of multi-word tokens. Examples: do, da, no, na, dos, ao, á, das, polo, nas, coa, nos, co, dun, pola, ás, aos, dunha, nunha, cos, coas, nun, polos, cun, deste, neste, nesta, polas, desta, darlle, delas, dese, cunha, doutras, nesa, trátase, dela, deles, destes, doutros, entenderse, nese, 'García, Barros', Constrúese, Gustaríame, corresponderalle, coñecelo, cúmprense, daqueles.

Morphology

Tags

Morphology

Tags

  • This corpus contains 5 word types tagged as particles (PART): Ln, föhn, non, on, senon
  • This corpus contains 35 lemmas tagged as pronouns (PRON): algo, alguén, aquel, aquilo, cal, cando, canto, che, como, consigo, cuxo, el, este, eu, iso, isto, lle, me, min, nada, ninguén, nos, nós, o, onde, que, quen, quén, se, si, te, ti, un, vos, vostede
  • This corpus contains 40 lemmas tagged as pronouns (PRON): algo, alguén, algún, ambos, aquel, cal, canto, che, demais, el, ese, este, eu, lle, me, mesmo, min, moito, nada, ninguén, ningún, nos, noso, nós, o, outro, pouco, propio, que, quen, se, seu, si, tal, tanto, te, ti, todo, un, vostede
  • This corpus contains 29 lemmas tagged as determiners (DET): algún, ambos, aquel, cada, calquera, canto, certo, demais, entrambos, ese, este, mesmo, meu, moito, ningún, noso, o, outro, pouco, propio, que, senllos, seu, tal, tanto, teu, todo, un, varios
  • This corpus contains 34 lemmas tagged as determiners (DET): algún, ambos, aquel, cada, calquer, calquera, canto, certo, cuxo, demais, demasiado, determinado, el, ese, este, la, los, mesmo, meu, moito, ningún, noso, o, outras, outro, pouco, propio, que, seu, tal, tanto, todo, un, varios
  • Out of the above, 6 lemmas occurred sometimes as PRON and sometimes as DET: aquel, canto, este, o, que, un
  • Out of the above, 22 lemmas occurred sometimes as PRON and sometimes as DET: algún, ambos, aquel, canto, demais, el, ese, este, mesmo, moito, ningún, noso, o, outro, pouco, propio, que, seu, tal, tanto, todo, un
  • This corpus contains 2 lemmas tagged as auxiliaries (AUX): estar, ser
  • This corpus contains 15 lemmas tagged as auxiliaries (AUX): acabar, deber, deixar, estar, haber, ir, levar, poder, quedar, querer, seguir, semellar, ser, ter, vir
  • Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: estar, ser
  • Out of the above, 15 lemmas occurred sometimes as AUX and sometimes as VERB: acabar, deber, deixar, estar, haber, ir, levar, poder, quedar, querer, seguir, semellar, ser, ter, vir
  • This corpus does not use the VerbForm feature.
  • Fin
    • AUX: é, foi, está, son, pode, están, era, sería, vai, será
    • VERB: hai, ten, teñen, fai, fixo, quere, considera, di, vén, dá
  • Ger
    • AUX: sendo, podendo
    • VERB: afirmando, partindo, considerando, dando, pagando, recoñecendo, agardando, apuntando, chegando, cobrando
  • Inf
    • AUX: ser, poder, estar, ter, acabar, ir, quedar, seren, sermos
    • VERB: facer, ter, ver, falar, dar, pasar, traballar, seguir, dicir, gañar
  • Part
    • VERB: debido, recibida, baseado, dirixida, elaborado, elixido, afectado, apresentado, atendidos, chamado

Nominal Features

Nominal Features

  • Com
    • ADJ: obstante, embargante, best, coincidente, diferentes, Simple, Visitábel, bípedes, capaz, conscientes
    • NOUN: nacionalistas, socialistas, galeguista, guitarristas, prol, xornalistas, Babecas, Finalistas, alcalde, antípoda
    • NUM: 13.000, cen
    • PRON: se, nos, que, me, quen, lle, eu, nós, vostede, alguén
  • Fem
    • ADJ: galega, política, europea, nova, social, Franca, actual, cultural, laboral, mellor
    • DET: a, as, unha, súa, esta, la, nosa, súas, esa, outra
    • NOUN: cidade, música, parte, obra, vida, proposta, arte, empresa, obras, lingua
    • NUM: primeira, dúas, segunda, catro, tres, unha, cinco, terceira, 12, 15.000
    • PRON: que, a, lle, as, unha, elas, ela, esta, na, ningunha
    • PROPN: Mercedes, Núñez, Unión, UE, Zona, Bases, Xunta, Constitución, Galiza, Academia
    • VERB-Part: recibida, dirixida, destinadas, feita, feitas, prometidas, realizada, vencellada, Configurada, Nacida
  • Masc
    • ADJ: novo, galego, español, galegos, socialista, constitucional, difícil, gran, mellor, claro
    • DET: o, os, un, lo, seu, este, seus, todo, todos, ese
    • NOUN: anos, traballo, goberno, mundo, tempo, dereito, proxecto, país, medios, grupo
    • NUM: dous, un, primeiro, catro, dez, 1990, 25, cinco, quince, tres
    • PRON: que, o, lle, lo, os, todo, un, algo, algúns, lles
    • PROPN: BNG, Estado, Manuel, Xosé, Miguel, Anxo, Carlos, Estatuto, González, Francisco
    • VERB-Part: debido, baseado, elaborado, elixido, afectado, apresentado, atendidos, chamado, considerado, dirixido
  • Neut
    • PRON: iso, isto
  • Plur
    • ADJ: galegos, diferentes, distintos, maiores, últimos, autonómicas, grandes, económicos, internacionais, novos
    • AUX: son, están, poden, estamos, foron, serán, van, deben, eran, estaban
    • AUX-Fin: son, están, poden, estamos, foron, serán, van, deben, eran, estaban
    • AUX-Inf: seren, sermos
    • DET: os, as, seus, súas, todos, outros, los, outras, estes, uns
    • NOUN: anos, socialistas, medios, obras, nacionalistas, persoas, días, eleccións, veces, galegos
    • NUM: catro, dous, tres, dúas, dez, cinco, quince, oito, 300, 52
    • PRON: que, nos, os, lles, algúns, as, outros, elas, nós, eles
    • PROPN: Bases, Premios, Estados, Mateo, Mestre, 2004, Consellos, Irmandades, Letras, Oscars
    • VERB-Fin: teñen, fan, temos, existen, chegaron, dan, fagan, fixemos, integran, queremos
    • VERB-Inf: teren, chegaren, colaboraren, compartiren, completarmos, decidiren, desviaren, formaren, forzaren, integrarmos
    • VERB-Part: atendidos, destinadas, empeñados, feitas, obrigados, prometidas, Decididos, afectados, apresentadas, asinados
  • Sing
    • ADJ: galega, novo, galego, español, mellor, política, social, xeral, actual, difícil
    • AUX-Fin: é, foi, está, pode, era, sería, vai, será, ten, sexa
    • DET: o, a, un, unha, súa, lo, seu, esta, este, la
    • NOUN: traballo, goberno, cidade, música, mundo, tempo, dereito, proxecto, país, parte
    • NUM: primeira, un, primeiro, segunda, 1990, 1917, 1999, 2018, 25, 28
    • PRON: que, o, lle, a, me, iso, lo, todo, quen, un
    • PROPN: BNG, Estado, Estatuto, Prestige, PP, Quixote, Consello, Unión, Galiza, PSOE
    • VERB-Fin: hai, ten, fai, fixo, quere, considera, di, dá, vén, pasa
    • VERB-Part: debido, recibida, baseado, dirixida, elaborado, elixido, afectado, apresentado, chamado, considerado
  • Acc
    • PRON: o, nos, lo, a, as, os, me, no, los, na
  • Dat
    • PRON: lle, nos, lles, me, che
  • Nom
    • PRON: eu, el, vostede, nós, ti, eles
  • Def
    • DET: o, a, os, as, lo, la, los, las
    • PRON: a
  • Ind
    • DET: un, unha, uns, unhas

Degree and Polarity

Degree and Polarity

  • Cmp
    • ADJ: mellor, maior, maiores, peor, meirande, mellores, menor
  • Sup
    • ADJ: máximo, altísimo, importantísima, máxima
  • Neg
    • PART: non
  • Neg
    • ADP: sen
    • ADV: non, nunca, tampouco, Nin, endexamais
    • CCONJ: nin

Verbal Features

Verbal Features

  • Cnd,Ind
    • AUX: sería, debería, podería, habería, poderían, tería, deberiamos
    • AUX-Fin: sería, debería, podería, habería, poderían, tería
    • VERB-Fin: gustaría, tería, Diría, Quedaría, correspondería, empobrecería, escluiría, faltaría, gostaría, instalaría
  • Imp
    • VERB-Fin: Explica, Imaxina
  • Ind
    • AUX-Fin: é, foi, está, son, pode, están, era, vai, será, poden
    • VERB-Fin: hai, ten, teñen, fai, fixo, quere, considera, di, vén, dá
  • Sub
    • AUX-Fin: sexa, fose, sexan, estea, estivese, poidan, teña, estean, for, fosen
    • VERB-Fin: sexa, fagan, diga, cumpran, faga, fixese, haxa, inclúa, mostren, pese
  • Fut
    • AUX-Fin: será, serán, haberá, poderá, poderán, acabarán, for, irá
    • VERB-Fin: terá, contará, corresponderá, decidirá, ocupará, pasarán, recollerá, terán, Atribuirá, Lograrán
  • Imp
    • AUX-Fin: era, estaba, ía, eran, estaban, podía, Podiamos, debían, podia, tiña
    • VERB-Fin: había, tiña, sabía, facía, quería, daba, defendiamos, dicía, escribía, falaba
  • Past
    • AUX-Fin: foi, foron, fose, estivese, estivo, puido, Viñeron, estiveron, fosen, puidemos
    • VERB-Fin: fixo, deu, dixo, houbo, publicou, tivo, chegaron, conseguiu, fixemos, comezou
  • Pqp
    • AUX-Fin: fora, deberan, foran
    • VERB-Fin: quixera, cometeran, comunicara, escribiran, houbera, reflectira, rematara, valera, vira
  • Pres
    • AUX-Fin: é, está, son, pode, están, vai, poden, ten, sexa, hai
    • VERB-Fin: hai, ten, teñen, fai, quere, considera, di, vén, dá, fan

Pronouns, Determiners, Quantifiers

Pronouns, Determiners, Quantifiers

  • Art
    • DET: o, a, os, as, un, unha, lo, la, los, uns
    • PRON: o, a, os, as
  • Dem
    • DET: esta, este, ese, esa, estes, estas, aqueles, esas, eses, aquel
    • PRON: iso, isto, este, estes, esta, aqueles, Ese, aquel, aquela, esa
  • Ind
    • DET: todo, todos, mesmo, outra, outro, outros, outras, toda, cada, calquera
    • PRON: algo, todo, un, nada, algúns, unha, outros, outro, alguén, mesmo
  • Int
    • ADV: como, cómo, onde
    • DET: que
    • PRON: que, Cal, Quen, canto, Cales, Cantos
  • Prs
    • DET: súa, seu, seus, nosa, súas, noso, meu, miña, nosos, meus
    • PRON: se, lle, nos, o, me, lo, lles, a, elas, nós
  • Rel
    • ADV: como, cando, onde
    • DET: cantas, cuxa, cuxas
    • PRON: que, quen, cales, cantos
  • Card
    • NUM: catro, dous, tres, un, dúas, cinco, dez, 1990, 25, 36
  • Ord
    • NUM: primeira, primeiro, segunda, II, IX, terceira, terceiro, V, primeiras, primeiros
  • Yes
    • DET: súa, seu, seus, nosa, súas, noso, meu, miña, nosos, meus
    • PRON: seu, nosa
  • 1
    • AUX: estamos, somos, estou, teño, vou, Podiamos, Sigo, deberiamos, imos, podemos
    • AUX-Fin: estamos, somos, estou, teño, vou, Podiamos, Sigo, imos, podemos, podía
    • AUX-Inf: sermos
    • DET: nosa, noso, meu, miña, nosos, meus, nosas
    • PRON: nos, me, nós, eu, min, nosa
    • VERB-Fin: temos, fixemos, queremos, digo, quixera, chegamos, creo, defendiamos, deixamos, entendemos
    • VERB-Inf: completarmos, integrarmos, irmos, termos
  • 1,3
    • VERB-Fin: Diría
  • 2
    • AUX-Fin: Vas
    • PRON: te, che, ti
    • VERB-Fin: Explica, Imaxina, aceptas, alboreas, atoparás, buscas, chegas, escoites, escureces, miras
  • 3
    • AUX-Fin: é, foi, está, son, pode, están, era, sería, vai, será
    • AUX-Inf: seren
    • DET: súa, seu, seus, súas, os, sua
    • PRON: se, o, lle, a, lo, os, lles, as, elas, el
    • VERB-Fin: hai, ten, teñen, fai, fixo, quere, considera, di, vén, dá
    • VERB-Inf: teren, chegaren, colaboraren, compartiren, decidiren, desviaren, formaren, forzaren, iren, mostraren
  • Plur
    • DET: nosa, súa, seu, noso, súas, seus, nosos, nosas
    • PRON: nosa
  • Sing
    • DET: súa, seu, seus, súas, meu, miña, meus, sua
    • PRON: seu

Other Features

Other Features

  • AdpType
    • Prep
      • ADP: de, en, a, por, con, para, sobre, entre, sen, desde
  • Clitic
    • Yes
      • PRON: se, lle, nos, o, me, lo, lles, a, as, os
  • Foreign
    • Yes
      • ADJ: obstante, apreciable, efectivo, funcional, vascularizados
      • ADP: de, en
      • ADV: concretamente
      • DET: a
      • NOUN: táboa, Capítulo, cadro, figura, figuras, Califf, Cantábrica-Rías, Lei, Parque, Punto
      • NUM: 1, 10, 20, 23, 70, -11,86, -36,03, -42,43, 105, 11
      • PART: non
      • PRON: como
      • PROPN: 1979a, BOE, Benson, Brassington, CV, Covarrubias, Exponse, Isla, Lim, Lin
      • SYM: +
      • VERB: di, Brooman, Cíes, FA+U, Hannan, IPa, MECACAR, Pasa, autoinmune, cae

Syntax

Auxiliary Verbs and Copula

  • This corpus uses 2 lemmas as copulas (cop). Examples: ser, estar.

Syntax

Auxiliary Verbs and Copula

  • This corpus uses 2 lemmas as copulas (cop). Examples: ser, estar.
  • This corpus uses 89 lemmas as auxiliaries (aux). Examples: poder, deber, ser, haber, estar, ter, ir, seguir, chegar, continuar, deixar, tender, vir, como, empezar, acabar, axudar, pasar, facer, tratar, comezar, adoitar, dar, proceder, a, caber, comenzar, contribuír, corresponder, custar, falar, interesar, necesitar, obrigar, outro, repartir, ver, volver, 16, abster, acceder, aceptar, acostumbrarse, analizar, apabulladas, aprender, aquel, bloquear, buscar, calquera.
  • This corpus uses 13 lemmas as auxiliaries (aux). Examples: poder, ir, ter, estar, deber, haber, vir, seguir, acabar, deixar, levar, querer, semellar.
  • This corpus uses 3 lemmas as passive auxiliaries (aux:pass). Examples: ser, estar, quedar.

Core Arguments, Oblique Arguments and Adjuncts

Here we consider only relations between verbs (parent) and nouns or pronouns (child).
  • nsubj
    • VERB--NOUN (3121)
    • VERB--NOUN-ADP(a) (2)
    • VERB--NOUN-ADP(ata) (2)
    • VERB--NOUN-ADP(aínda)-ADP(xa) (1)
    • VERB--NOUN-ADP(como) (8)
    • VERB--NOUN-ADP(de) (13)
    • VERB--NOUN-ADP(en) (4)
    • VERB--NOUN-ADP(entre) (1)
    • VERB--NOUN-ADP(sobre) (1)
    • VERB--PRON (1826)
    • VERB--PRON-ADP(de) (2)

Core Arguments, Oblique Arguments and Adjuncts

Here we consider only relations between verbs (parent) and nouns or pronouns (child).
  • nsubj
    • VERB-Fin--NOUN (339)
    • VERB-Fin--NOUN-ADP(arredor) (1)
    • VERB-Fin--NOUN-ADP(de) (2)
    • VERB-Fin--PRON (285)
    • VERB-Fin--PRON-ADP(con) (1)
    • VERB-Fin--PRON-ADP(en) (1)
    • VERB-Fin--PRON-ADP(por) (1)
    • VERB-Fin--PRON-Acc (1)
    • VERB-Fin--PRON-Dat (4)
    • VERB-Fin--PRON-Nom (20)
    • VERB-Ger--NOUN (7)
    • VERB-Ger--PRON (5)
    • VERB-Inf--NOUN (33)
    • VERB-Inf--PRON (30)
    • VERB-Inf--PRON-ADP(de) (1)
    • VERB-Inf--PRON-Acc (1)
    • VERB-Inf--PRON-Nom (1)
    • VERB-Part--NOUN (15)
    • VERB-Part--PRON (10)
    • VERB-Part--PRON-Nom (1)
  • obj
    • VERB--NOUN (4434)
    • VERB--NOUN-ADP(a) (1)
    • VERB--NOUN-ADP(como) (7)
    • VERB--NOUN-ADP(con) (2)
    • VERB--NOUN-ADP(de) (17)
    • VERB--NOUN-ADP(en) (3)
    • VERB--NOUN-ADP(falar) (1)
    • VERB--NOUN-ADP(historicamente) (1)
    • VERB--NOUN-ADP(investir) (1)
    • VERB--NOUN-ADP(medio) (1)
    • VERB--NOUN-ADP(mentres) (1)
    • VERB--NOUN-ADP(precisamente)-ADP(superior) (1)
    • VERB--NOUN-ADP(segundo) (1)
    • VERB--NOUN-ADP(sobre) (1)
    • VERB--NOUN-ADP(só) (1)
    • VERB--PRON (1608)
    • VERB--PRON-ADP(como) (1)
    • VERB--PRON-ADP(para) (1)
  • obj
    • VERB-Fin--NOUN (496)
    • VERB-Fin--NOUN-ADP(a) (7)
    • VERB-Fin--NOUN-ADP(arredor) (1)
    • VERB-Fin--NOUN-ADP(de) (1)
    • VERB-Fin--PRON (114)
    • VERB-Fin--PRON-ADP(a) (2)
    • VERB-Fin--PRON-ADP(de) (1)
    • VERB-Fin--PRON-ADP(pesar) (1)
    • VERB-Fin--PRON-Acc (54)
    • VERB-Fin--PRON-Dat (6)
    • VERB-Ger--NOUN (53)
    • VERB-Ger--NOUN-ADP(a) (1)
    • VERB-Ger--PRON (3)
    • VERB-Ger--PRON-Acc (4)
    • VERB-Inf--NOUN (283)
    • VERB-Inf--NOUN-ADP(a) (1)
    • VERB-Inf--NOUN-ADP(de) (1)
    • VERB-Inf--PRON (34)
    • VERB-Inf--PRON-ADP(a) (1)
    • VERB-Inf--PRON-Acc (31)
    • VERB-Part--NOUN (7)
    • VERB-Part--PRON (1)
    • VERB-Part--PRON-ADP(a) (1)
    • VERB-Part--PRON-Acc (2)
  • iobj
    • VERB--PRON (276)
  • iobj
    • VERB-Fin--NOUN-ADP(a) (20)
    • VERB-Fin--PRON (3)
    • VERB-Fin--PRON-ADP(a) (5)
    • VERB-Fin--PRON-Acc (2)
    • VERB-Fin--PRON-Dat (46)
    • VERB-Ger--NOUN-ADP(a) (1)
    • VERB-Ger--PRON-Dat (4)
    • VERB-Inf--NOUN-ADP(a) (8)
    • VERB-Inf--PRON (1)
    • VERB-Inf--PRON-ADP(a) (3)
    • VERB-Inf--PRON-Dat (13)

Relations Overview

Relations Overview