UD Irish IDT
Language: Irish (code: ga
)
Family: Indo-European, Celtic
This treebank has been part of Universal Dependencies since the UD v1.0 release.
The following people have contributed to making this treebank part of UD: Teresa Lynn, Jennifer Foster, Sarah McGuinness, Abigail Walsh, Jason Phelan, Kevin Scannell.
Repository: UD_Irish-IDT
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.14
License: CC BY-SA 3.0
Genre: news, fiction, web, legal, government
Questions, comments? General annotation questions (either Irish-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [teresa • lynn (æt) adaptcentre • ie; jennifer • foster (æt) dcu • ie]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | annotated manually |
Features | assigned by a program, with some manual corrections, but not a full manual verification |
Relations | annotated manually, natively in UD style |
Description
A Universal Dependencies 4910-sentence treebank for modern Irish.
The Irish UD Treebank (IUDT) is a conversion of the Irish Dependency Treebank (IDT), which was part of a PhD research project by Teresa Lynn at Dublin City University, Ireland (Lynn, 2016).
—- The (smaller) IDT dataset has also been released on [GitHub] (https://github.com/tlynn747/IrishDependencyTreebank). —-
The Treebank contains 4910 sentences.
The first 2924 of which were taken from the New Corpus of Ireland-Irish (NCII), with text from books, newswire, websites and other media. These sentences are a subset of a gold-standard POS-tagged corpus for Irish made available by Elaine Uí Dhonnchadha of Trinity College Dublin. —-
The subsequent 1986 sentences were taken from a corpus of Irish public administration translations and are available under the Open Data (PSI) directive for sharing of pubic data: Citizens information website: (20%) Dublin City Council (DCC): (25%) DEpartment of Culture, Heritage and the Gaeltacht (DCHG):(9%) Udaras na Gaeltachta: (25%) EUbookshop: (21%)
The conversion from the IDT annotation scheme to the UD annotation scheme for the first release (1020 IDT trees) was designed by Teresa Lynn and Jennifer Foster at Dublin City University, Ireland. The mapping to UD is reported in Lynn et al., (2016) Conversion of sentences 1-1020 was automatic, with manual review. Subsequent updates or changes have been a combination of automatic labelling and manual review. All trees with sentence ID greater than 1021 were created through an automatic pre-parsing approach followed by manual review.
The UD Treebank is split into two sets as follows:
- 454 trees (test)
- 451 trees (dev)
- 4005 trees (train)
Note: the 451 dev trees were taken from the set of newly annotated trees in the v2.5 release. Selection of test sentences haven’t changed since v1.0 (but annotations and quality have!)
Acknowledgments
We wish to thank all of the contributors to the original IDT annotation, including Elaine Uí Dhonnchadha for her gold POS-tagged corpus and linguistic advice. We would also like to acknowledge linguistic advice offered by Kevin Scannell in the conversion to UD effort.
Expansion of the IUDT from 2019-2021 is funded by the Irish Government Department of Culture, Heritage and the Gaeltacht under the GaelTech project.
This research is partially supported by Science Foundation Ireland through the ADAPT Centre for Digital Content Technology. The ADAPT Centre for Digital Content Technology is funded under the SFI Research Centres Programme (Grant 13/RC/2106) and is co-funded under the European Regional Development Fund.
Statistics of UD Irish IDT
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – Aspect – Case – Definite – Degree – Dialect – Foreign – Form – Gender – Mood – NounType – Number – NumType – PartType – Person – Polarity – Poss – PrepForm – PronType – Reflex – Tense – Typo – VerbForm
Relations
acl – acl:relcl – advcl – advmod – amod – appos – case – case:voc – cc – ccomp – compound – compound:prt – conj – cop – csubj:cleft – csubj:cop – det – discourse – dislocated – fixed – flat – flat:foreign – flat:name – goeswith – list – mark – mark:prt – nmod – nmod:poss – nsubj – nsubj:outer – nummod – obj – obl – obl:prep – obl:tmod – orphan – parataxis – punct – root – vocative – xcomp – xcomp:pred
Tokenization and Word Segmentation
- This corpus contains 4910 sentences and 115990 tokens.
- This corpus contains 11650 tokens (10%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 620 types of words that contain both letters and punctuation. Examples: d', d’, b', n-áirítear, nua-aimseartha, (b), m', (a), a', fho-alt, t-ábhar, Teo., Co., 'n, (c), t-airgead, t-aon, n-oileán, s', srl., 's, O', n-ealaíon, t-am, Uimh., a'm, ", 'na, (i), Dr., T.D., an-chuid, i.e., mb', n-éireoidh, n-úsáid, t-athrú, t-iomlán, (d), (ii), Dublin.ie, an-dearfach, an-mhór, an-tábhachtach, c(h)ónaí, e.g., m.sh., n', t-ainm, t-aistriú
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 44 word types tagged as particles (PART): DA, Mag, Mc, Mhac, Mhic, Nic, O, O', O’, UÍ, Uí, a, ab, an, ar, b', ba, cha, chan, d', de, do, dá, d’, faoina, go, gur, ina, inar, is, le, lena, lenar, mac, n', n-a, nach, ná, nár, ní, níor, níos, trína, ó
- This corpus contains 36 lemmas tagged as pronouns (PRON): a, ar, cad, cad_é, ceachtar, cibé, cé, céard, ea, eisean, eo, féin, iad, is, ise, iúd, mise, muid, mé, pé, seisean, seo, siad, sibh, sin, sinn, sise, siúd, sé, séard, sí, that, tusa, tú, é, í
- This corpus contains 21 lemmas tagged as determiners (DET): a, achan, all, an, aon, bhur, cibé, do, eile, gach, gach_aon, gach_uile, mo, s, seo, sin, siúd, the, uile, ár, úd
- Out of the above, 5 lemmas occurred sometimes as PRON and sometimes as DET: a, cibé, seo, sin, siúd
- This corpus contains 1 lemmas tagged as auxiliaries (AUX): is
- There are 4 (de)verbal forms:
- Cop
- AUX: is, ba, ní, gur, b', nach, ar, gurb, nár, an
- PART: ba, b'
- PRON: Caidé, cér, cérbh
- SCONJ: más, ós, mura, arb, dar, murab, murar, Sular
- Inf
- NOUN: fáil, chur, dhéanamh, bheith, cur, thabhairt, dul, siúl, rá, teacht
- Part
- ADJ: déanta, curtha, bunaithe, leagtha, aontaithe, caite, tugtha, scríofa, dírithe, fostaithe
- Vnoun
- NOUN: dul, obair, teacht, cur, baint, iarraidh, déanamh, freastal, brath, tabhairt
Nominal Features
- Fem
- ADJ: nua, náisiúnta, mhór, éagsúla, poiblí, amháin, idirnáisiúnta, mhaith, ildánach, chultúrtha
- ADP: uirthi, di, ina, aici, á, léi, dá, inti, lena, chuici
- DET: na, a, 'na, n-a
- NOUN: chuid, réir, leith, bhfeidhm, bliana, cathrach, bhliain, bliain, cuid, áit
- NOUN-Inf: dtabhairt, nginiuint, reáchtáil
- PRON: sí, í, sise, ise, hí
- PROPN: cliath, Gaeltachta, Gaeilge, hÉireann, Ghaeltacht, Chomhairle, Éirinn, Ghaeilge, hEorpa, Ghaeltachta
- Fem,Masc
- ADP: ina, dá, lena
- DET: a
- Masc
- ADJ: nua, mór, amháin, sibhialta, céanna, náisiúnta, áirithe, áitiúil, áitiúla, Eorpach
- ADP: ann, ina, leis, air, á, aige, dá, dó, lena, chuige
- AUX-Cop: sé
- DET: an, a, a'
- NOUN: duine, chéile, daoine, rud, cinn, ábhar, lá, pobail, am, bith
- NOUN-Inf: soláthar, athinfheistiú, dhéanamh, dtíolacadh, gcothú, hiniúchadh, lorg, scríbbh, sheoladh, áiteamh
- PRON: sé, é, seisean, hé, eisean, éard, se
- PROPN: Átha, Bhaile, Údarás, Baile, Seán, Coimisiún, mBaile, Béarla, Fómhair, Údaráis
- Plur
- ADJ: éagsúla, nua, áirithe, áitiúla, náisiúnta, poiblí, beaga, óga, réigiúnacha, speisialta
- ADP: acu, sna, leo, orthu, ina, dóibh, againn, á, lena, dúinn
- DET: na, a, ár, bhur, á
- NOUN: daoine, seirbhísí, páistí, dhaoine, ealaíon, pháistí, rialacha, gnóthaí, imeachtaí, leabharlanna
- PRON: iad, siad, muid, sibh, sinn, siadsan, hiad, iadsan, sinne, said
- PROPN: cliath, nGall, Fianna, Gaeltachtaí, Gael, Árann, Gaeil, Tionóntán, Coistí, Cúirteanna
- VERB: táimid, ceannaímid, bhíodar, cuirimid, déanfaimid, roghnaímid, faighimid, féachaimid, glacaimid, mbeimid
- Sing
- ADJ: nua, amháin, mór, náisiúnta, sibhialta, áitiúil, céanna, mhór, iomlán, Eorpach
- ADP: sa, den, ann, don, ina, san, ón, leis, air, á
- AUX-Cop: sé
- DET: an, na, a, do, mo, d', m', a', 'n, d’
- NOUN: duine, féidir, chuid, chéile, réir, rud, leith, éis, cinn, bhfeidhm
- NOUN-Inf: soláthar, athinfheistiú, dhéanamh, dtabhairt, dtíolacadh, gcothú, hiniúchadh, lorg, nginiuint, reáchtáil
- PART: ba, ní
- PRON: sé, é, sí, mé, í, tú, cén, ea, mise, seisean
- PROPN: Átha, Bhaile, Gaeltachta, Gaeilge, hÉireann, Údarás, Ghaeltacht, Chomhairle, Éirinn, Baile
- VERB: féach, bíodh, déan, cuir, tabhair, táim, bhíos, déarfá, fheadar, rabhas
- Dat
- NOUN: leith, cionn, gcrích, mbliana, láimh, chois, cois, gcéin, chionn, gcionn
- PROPN: Éirinn, hÉirinn, Tigh
- Gen
- ADJ: Eorpaigh, réigiúnacha, náisiúnta, poiblí, áitiúil, nua, sóisialta, sibhialta, éagsúla, idirnáisiúnta
- DET: na, an, a', a, 'na
- NOUN: cinn, cathrach, bliana, pobail, forbartha, oibre, tuaithe, phobail, oideachais, imeachta
- NOUN-Inf: pleanála, dhéanta, Fiosraithe, Gaelscolaíochta, athainmnithe, bearrtha, chanta, chleachta, claonta, constrála
- PROPN: Átha, cliath, Gaeltachta, Gaeilge, hÉireann, Bhaile, hEorpa, Ghaeltachta, Éireann, Fómhair
- Nom
- ADJ: nua, amháin, náisiúnta, mór, éagsúla, céanna, sibhialta, áirithe, idirnáisiúnta, mhór
- NOUN: féidir, chuid, duine, réir, rud, éis, bhfeidhm, lá, daoine, bhliain
- NOUN-Inf: fhoilsiú, soláthar, Fhorbairt, Shaoráil, athfhorasú, athinfheistiú, athréimniú, bharbarú, bhunú, dhéanamh
- NOUN-Vnoun: dhúnadh
- PROPN: Bhaile, Ghaeltacht, Seán, Coimisiún, Chathair, Ghaeilge, Éire, Údarás, Mháire, Dhún
- Voc
- ADJ: ghil
- NOUN: bhó, dhochtúir, Chapaillín, Dhaid, LIA, Rí, bhithiúnaigh, bhráithre, bhráthair, chumannaigh
- PROPN: Mháire, Sheáin, Shéamais, Tom, Bheartla, Bhobby, Chití, Dhoráid, Fhinn, Learaí
- Def
- DET: an, na, gach, ngach, chuile, a, a', 'n, achan, 'na
- NOUN: chuid, chéile, réir, bhliain, duine, bliana, fud, gcuid, Airteagal, lá
- NOUN-Inf: dhéanamh, chur, lorg, gcur, cur, mhaoiniú, chinntiú, rá, déanamh, iarraidh
- NOUN-Vnoun: bunú, Ceiliúradh, Cumhachtú, bheartú, bhunú, chinntiú, deireadh, dhúnadh, dtabhairt, dul
- PROPN: Átha, cliath, Bhaile, Gaeltachta, Gaeilge, Údarás, hÉireann, Ghaeltacht, Chomhairle, Éirinn
Degree and Polarity
- Cmp,Sup
- ADJ: mó, fearr, déanaí, faide, lú, fhearr, airde, gaire, leithne, luaithe
- ADJ-Part: forbartha, réitithe
- Pos
- ADJ: maith, mór, amháin, léir, minic, sásta, fada, háirithe, tábhachtach, saor
- Neg
- AUX-Cop: ní, nach, nár, níor, níorbh, nárbh, chan, nách
- PART: nach, ní, níor, nár, ná, chan, n', cha
- VERB: níl, raibh, bhfuil, bheidh, mbeadh, mbeidh, bheadh, dhéanfaidh, fhaca, bhfaca
Verbal Features
- Hab
- VERB: bhíonn, bíonn, mbíonn, Bím, bhíos, bhímid, bímid, Bítear, mbímid
- Imp
- VERB: bhíodh, mbíodh, dhéanadh, chuirtí, mbínn, thagadh, thugadh, Théadh, bhídís, chuireadh
- Cnd
- AUX-Cop: ba, B', gur, ar, mba
- VERB: mbeadh, bheadh, fhéadfadh, dtiocfadh, bhféadfadh, rachadh, bhféadfaí, fhéadfaí, gcuirfeadh, gcuirfí
- Cnd,Int
- VERB: mbeadh, bhfeicfeadh, bhfillfinn, bhféadfainn, bhféadfá, dteipfeadh, gceapfaí, gcloisfimis, soláthróinn
- Imp
- PART: ná
- VERB: féach, bíodh, déan, cuir, tabhair, téigh, Léigh, bain, dein, labhair
- Ind
- VERB: tá, bhí, atá, bhfuil, raibh, beidh, bheidh, níl, mbeidh, thug
- Int
- AUX-Cop: an, nach, nár, arbh
- Sub
- PART: go, Nár
- VERB: bhfeaca, bhfeice, bhfága, chroma, lige, n-imí, n-ithe, raibh, sábhála
- Fut
- VERB: beidh, bheidh, mbeidh, féadfaidh, déanfaidh, cuirfidh, déanfar, cuirfear, caithfidh, tabharfaidh
- Past
- ADV: Cár
- AUX-Cop: ba, b', gur, nár, gurbh, níor, níorbh, mba, ab, ar
- PART: gur, níor, nár, ar, ba, inar, b', lenar
- PART-Cop: ba, b'
- SCONJ: sular, murar, sarar
- VERB: bhí, raibh, thug, tháinig, chuir, dúirt, cuireadh, rinne, bhíodh, rinneadh
- Pres
- AUX-Cop: is, ní, gur, nach, ar, gurb, an, sé, sea, dar
- SCONJ-Cop: mura, murab, murar, Sular
- VERB: tá, atá, bhfuil, níl, bhaineann, bhíonn, bíonn, leanas, cuireann, cuirtear
Pronouns, Determiners, Quantifiers
- Art
- ADP: sa, den, don, san, ón, faoin, sna, fén, insa, fán
- DET: an, na, a, a', 'n, 'na, un
- Dem
- AUX-Cop: sin, seo
- DET: seo, sin, eile, úd, san, so, s', siúd, siud
- PRON: sin, seo, siúd, shin, san, hin, in, eo, iúd, shoin
- Emp
- ADP: againne, domsa, agamsa, leatsa, liomsa, duitse, ormsa, agatsa, daoibhse, domhsa
- PRON: mise, seisean, tusa, eisean, sise, ise, siadsan, iadsan, sinne
- Ind
- DET: aon, uile, cibé, uilig, t-aon, haon, n-uile
- PRON: pé, ceachtar, cibé, cheachtar
- Int
- ADV: conas, cá, Cár
- PRON: cad, cé, céard, cén, c, cér, cérbh
- PRON-Cop: cér, cérbh
- Prs
- ADP: á, dhá
- Rel
- ADP: dá, faoina, lenar
- AUX-Cop: is, nach, ba, ab, nár, ar, nárbh, inar, nách
- PART: a, ina, nach, lena, ar, dá, inar, nár, faoina, ná
- PRON: a, ar
- VERB: atá, leanas, bheas, atáim, atáthar, eireos, fholmhaíos, tharlós, ata, atáid
- Card
- NUM: trí, dhá, dá, cúig, seacht, sé, céad, deich, fiche, ceithre
- Ord
- NUM: chéad, dara, tríú, gcéad, 18ú, seachtú, naoú, 10ú, 11ú, ceathrú
- Yes
- ADP: ina, á, dá, lena, arna, faoina, óna, inár, dár, lenár
- DET: a, do, mo, d', ár, m', bhur, d’, dh', n-a
- Yes
- PRON: féin, fhéin, fein
- PROPN: Féin, Fein
- 0
- VERB: cuireadh, rinneadh, cuirtear, n-áirítear, déanfar, déantar, cuirfear, tugadh, foilsíodh, ndéantar
- 1
- ADP: liom, againn, agam, orm, dom, dúinn, linn, romhainn, orainn, chugainn
- DET: mo, ár, m'
- PRON: mé, muid, mise, sinn, sinne, me
- VERB: táimid, táim, bhíos, ceannaímid, fheadar, rabhas, Bím, chuireas, creidim, cuirimid
- 2
- ADP: leat, duit, agat, ort, uait, agaibh, leatsa, libh, oraibh, daoibh
- DET: do, d', bhur, d’, dh'
- PRON: tú, sibh, tusa, thú, thusa
- VERB: féach, déan, cuir, tabhair, déarfá, téigh, Léigh, bain, bhféadfá, dein
- 3
- ADP: ina, ann, á, leis, air, acu, dá, aige, lena, leo
- AUX-Cop: sé
- DET: a, n-a, á
- PRON: sé, é, iad, siad, sí, í, ea, seisean, hé, eisean
- VERB: bíodh, bhíodar, rabhadar, Dáileadh, bhfuilid, bhídís, chuadar, chuireadar, mbeidís, ndéanfaidís
Other Features
- Abbr
- Yes
- ADJ: Teo., Teo, Ltd
- ADV: i.e., e.g., srl., m.sh., .i., KB, etc
- NOUN: Co., Dr., Dr, m, srl., Uimh., 4C, CD-ROM, EUR, I.R.
- NUM: 1A, 3B, J., S1067
- PROPN: AE, AIE, UNESCO, BCE, TG4, MABS, RTÉ, TD, DCPL, FLAC
- SYM: Dublin.ie, Gcom, King.com, post@clubsult.com
- X: A, .i., IRA, Uimh.
- Yes
- Dialect
- Connaught
- ADP: acub
- ADV: indiu
- NOUN: ceantracha, nuaíochta
- PRON: Caidé
- Munster
- ADP: age, des
- DET: san, so
- NOUN: tigh, thigh
- PART: ná
- PRON: san, so
- PROPN: Ghaelainn
- VERB: dhein, deineadh, dein, Bhraitheas, bhfuilid, chuireas, chífeá, dhineann, dtaibhreoid
- Ulster
- ADP: fá, domhsa, domh
- AUX-Cop: chan
- DET: achan
- NOUN: bhomaite, bádaí, cha, choinne, momaite
- PART: chan, cha
- PRON-Cop: Caidé
- Connaught
- Foreign
- Yes
- ADJ: general, strong, white, Ltd
- ADP: in
- DET: all, The
- NOUN: euro, of, tOmbudsman, abalone, Captains, Enterprise, FRANCA, Jail-Deliverer, LINGUA, Ombudsman
- PRON: that
- PROPN: John, Margaret, Henrietta, Humphreys, Ombudsman, Gilbert, Eurojust, Hayes, Ireland, Richmond
- SYM: www.citizensinformation.ie, www.dublin.ie
- X: the, Irish, of, Life, for, Port, Preparing, Read, Right, to
- Yes
- Form
- Direct
- PART: a, nach, nár, do, ná
- VERB: atá, atáim, atáthar, ata, atáid, tá
- Direct,Emp
- VERB: atáimse
- Ecl
- ADJ: bhfurast, dtréan, gcéanna
- ADP: dtí
- AUX-Cop: mba
- DET: ngach, n-a, n-uile
- NOUN: bhfeidhm, dtí, gcuid, gceist, gcás, mbliana, gcomhairle, gcónaí, ndiaidh, mbun
- NOUN-Inf: gcur, ndéanamh, n-úsáid, bhfeidhmiú, gceadú, mbunú, bhfeiceáil, bhfoilsiú, bhfáil, bhféachaint
- NOUN-Vnoun: dtabhairt, gcaitheamh, nglacadh
- NUM: gcéad, dtríú, gceithre, gcúig, gcúigiú, n-aon
- PROPN: mBaile, nGall, gCoimisiún, gCúirt, nGaeilge, gConamara, gClár, nDún, nGaillimh, bhFrainc
- VERB: bhfuil, mbeadh, mbeidh, mbíonn, n-áirítear, mbaineann, ndéantar, dtagraítear, dtiocfadh, mbíodh
- X: nAll
- Ecl,Emp
- VERB: bhfeicimidne, bhféadfainnse, gcaithfeadsa, gceapaimse, mbínnse
- Ecl,Indirect
- PART: n-a
- Ecl,VF
- AUX-Cop: mb'
- Emp
- NOUN: Roinnse, achomharcsa, leithscéalsa, liostasa
- VERB: deirimse, Creidimidne, Feicimse, Tabharfadsa, Táimse, adeirimse, cloisimse, déarfainnse, nílirse
- Emp,Len
- NOUN: thuairimse, chroíse, ghrúpa-san, mháthairse
- VERB: bhainfinnse, fheadarsa, thuigeadarsan, thángas-sa
- HPref
- ADJ: háirithe, hiomlán, hamháin, hidirnáisiúnta, hiondúil, huathoibríoch, hálainn, héifeachtach, hiontach, han-mhaith
- ADP: hair
- DET: haon
- NOUN: haghaidh, haois, heagraíochtaí, hathruithe, hinstitiúidí, húdaráis, healaíona, hoíche, háite, hAirteagal
- NOUN-Inf: húsáid, híoc, haisíoc, haithint, hasbhaint, hathbhreithniú, hathréimiú, himeacht, himirt, hiniúchadh
- NOUN-Vnoun: hainmniú, hathréimiú, húsáid
- NUM: haon, hocht
- PRON: hé, hiad, hí
- PROPN: hÉireann, hEorpa, hÉirinn, hEaglaise, hAlban, hAoine, h-Íde, hOstaire, hAlbain, hAthbheochana
- VERB: habair, haithneodh, hiarradh, héilítear, híocaigí, húsáideadh
- X: hamazon
- Indirect
- PART: a, ina, lena, ar, nach, dá, inar, faoina, DA, go
- Len
- ADJ: mhór, mhaith, chóir, cheart, phoiblí, chéanna, bheag, chultúrtha, fhearr, shóisialta
- ADJ-Part: bheartaithe, bhunaithe, chomhcheangailte, fheirmithe, shuidhte, thruaillithe
- ADP: dhá, thríd, dhíobh, dhó, dhóibh, dhe, dho, dhom, dhuit, thrí
- ADV: bheith
- AUX-Cop: chan
- DET: chuile, chaon, dh'
- NOUN: chur, dhéanamh, bheith, chuid, chéile, thabhairt, bhliain, fhorbairt, fháil, bhaint
- NOUN-Inf: chur, dhéanamh, bheith, thabhairt, fháil, bhaint, fhorbairt, choinneáil, sholáthar, ghlacadh
- NOUN-Vnoun: bhaint, bheartú, bhunú, chinntiú, choimisiúnú, chruthaithe, dheonú, dhúnadh, fhionnachtain, ghlacadh
- NUM: dhá, chéad, cheithre, dhó, thrí, cheathrú, dheich, mhíle, chúig, dhara
- PART: Mhic, Mhac
- PRON: shin, fhéin, thú, cheachtar, shoin, thusa
- PROPN: Bhaile, Ghaeltacht, Chomhairle, Ghaeilge, Ghaeltachta, Chathair, Mháire, Chiarraí, Dhún, Choiste
- SCONJ: dhá
- VERB: bhí, bheidh, thug, tháinig, chuir, bhaineann, bheadh, bhíonn, bhíodh, chuaigh
- VF
- AUX-Cop: b', gurb, gurbh, níorbh, ab, arbh, b’, nárbh, arb, darbh
- PART: ab, b'
- PART-Cop: b'
- PRON-Cop: cérbh
- SCONJ-Cop: arb, murab
- Direct
- NounType
- NotSlender
- ADJ: éagsúla, nua, áirithe, poiblí, beaga, óga, náisiúnta, móra, idirnáisiúnta, áitiúla
- Slender
- ADJ: áitiúla, éagsúla, náisiúnta, nua, Eorpacha, phoiblí, speisialta, chruthaitheacha, Éireannacha, áirithe
- Strong
- ADJ: réigiúnacha, éagsúla, Slachtmhara, beaga, móra, nua-aimseartha, náisiúnta, áirithe, míosúla, nua
- NOUN: daoine, gnóthaí, seirbhísí, páistí, ndaoine, acmhainní, leanaí, bhforálacha, mbailte, scéalta
- PROPN: Cúirteanna, Brioscaí, Dhoirí, Feabhra, Foundation, Fíoncheannaithe, Ghaeltachtaí, Gníomhartha, Leanaí, Saoirsí
- Weak
- ADJ: Eorpach, áitiúil, poiblí, domhanda, díomhaoin, sóisialta, Éireannach, áirithe, Cúng, Feirsteach
- NOUN: ealaíon, clár, mballstát, ábhar, gComhphobal, gceantar, leabhar, n-ealaíon, n-oileán, pobal
- PROPN: cliath, nGall, Gael, Árann, Tionóntán, Ealaíon, nUachtarán, Ardeaspag, Chlann, Chumann
- NotSlender
- PartType
- Ad
- PART: go, le
- Cmpl
- PART: go, nach, nár, ná
- Comp
- PART: níos, ní, ba, ab, b', is
- PART-Cop: b'
- Cop
- PART: a
- Deg
- PART: a, dá
- Inf
- PART: a, do, d'
- Num
- PART: a
- Pat
- PART: ó, mac, Uí, de, Ní, Nic, O', Mhic, O, Mag
- Sup
- PART: is, ba, ab, b', nach
- PART-Cop: ba, b'
- Vb
- PART: a, d', ní, an, gur, d’, nach, níor, do, ar
- Voc
- PART: a
- Ad
- PrepForm
- Cmpd
- ADP: i, ar, de, le, go, tar, in, os, faoi, thar
- NOUN: réir, éis, dtí, fud, linn, haghaidh, feadh, rith, nós, measc
- Cmpd
- Typo
- Yes
- ADJ: neamhspléach, teanta, Aitiúil, Tradisiúnta, aiteanta, am-tábhachtach, amhain, amáin, ardchaighdéanach, bréatha
- ADJ-Part: teanta, deághléasta
- ADP: o, a', dho, dó, an, arna, dí, ós
- ADV: anoirthear, isteacht, sios
- CCONJ: no
- DET: siud, un, á
- NOUN: reachtáil, deileáil, diospóidí, gniomhú, oidreachta, sharú, taibléidí, vóltas, éadochas, Chlarú
- NOUN-Inf: reachtáil, deileáil, sharú, chailliúnt, choimead, chose, chulghairm, cábhrú, cóilíniú, dhreachtadh
- NOUN-Vnoun: gniomhú, breathú
- NUM: dha, triú
- PART: DA
- PRON: me, fein, said, se
- PROPN: Gaidhlig, Leamhchán, Chiarain, Fein, Gaeltacha, Gearmaine, Kila, Meiricea, Mhuscraí, Mona
- VERB: féadfidh, eireos, Bailimid, Duradh, ata, athfoilsítear, chineann, chur, deileáiltear, dheánann
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: is.
- This corpus does not contain auxiliaries.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (39)
- VERB--NOUN-ADP(do) (1)
- VERB--NOUN-Gen (4)
- VERB--NOUN-Nom (3037)
- VERB--NOUN-Nom-ADP(ar) (2)
- VERB--NOUN-Nom-ADP(de) (2)
- VERB--NOUN-Nom-ADP(do) (2)
- VERB--NOUN-Nom-ADP(le) (1)
- VERB--NOUN-Nom-ADP(os) (7)
- VERB--PRON (1496)
- obj
- VERB--NOUN (24)
- VERB--NOUN-Gen (2)
- VERB--NOUN-Gen-ADP(chun) (1)
- VERB--NOUN-Nom (1939)
- VERB--NOUN-Nom-ADP(as) (2)
- VERB--NOUN-Nom-ADP(do) (1)
- VERB--NOUN-Nom-ADP(gan) (1)
- VERB--NOUN-Nom-ADP(le) (1)
- VERB--NOUN-Nom-ADP(os) (1)
- VERB--NOUN-Nom-ADP(um) (1)
- VERB--PRON (265)
Relations Overview
- This corpus uses 13 relation subtypes: acl:relcl, case:voc, compound:prt, csubj:cleft, csubj:cop, flat:foreign, flat:name, mark:prt, nmod:poss, nsubj:outer, obl:prep, obl:tmod, xcomp:pred
- The following 1 main types are not used alone, they are always subtyped: csubj
- The following 6 relation types are not used in this corpus at all: iobj, expl, aux, clf, reparandum, dep