X

home ga/pos edit page issue tracker

`X`: other

Description

The tag X is used for words that for some reason cannot be assigned a real part-of-speech category.

Foreign words (see Foreign) are also tagged X.

Examples

Beidh an-weekend againn “We will have a great weekend”
Tá AIE mar thaca “AIE is a support”

Treebank Statistics (UD_Irish)

There are 151 X lemmas (4%), 152 X types (3%) and 265 X tokens (1%). Out of 16 observed tags, the rank of X is: 5 in number of lemmas, 7 in number of types and 14 in number of tokens.

The 10 most frequent X lemmas: sin, (2), (a), (b), seo, (1), (c), (3), (4), Co.

The 10 most frequent X types: san, (2), (a), (b), so, (1), (c), (3), (4), Co.

The 10 most frequent ambiguous lemmas: sin (PRON 109, DET 106, X 16, VERB 2), (2) (X 12, NUM 1), seo (DET 114, PRON 26, X 10, VERB 4), (1) (X 9, NUM 2), (3) (X 5, NUM 1), (4) (X 5, NUM 1), a (PART 864, DET 182, X 4, ADP 1), dein (X 5, VERB 1), faoi (ADP 106, X 3, PART 1), fás (VERB 4, X 2, NOUN 1)

The 10 most frequent ambiguous types: san (ADP 45, X 16, PRON 4), (2) (X 12, NUM 1), (1) (X 9, NUM 2), (3) (X 5, NUM 1), (4) (X 5, NUM 1), a (PART 855, DET 187, X 1, ADP 1), chan (X 3, VERB 1), dhein (X 2, VERB 1), (5) (NUM 1, X 1), I (ADP 18, X 1)

san
- ADP 45: Bhí gach uile mhac máthar san áit ag bualadh bos .
- X 16: Níor dhúisigh san é .
- PRON 4: As san go_dtí Fromista , áit a bhfuil séipéal álainn ón 11ú céad sa stíl Rómhánach .
(2)
- X 12: (2) Faoi réir fho-alt (3) den alt seo , is iad a bheidh ar an mBuanchoiste Eolaíochta cibé líon comhaltaí is cuí leis an gCoimisiún agus féadfar daoine nach comhaltaí den Choimisiún a áireamh ar a chomhaltaí .
- NUM 1: (2) Féadfidh cigire gach clár atá á chimeád do réir an ailt seo do scrúdú aon uair le_linn tráthanna oifige chun aon chríche eireos as an Acht so no as aon rialachán a déanfar fé no a eireos de_bharr ceachtar acu agus , ar a iarraidh sin don chigire , beidh sé de dhualgas ar únaer chláruithe an áitreibh ina bhfuil an clár san á chimeád an clár san do thaisbeáint , chun go scrúdóidh an cigire sin é , agus fós gach billín , nóta consighneachta , admháil , agus scríbhinn eile ( ar a n-áirítear cóipeanna dhíobh i gcás gan iad féin a bheith ar fáil ) a iarrfidh an cigire sin go réasúnta chun féachaint an fíor aon iontráil áirithe sa chlár san no cad fé ndeár éinní áirithe d’ fhágaint amach as .
(1)
- X 9: ( 3B ) Ní bheidh feidhm ag fo-alt (1) maidir_le comaoin a fuarthas i leith diúscartha iomchuí arna cur i gcrích le hordú a rinneadh faoi alt 28 (1) den Acht um Údarás Forbartha Dugthailte Bhaile Átha_Cliath , 1997 .
- NUM 2: (3) Faoi réir fho-alt (5) , más rud é - (a) go bhfuil aon liúntas nó liúntais faoi Chaibidil 1 de Chuid 9 le tabhairt do bhliain mheasúnachta do phearsa aonair , ar pearsa aonair é nó í is comhpháirtí i dtrádáil chomhpháirtíochta , i leith caiteachais chaipitiúil arna thabhú an 3ú lá de Nollaig , 1997 , nó dá éis , ar fhoirgneamh sonraithe , agus (b) go bhfuil an liúntas nó na liúntais sin le tabhairt le_linn trádáil leithleach na pearsan aonair a bheith á cur faoi cháin , ansin , mura rud é , sa bhonntréimhse don bhliain mheasúnachta ar ina leith atá an liúntas nó na liúntais sin le tabhairt , gur comhpháirtí gníomhach i ndáil leis an trádáil chomhpháirtíochta an phearsa aonair , ní mó méid aon liúntais nó liúntas den sórt sin a bheidh le cur i gcuntas chun críocha alt 392 (1) ná méid a chinnfear de_réir na foirmle A plus IRP25,000 i gcás gurb é A méid bhrabúis nó ghnóchain thrádáil leithleach na pearsan aonair sa bhliain chaillteanais sula gcuirtear alt 392 (1) i bhfeidhm .
(3)
- X 5: (3) Is saoránach Éireannach óna bhreith no óna breith duine a bheirtear in oileán na hÉireann mura bhfuil sé nó sí i dteideal saoránacht aon tíre eile a bheith aige nó aici .
- NUM 1: (3) Faoi réir fho-alt (5) , más rud é - (a) go bhfuil aon liúntas nó liúntais faoi Chaibidil 1 de Chuid 9 le tabhairt do bhliain mheasúnachta do phearsa aonair , ar pearsa aonair é nó í is comhpháirtí i dtrádáil chomhpháirtíochta , i leith caiteachais chaipitiúil arna thabhú an 3ú lá de Nollaig , 1997 , nó dá éis , ar fhoirgneamh sonraithe , agus (b) go bhfuil an liúntas nó na liúntais sin le tabhairt le_linn trádáil leithleach na pearsan aonair a bheith á cur faoi cháin , ansin , mura rud é , sa bhonntréimhse don bhliain mheasúnachta ar ina leith atá an liúntas nó na liúntais sin le tabhairt , gur comhpháirtí gníomhach i ndáil leis an trádáil chomhpháirtíochta an phearsa aonair , ní mó méid aon liúntais nó liúntas den sórt sin a bheidh le cur i gcuntas chun críocha alt 392 (1) ná méid a chinnfear de_réir na foirmle A plus IRP25,000 i gcás gurb é A méid bhrabúis nó ghnóchain thrádáil leithleach na pearsan aonair sa bhliain chaillteanais sula gcuirtear alt 392 (1) i bhfeidhm .
(4)
- X 5: (4) Maidir_le hordú atá i bhfeidhm faoi fho-alt (2) - (a) más rud é gur faoi fho-alt (2) (a) a rinneadh é , is fianaise é gur Stát Conarthach aon stát lena mbaineann an dearbhú , agus (b) más rud é gur faoi fho-alt (2) (b) a rinneadh é , is fianaise é go ndearnadh an dearbhú de bhun Airteagal IV nó gur cuireadh an scéala in iúl de bhun Airteagal VI agus is fianaise é ar a bhfuil ann .
- NUM 1: (4) Aon áireamhacht iomlán go mbeidh ráiteas ina teanta á rá gur hiarradh agus gur deonadh paitinn Bhriotáineach don chumadóireacht a héilítear san áireamhacht , beidh ina teanta cóip dheimhnithe den áireamhacht iomláin , gur dá druim a deonadh an phaitinn Bhriotáineach san , agus fós an cruthúnas orduithe gur ghlac Comptroller-General Oifig na bPaitinneacha i Lundain leis an áireamhacht deiridh sin a luaidhtear .
a
- PART 855: Seo an fear a chonaic an bhean .
- DET 187: Fágann Mícheál na daltaí crom os_cionn a gcuid foghlama .
- X 1: Sa Deibhí bíonn seacht siolla sa líne freisin , ach bíonn siolla sa bhreis i bhfocal deireanach b ar a , agus in d ar c .
- ADP 1: ’ Anonn leis de chéim mhall go_dtí an bord gur thosaigh a chaint , agus an uile fhocal uaidh ag fuaimniú go glé ar an aer .
chan
- X 3: Déantar chan di roimh ghutaí nó f plus guta ag tús focail : cha chuireann / chuireadh / chuirfeadh sé chan fhágann / fhágadh / fhágfadh sé chan ólann / óladh / ólfadh sé .
- VERB 1: ’ File cumasach eile ab ea Dónall Ó Muláin , údar an amhráin úd ‘ An Poc ar Buile ‘ , amhrán go raibh báidh an phobail leis , agus amhrán a chan Gaeilgeoirí le fuinneamh , le scléip agus le gliondar ní hamháin ar fuaid na hÉireann , ach go deimhin ar fuaid an domhain .
dhein
- X 2: Tar_éis dó bogadh go Meiriceá dhein sé an-chuid staidéir agus taighde ar cheol na nGael thall agus bhain sé amach Ph.D .
- VERB 1: An gcuirfeadh sé as dóibh gur tréigeadh an pholasaí neodrachta an gníomh deiridh a dhein siad .
(5)
- NUM 1: (3) Faoi réir fho-alt (5) , más rud é - (a) go bhfuil aon liúntas nó liúntais faoi Chaibidil 1 de Chuid 9 le tabhairt do bhliain mheasúnachta do phearsa aonair , ar pearsa aonair é nó í is comhpháirtí i dtrádáil chomhpháirtíochta , i leith caiteachais chaipitiúil arna thabhú an 3ú lá de Nollaig , 1997 , nó dá éis , ar fhoirgneamh sonraithe , agus (b) go bhfuil an liúntas nó na liúntais sin le tabhairt le_linn trádáil leithleach na pearsan aonair a bheith á cur faoi cháin , ansin , mura rud é , sa bhonntréimhse don bhliain mheasúnachta ar ina leith atá an liúntas nó na liúntais sin le tabhairt , gur comhpháirtí gníomhach i ndáil leis an trádáil chomhpháirtíochta an phearsa aonair , ní mó méid aon liúntais nó liúntas den sórt sin a bheidh le cur i gcuntas chun críocha alt 392 (1) ná méid a chinnfear de_réir na foirmle A plus IRP25,000 i gcás gurb é A méid bhrabúis nó ghnóchain thrádáil leithleach na pearsan aonair sa bhliain chaillteanais sula gcuirtear alt 392 (1) i bhfeidhm .
- X 1: (5) Beidh cóip a thugann le tuisgint gur cóip í do clóbhuaileadh agus do foillsíodh ag an gComhairle no don Chomhairle fén alt so den chlár de dhochtúirí leighis a bheidh de thurus na huaire ar an gclár de dhochtúirí leighis is déanaí do clóbhuaileadh agus do foillsíodh amhlaidh , beidh an chóip sin ina fianaise in aon chúirt , go_dtí go gcruthófar a mhalairt , ar gach éinne go bhfuil a ainm iontrálta sa chlár san de dhochtúirí leighis do bheith cláruithe sa chlár fén Acht so agus dá réir agus ar éinne ná fuil a ainm iontrálta sa chlár san de dhochtúirí leighis do bheith gan bheith cláruithe amhlaidh .
I
- ADP 18: I nDáil na bhFlaitheas go raibh sé .
- X 1: An teideal atá air ná ‘ Kill me , I Love You !

Morphology

The form / lemma ratio of X is 1.006623 (the average of all parts of speech is 1.449988).

The 1st highest number of forms (3) was observed with the lemma “dein”: dein, deineadh, dhein.

The 2nd highest number of forms (1) was observed with the lemma “(1)”: (1).

The 3rd highest number of forms (1) was observed with the lemma “(11)”: (11).

X occurs with 14 features: ga-feat/Dialect (49; 18% instances), ga-feat/PronType (27; 10% instances), ga-feat/Number (10; 4% instances), ga-feat/Negative (8; 3% instances), ga-feat/Person (8; 3% instances), ga-feat/Mood (7; 3% instances), ga-feat/PartType (6; 2% instances), ga-feat/Gender (5; 2% instances), ga-feat/Tense (5; 2% instances), ga-feat/Form (4; 2% instances), ga-feat/Case (2; 1% instances), ga-feat/Definite (1; 0% instances), ga-feat/VerbForm (1; 0% instances), ga-feat/Voice (1; 0% instances)

X occurs with 23 feature-value pairs: Case=Com, Definite=Def, Dialect=Connaught, Dialect=Munster, Dialect=Ulster, Form=Emph, Form=Len, Gender=Fem, Gender=Masc, Mood=Imp, Mood=Ind, Negative=Neg, Number=Sing, PartType=Vb, Person=1, Person=2, Person=3, PronType=Dem, PronType=Rel, Tense=Past, Tense=Pres, VerbForm=Cop, Voice=Auto

X occurs with 17 feature combinations. The most frequent feature combination is _ (214 tokens). Examples: (2), (a), (b), (1), (c), (3), (4), Co., a, Uimh.

Relations

X nodes are attached to their parents using 21 different relations: ga-dep/nummod (81; 31% instances), ga-dep/nmod (34; 13% instances), ga-dep/compound (31; 12% instances), ga-dep/det (25; 9% instances), ga-dep/foreign (17; 6% instances), ga-dep/nsubj (10; 4% instances), ga-dep/root (10; 4% instances), ga-dep/list (9; 3% instances), ga-dep/conj (8; 3% instances), ga-dep/dobj (7; 3% instances), ga-dep/appos (6; 2% instances), ga-dep/amod (4; 2% instances), ga-dep/case (4; 2% instances), ga-dep/ccomp (4; 2% instances), ga-dep/mark:prt (4; 2% instances), ga-dep/name (4; 2% instances), ga-dep/advmod (2; 1% instances), ga-dep/xcomp:pred (2; 1% instances), ga-dep/acl:relcl (1; 0% instances), ga-dep/parataxis (1; 0% instances), ga-dep/punct (1; 0% instances)

Parents of X nodes belong to 11 different parts of speech: NOUN (139; 52% instances), VERB (55; 21% instances), X (21; 8% instances), ADJ (13; 5% instances), PROPN (10; 4% instances), ROOT (10; 4% instances), NUM (6; 2% instances), ADP (5; 2% instances), PRON (4; 2% instances), CONJ (1; 0% instances), SCONJ (1; 0% instances)

146 (55%) X nodes are leaves.

54 (20%) X nodes have one child.

36 (14%) X nodes have two children.

29 (11%) X nodes have three or more children.

The highest child degree of a X node is 8.

Children of X nodes are attached using 25 different relations: ga-dep/punct (75; 32% instances), ga-dep/case (26; 11% instances), ga-dep/nmod (16; 7% instances), ga-dep/nummod (14; 6% instances), ga-dep/compound (13; 6% instances), ga-dep/conj (12; 5% instances), ga-dep/det (12; 5% instances), ga-dep/appos (11; 5% instances), ga-dep/cc (9; 4% instances), ga-dep/dobj (7; 3% instances), ga-dep/amod (6; 3% instances), ga-dep/foreign (5; 2% instances), ga-dep/nsubj (5; 2% instances), ga-dep/xcomp (5; 2% instances), ga-dep/name (3; 1% instances), ga-dep/acl:relcl (2; 1% instances), ga-dep/advcl (2; 1% instances), ga-dep/advmod (2; 1% instances), ga-dep/csubj:cleft (2; 1% instances), ga-dep/mark:prt (2; 1% instances), ga-dep/neg (2; 1% instances), ga-dep/nmod:prep (2; 1% instances), ga-dep/cop (1; 0% instances), ga-dep/mark (1; 0% instances), ga-dep/xcomp:pred (1; 0% instances)

Children of X nodes belong to 14 different parts of speech: PUNCT (75; 32% instances), NOUN (42; 18% instances), ADP (28; 12% instances), X (21; 9% instances), NUM (16; 7% instances), DET (12; 5% instances), CONJ (10; 4% instances), PROPN (9; 4% instances), VERB (9; 4% instances), ADJ (5; 2% instances), PART (5; 2% instances), PRON (2; 1% instances), ADV (1; 0% instances), SCONJ (1; 0% instances)