X
: other
Description
The tag X is used for words that for some reason cannot be assigned a real part-of-speech category.
Foreign words (see Foreign) are also tagged X.
Examples
- Beidh an-weekend againn “We will have a great weekend”
- Tá AIE mar thaca “AIE is a support”
Treebank Statistics (UD_Irish)
There are 151 X
lemmas (4%), 152 X
types (3%) and 265 X
tokens (1%).
Out of 16 observed tags, the rank of X
is: 5 in number of lemmas, 7 in number of types and 14 in number of tokens.
The 10 most frequent X
lemmas: sin, (2), (a), (b), seo, (1), (c), (3), (4), Co.
The 10 most frequent X
types: san, (2), (a), (b), so, (1), (c), (3), (4), Co.
The 10 most frequent ambiguous lemmas: sin (PRON 109, DET 106, X 16, VERB 2), (2) (X 12, NUM 1), seo (DET 114, PRON 26, X 10, VERB 4), (1) (X 9, NUM 2), (3) (X 5, NUM 1), (4) (X 5, NUM 1), a (PART 864, DET 182, X 4, ADP 1), dein (X 5, VERB 1), faoi (ADP 106, X 3, PART 1), fás (VERB 4, X 2, NOUN 1)
The 10 most frequent ambiguous types: san (ADP 45, X 16, PRON 4), (2) (X 12, NUM 1), (1) (X 9, NUM 2), (3) (X 5, NUM 1), (4) (X 5, NUM 1), a (PART 855, DET 187, X 1, ADP 1), chan (X 3, VERB 1), dhein (X 2, VERB 1), (5) (X 1, NUM 1), I (ADP 18, X 1)
- san
- (2)
- X 12: (2) Faoi réir fho-alt (3) den alt seo , is iad a bheidh ar an mBuanchoiste Eolaíochta cibé líon comhaltaí is cuí leis an gCoimisiún agus féadfar daoine nach comhaltaí den Choimisiún a áireamh ar a chomhaltaí .
- NUM 1: (2) Féadfidh cigire gach clár atá á chimeád do réir an ailt seo do scrúdú aon uair le_linn tráthanna oifige chun aon chríche eireos as an Acht so no as aon rialachán a déanfar fé no a eireos de_bharr ceachtar acu agus , ar a iarraidh sin don chigire , beidh sé de dhualgas ar únaer chláruithe an áitreibh ina bhfuil an clár san á chimeád an clár san do thaisbeáint , chun go scrúdóidh an cigire sin é , agus fós gach billín , nóta consighneachta , admháil , agus scríbhinn eile ( ar a n-áirítear cóipeanna dhíobh i gcás gan iad féin a bheith ar fáil ) a iarrfidh an cigire sin go réasúnta chun féachaint an fíor aon iontráil áirithe sa chlár san no cad fé ndeár éinní áirithe d’ fhágaint amach as .
- (1)
- X 9: ( 3B ) Ní bheidh feidhm ag fo-alt (1) maidir_le comaoin a fuarthas i leith diúscartha iomchuí arna cur i gcrích le hordú a rinneadh faoi alt 28 (1) den Acht um Údarás Forbartha Dugthailte Bhaile Átha_Cliath , 1997 .
- NUM 2: (3) Faoi réir fho-alt (5) , más rud é - (a) go bhfuil aon liúntas nó liúntais faoi Chaibidil 1 de Chuid 9 le tabhairt do bhliain mheasúnachta do phearsa aonair , ar pearsa aonair é nó í is comhpháirtí i dtrádáil chomhpháirtíochta , i leith caiteachais chaipitiúil arna thabhú an 3ú lá de Nollaig , 1997 , nó dá éis , ar fhoirgneamh sonraithe , agus (b) go bhfuil an liúntas nó na liúntais sin le tabhairt le_linn trádáil leithleach na pearsan aonair a bheith á cur faoi cháin , ansin , mura rud é , sa bhonntréimhse don bhliain mheasúnachta ar ina leith atá an liúntas nó na liúntais sin le tabhairt , gur comhpháirtí gníomhach i ndáil leis an trádáil chomhpháirtíochta an phearsa aonair , ní mó méid aon liúntais nó liúntas den sórt sin a bheidh le cur i gcuntas chun críocha alt 392 (1) ná méid a chinnfear de_réir na foirmle A plus IRP25,000 i gcás gurb é A méid bhrabúis nó ghnóchain thrádáil leithleach na pearsan aonair sa bhliain chaillteanais sula gcuirtear alt 392 (1) i bhfeidhm .
- (3)
- X 5: (3) Is saoránach Éireannach óna bhreith no óna breith duine a bheirtear in oileán na hÉireann mura bhfuil sé nó sí i dteideal saoránacht aon tíre eile a bheith aige nó aici .
- NUM 1: (3) Faoi réir fho-alt (5) , más rud é - (a) go bhfuil aon liúntas nó liúntais faoi Chaibidil 1 de Chuid 9 le tabhairt do bhliain mheasúnachta do phearsa aonair , ar pearsa aonair é nó í is comhpháirtí i dtrádáil chomhpháirtíochta , i leith caiteachais chaipitiúil arna thabhú an 3ú lá de Nollaig , 1997 , nó dá éis , ar fhoirgneamh sonraithe , agus (b) go bhfuil an liúntas nó na liúntais sin le tabhairt le_linn trádáil leithleach na pearsan aonair a bheith á cur faoi cháin , ansin , mura rud é , sa bhonntréimhse don bhliain mheasúnachta ar ina leith atá an liúntas nó na liúntais sin le tabhairt , gur comhpháirtí gníomhach i ndáil leis an trádáil chomhpháirtíochta an phearsa aonair , ní mó méid aon liúntais nó liúntas den sórt sin a bheidh le cur i gcuntas chun críocha alt 392 (1) ná méid a chinnfear de_réir na foirmle A plus IRP25,000 i gcás gurb é A méid bhrabúis nó ghnóchain thrádáil leithleach na pearsan aonair sa bhliain chaillteanais sula gcuirtear alt 392 (1) i bhfeidhm .
- (4)
- X 5: (4) Maidir_le hordú atá i bhfeidhm faoi fho-alt (2) - (a) más rud é gur faoi fho-alt (2) (a) a rinneadh é , is fianaise é gur Stát Conarthach aon stát lena mbaineann an dearbhú , agus (b) más rud é gur faoi fho-alt (2) (b) a rinneadh é , is fianaise é go ndearnadh an dearbhú de bhun Airteagal IV nó gur cuireadh an scéala in iúl de bhun Airteagal VI agus is fianaise é ar a bhfuil ann .
- NUM 1: (4) Aon áireamhacht iomlán go mbeidh ráiteas ina teanta á rá gur hiarradh agus gur deonadh paitinn Bhriotáineach don chumadóireacht a héilítear san áireamhacht , beidh ina teanta cóip dheimhnithe den áireamhacht iomláin , gur dá druim a deonadh an phaitinn Bhriotáineach san , agus fós an cruthúnas orduithe gur ghlac Comptroller-General Oifig na bPaitinneacha i Lundain leis an áireamhacht deiridh sin a luaidhtear .
- a
- PART 855: Seo an fear a chonaic an bhean .
- DET 187: Fágann Mícheál na daltaí crom os_cionn a gcuid foghlama .
- X 1: Sa Deibhí bíonn seacht siolla sa líne freisin , ach bíonn siolla sa bhreis i bhfocal deireanach b ar a , agus in d ar c .
- ADP 1: ’ Anonn leis de chéim mhall go_dtí an bord gur thosaigh a chaint , agus an uile fhocal uaidh ag fuaimniú go glé ar an aer .
- chan
- X 3: Déantar chan di roimh ghutaí nó f plus guta ag tús focail : cha chuireann / chuireadh / chuirfeadh sé chan fhágann / fhágadh / fhágfadh sé chan ólann / óladh / ólfadh sé .
- VERB 1: ’ File cumasach eile ab ea Dónall Ó Muláin , údar an amhráin úd ‘ An Poc ar Buile ‘ , amhrán go raibh báidh an phobail leis , agus amhrán a chan Gaeilgeoirí le fuinneamh , le scléip agus le gliondar ní hamháin ar fuaid na hÉireann , ach go deimhin ar fuaid an domhain .
- dhein
- (5)
- X 1: (5) Beidh cóip a thugann le tuisgint gur cóip í do clóbhuaileadh agus do foillsíodh ag an gComhairle no don Chomhairle fén alt so den chlár de dhochtúirí leighis a bheidh de thurus na huaire ar an gclár de dhochtúirí leighis is déanaí do clóbhuaileadh agus do foillsíodh amhlaidh , beidh an chóip sin ina fianaise in aon chúirt , go_dtí go gcruthófar a mhalairt , ar gach éinne go bhfuil a ainm iontrálta sa chlár san de dhochtúirí leighis do bheith cláruithe sa chlár fén Acht so agus dá réir agus ar éinne ná fuil a ainm iontrálta sa chlár san de dhochtúirí leighis do bheith gan bheith cláruithe amhlaidh .
- NUM 1: (3) Faoi réir fho-alt (5) , más rud é - (a) go bhfuil aon liúntas nó liúntais faoi Chaibidil 1 de Chuid 9 le tabhairt do bhliain mheasúnachta do phearsa aonair , ar pearsa aonair é nó í is comhpháirtí i dtrádáil chomhpháirtíochta , i leith caiteachais chaipitiúil arna thabhú an 3ú lá de Nollaig , 1997 , nó dá éis , ar fhoirgneamh sonraithe , agus (b) go bhfuil an liúntas nó na liúntais sin le tabhairt le_linn trádáil leithleach na pearsan aonair a bheith á cur faoi cháin , ansin , mura rud é , sa bhonntréimhse don bhliain mheasúnachta ar ina leith atá an liúntas nó na liúntais sin le tabhairt , gur comhpháirtí gníomhach i ndáil leis an trádáil chomhpháirtíochta an phearsa aonair , ní mó méid aon liúntais nó liúntas den sórt sin a bheidh le cur i gcuntas chun críocha alt 392 (1) ná méid a chinnfear de_réir na foirmle A plus IRP25,000 i gcás gurb é A méid bhrabúis nó ghnóchain thrádáil leithleach na pearsan aonair sa bhliain chaillteanais sula gcuirtear alt 392 (1) i bhfeidhm .
- I
Morphology
The form / lemma ratio of X
is 1.006623 (the average of all parts of speech is 1.449988).
The 1st highest number of forms (3) was observed with the lemma “dein”: dein, deineadh, dhein.
The 2nd highest number of forms (1) was observed with the lemma “(1)”: (1).
The 3rd highest number of forms (1) was observed with the lemma “(11)”: (11).
X
occurs with 14 features: ga-feat/Dialect (49; 18% instances), ga-feat/PronType (27; 10% instances), ga-feat/Number (10; 4% instances), ga-feat/Negative (8; 3% instances), ga-feat/Person (8; 3% instances), ga-feat/Mood (7; 3% instances), ga-feat/PartType (6; 2% instances), ga-feat/Gender (5; 2% instances), ga-feat/Tense (5; 2% instances), ga-feat/Form (4; 2% instances), ga-feat/Case (2; 1% instances), ga-feat/Definite (1; 0% instances), ga-feat/VerbForm (1; 0% instances), ga-feat/Voice (1; 0% instances)
X
occurs with 23 feature-value pairs: Case=Com
, Definite=Def
, Dialect=Connaught
, Dialect=Munster
, Dialect=Ulster
, Form=Emph
, Form=Len
, Gender=Fem
, Gender=Masc
, Mood=Imp
, Mood=Ind
, Negative=Neg
, Number=Sing
, PartType=Vb
, Person=1
, Person=2
, Person=3
, PronType=Dem
, PronType=Rel
, Tense=Past
, Tense=Pres
, VerbForm=Cop
, Voice=Auto
X
occurs with 17 feature combinations.
The most frequent feature combination is _
(214 tokens).
Examples: (2), (a), (b), (1), (c), (3), (4), Co., a, Uimh.
Relations
X
nodes are attached to their parents using 21 different relations: ga-dep/nummod (81; 31% instances), ga-dep/nmod (34; 13% instances), ga-dep/compound (31; 12% instances), ga-dep/det (25; 9% instances), ga-dep/foreign (17; 6% instances), ga-dep/nsubj (10; 4% instances), ga-dep/root (10; 4% instances), ga-dep/list (9; 3% instances), ga-dep/conj (8; 3% instances), ga-dep/dobj (7; 3% instances), ga-dep/appos (6; 2% instances), ga-dep/amod (4; 2% instances), ga-dep/case (4; 2% instances), ga-dep/ccomp (4; 2% instances), ga-dep/mark:prt (4; 2% instances), ga-dep/name (4; 2% instances), ga-dep/advmod (2; 1% instances), ga-dep/xcomp:pred (2; 1% instances), ga-dep/acl:relcl (1; 0% instances), ga-dep/parataxis (1; 0% instances), ga-dep/punct (1; 0% instances)
Parents of X
nodes belong to 11 different parts of speech: NOUN (139; 52% instances), VERB (55; 21% instances), X (21; 8% instances), ADJ (13; 5% instances), PROPN (10; 4% instances), ROOT (10; 4% instances), NUM (6; 2% instances), ADP (5; 2% instances), PRON (4; 2% instances), CONJ (1; 0% instances), SCONJ (1; 0% instances)
146 (55%) X
nodes are leaves.
54 (20%) X
nodes have one child.
36 (14%) X
nodes have two children.
29 (11%) X
nodes have three or more children.
The highest child degree of a X
node is 8.
Children of X
nodes are attached using 25 different relations: ga-dep/punct (75; 32% instances), ga-dep/case (26; 11% instances), ga-dep/nmod (16; 7% instances), ga-dep/nummod (14; 6% instances), ga-dep/compound (13; 6% instances), ga-dep/conj (12; 5% instances), ga-dep/det (12; 5% instances), ga-dep/appos (11; 5% instances), ga-dep/cc (9; 4% instances), ga-dep/dobj (7; 3% instances), ga-dep/amod (6; 3% instances), ga-dep/foreign (5; 2% instances), ga-dep/nsubj (5; 2% instances), ga-dep/xcomp (5; 2% instances), ga-dep/name (3; 1% instances), ga-dep/acl:relcl (2; 1% instances), ga-dep/advcl (2; 1% instances), ga-dep/advmod (2; 1% instances), ga-dep/csubj:cleft (2; 1% instances), ga-dep/mark:prt (2; 1% instances), ga-dep/neg (2; 1% instances), ga-dep/nmod:prep (2; 1% instances), ga-dep/cop (1; 0% instances), ga-dep/mark (1; 0% instances), ga-dep/xcomp:pred (1; 0% instances)
Children of X
nodes belong to 14 different parts of speech: PUNCT (75; 32% instances), NOUN (42; 18% instances), ADP (28; 12% instances), X (21; 9% instances), NUM (16; 7% instances), DET (12; 5% instances), CONJ (10; 4% instances), PROPN (9; 4% instances), VERB (9; 4% instances), ADJ (5; 2% instances), PART (5; 2% instances), PRON (2; 1% instances), ADV (1; 0% instances), SCONJ (1; 0% instances)
X in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]