NUM

home ga/pos edit page issue tracker

`NUM`: numeral

Description

A numeral is a word, functioning most typically as a determiner, adjective or pronoun, that expresses a number and a relation to the number, such as quantity, sequence, frequency or fraction.

Irish numbers are split into three categories: cardinal, ordinal and personal. The personal form is used for counting people. All three forms differ in spelling.

Examples

22 Meitheamh “22nd June”
1920
ocht mbliana “eight years”
a hocht a chlog “8 o’clock”
11ú céad “11th century”
a haon “one” (counting)
duine amháin “one person”
dhá theanga “two languages”
beirt duine “two people”
an dara huair “the second time”
cuig ghlúin “five generations”
cúigear “five people”
cúigear fear “five men”

Treebank Statistics (UD_Irish)

There are 146 NUM lemmas (4%), 167 NUM types (3%) and 321 NUM tokens (1%). Out of 16 observed tags, the rank of NUM is: 6 in number of lemmas, 6 in number of types and 13 in number of tokens.

The 10 most frequent NUM lemmas: dó, céad, trí, ceathair, seacht, aon, 1, sé, 1997, dara

The 10 most frequent NUM types: dhá, chéad, trí, céad, seacht, dá, 1, 1997, aon, ceithre

The 10 most frequent ambiguous lemmas: dó (NUM 44, NOUN 1), céad (NUM 31, NOUN 6), trí (ADP 33, NUM 19), aon (DET 73, NUM 8, NOUN 2), sé (PRON 218, NUM 6, VERB 1), fiche (NUM 5, NOUN 1), (1) (X 9, NUM 2), (2) (X 12, NUM 1), (3) (X 5, NUM 1), (4) (X 5, NUM 1)

The 10 most frequent ambiguous types: dhá (NUM 30, ADP 4), trí (ADP 17, NUM 14), céad (NUM 9, NOUN 3), dá (ADP 32, SCONJ 13, NUM 8, CONJ 1), aon (DET 67, NUM 5, NOUN 2), fiche (NUM 5, NOUN 1), sé (PRON 218, NUM 4), gcéad (NUM 4, NOUN 2), haon (NUM 2, DET 2), (1) (X 9, NUM 2)

dhá
- NUM 30: Ar dhá chúis ar a laghad .
- ADP 4: Cuireann sé iontas , fosta , i súile ‘ dearbhdhúinte ‘ an choirp ( 137 ) , a bhí ‘ mar bheadh sí dhá coinneáil dúinte le foréigean ‘ ( 142 ) .
trí
- ADP 17: ’ Má chaitheann sé an lá inniu tá seans aige , tá sé ag dul trí fhaothú ‘ a déarfadh duine .
- NUM 14: Tar_éis trí lá tháinig sé abhaile .
céad
- NUM 9: Bíonn suas le céad cineál éagsúil aimsire agus feiniméan aimsire san áireamh ag meitéareolaithe , ón gceobhrán go_dtí tornádónna .
- NOUN 3: As san go_dtí Fromista , áit a bhfuil séipéal álainn ón 11ú céad sa stíl Rómhánach .
dá
- ADP 32: D’ fhoilsigh Ó Cléirigh aistriúchán Breatnaise ar chuid dá shaothar .
- SCONJ 13: Tá chuile rud dá bhfuil le rá ráite a’m .
- NUM 8: Ba é Seán a d’ íoc as an dá thicéad , ticéid aisteacha , a shíl mé .
- CONJ 1: Airteagal 23 Oibríochtaí eachtracha Féadfaidh BCE agus bainc cheannais náisiúnta : - caidreamh a bhunú le bainc cheannais agus le hinstitiúidí airgeadais i dtíortha eile agus , más iomchuí , le heagraíochtaí idirnáisiúnta ; - gach saghas sócmhainní airgid eachtraigh agus miotal lómhar a fháil agus a dhíol trí spotbheart agus réamhdhéileáil ; cuimseoidh an abairt ‘ sócmhainn airgid eachtraigh ‘ urrúis agus gach sócmhainn eile in airgeadra aon tíre nó in aonaid chuntais , is cuma cén fhoirm ina sealbhaítear iad ; - na sócmhainní dá dtagraítear san Airteagal seo a shealbhú agus a bhainisteoireacht ; - gach saghas idirbheart baincéireachta a sheoladh i ndáil le tríú tíortha agus le heagraíochtaí idirnáisiúnta lena n-áirítear oibríochtaí chun iasachtaí a fháil agus a thabhairt .
aon
- DET 67: Ar fhéachaint a bheadh fhios é , ar aon nós !
- NUM 5: ( 1A ) Aon duine a sháróidh , gan leithscéal réasúnach , aon rialachán arna dhéanamh faoin alt seo , féadfaidh an Bord aon chead gealltóireachta cúrsa a bheidh deonaithe dó a fhionraí nó a chulghairm .
- NOUN 2: Tá Bealach a’ Choin Ghlais , an caolas idir Lunga agus Sgarba ag dul thart le Eilean a’ Bhealaich chomh contúirteach le Coire Bhreacháin atá idir Sgarba agus Eilean Diùra an áit a raibh an sgríobhnóir George Orwell fá aon do bheith báite .
fiche
- NUM 5: Bhí an-easpa cailíní agus ban idir dhá bhliain déag agus fiche bliain d’ aois .
- NOUN 1: (4) Gach rialachán a déanfar fén alt so leagfar é fé bhráid gach Tighe den Oireachtas chó luath agus is féidir é tar_éis a dhéanta agus má dhineann aon Tigh acu san laistigh den lá is fiche a shuidhfidh an Tigh sin ina dhiaidh sin rún do rith ag cur an rialacháin sin ar nea-mbrí beidh an rialachán san ar nea-mbrí dá réir sin ach beidh san gan dochar do dhleathacht éinní a dineadh roimhe sin fén rialachán san .
sé
- PRON 218: Níor tháinig sé go fóill .
- NUM 4: Bhí Caitríona sé bliana d’ aois .
gcéad
- NUM 4: Ar an gcéad dul síos , tá an Rialtas páirteach ann .
- NOUN 2: Thug an tionscnamh seo deis do dhaoine nach ndearna scannán riamh cheana a gcéad scannán a dhéanamh .
haon
- NUM 2: ’ Ní haon droch-chuimhneamh é sin , ‘ arsa an fear eile agus do stop sé chun a scíth a ligean ar_feadh tamaill .
- DET 2: (6) Ní bheidh aon táillí ionfhálta san Oifig maidir_le haon phaitinn den tsórt a luaidhtear san alt so mara ndintar ná go_dtí go ndéanfar cóipeanna deimhnithe de sna hiontrála sa chlár Bhriotáineach a bhaineann leis an bpaitinn do thabhairt don cheannasaí chun a gcláruithe agus cóip den áireamhacht iomláin ar ar deonadh an phaitinn Bhriotáineach do lóisteáil leis an gceannasaí ach má dintar teip i lóisteáil na gcóipeanna san ní shaorfidh an teip sin an t-iarratasóir o oblagáid íoctha aon táillí ná o n-a dtiocfadh de_dheascaibh a neamh-íoctha .
(1)
- X 9: ( 3B ) Ní bheidh feidhm ag fo-alt (1) maidir_le comaoin a fuarthas i leith diúscartha iomchuí arna cur i gcrích le hordú a rinneadh faoi alt 28 (1) den Acht um Údarás Forbartha Dugthailte Bhaile Átha_Cliath , 1997 .
- NUM 2: (3) Faoi réir fho-alt (5) , más rud é - (a) go bhfuil aon liúntas nó liúntais faoi Chaibidil 1 de Chuid 9 le tabhairt do bhliain mheasúnachta do phearsa aonair , ar pearsa aonair é nó í is comhpháirtí i dtrádáil chomhpháirtíochta , i leith caiteachais chaipitiúil arna thabhú an 3ú lá de Nollaig , 1997 , nó dá éis , ar fhoirgneamh sonraithe , agus (b) go bhfuil an liúntas nó na liúntais sin le tabhairt le_linn trádáil leithleach na pearsan aonair a bheith á cur faoi cháin , ansin , mura rud é , sa bhonntréimhse don bhliain mheasúnachta ar ina leith atá an liúntas nó na liúntais sin le tabhairt , gur comhpháirtí gníomhach i ndáil leis an trádáil chomhpháirtíochta an phearsa aonair , ní mó méid aon liúntais nó liúntas den sórt sin a bheidh le cur i gcuntas chun críocha alt 392 (1) ná méid a chinnfear de_réir na foirmle A plus IRP25,000 i gcás gurb é A méid bhrabúis nó ghnóchain thrádáil leithleach na pearsan aonair sa bhliain chaillteanais sula gcuirtear alt 392 (1) i bhfeidhm .

Morphology

The form / lemma ratio of NUM is 1.143836 (the average of all parts of speech is 1.449988).

The 1st highest number of forms (5) was observed with the lemma “dó”: dha, dhá, dhó, dá, dó.

The 2nd highest number of forms (4) was observed with the lemma “ceathair”: ceithre, cheathrú, cheithre, gceithre.

The 3rd highest number of forms (4) was observed with the lemma “trí”: dtríú, thrí, thríú, trí.

NUM occurs with 3 features: NumType (164; 51% instances), ga-feat/Form (40; 12% instances), Definite (9; 3% instances)

NUM occurs with 6 feature-value pairs: Definite=Def, Form=Ecl, Form=HPref, Form=Len, NumType=Card, NumType=Ord

NUM occurs with 9 feature combinations. The most frequent feature combination is _ (157 tokens). Examples: 1, 1997, 1992, 2, 3, 4, (1), 11, 1965, 1980

Relations

NUM nodes are attached to their parents using 11 different relations: nummod (269; 84% instances), nmod (25; 8% instances), conj (16; 5% instances), nsubj (3; 1% instances), dobj (2; 1% instances), advmod (1; 0% instances), appos (1; 0% instances), case (1; 0% instances), compound (1; 0% instances), det (1; 0% instances), root (1; 0% instances)

Parents of NUM nodes belong to 10 different parts of speech: NOUN (247; 77% instances), VERB (22; 7% instances), X (16; 5% instances), NUM (15; 5% instances), PROPN (10; 3% instances), ADP (6; 2% instances), ADJ (2; 1% instances), ADV (1; 0% instances), CONJ (1; 0% instances), ROOT (1; 0% instances)

240 (75%) NUM nodes are leaves.

49 (15%) NUM nodes have one child.

17 (5%) NUM nodes have two children.

15 (5%) NUM nodes have three or more children.

The highest child degree of a NUM node is 7.

Children of NUM nodes are attached using 12 different relations: punct (41; 30% instances), case (24; 18% instances), nmod (21; 15% instances), conj (11; 8% instances), mark:prt (10; 7% instances), ga-dep/cc (8; 6% instances), det (7; 5% instances), nummod (7; 5% instances), advmod (3; 2% instances), compound (2; 1% instances), mark (1; 1% instances), nmod:prep (1; 1% instances)

Children of NUM nodes belong to 10 different parts of speech: PUNCT (41; 30% instances), ADP (26; 19% instances), NOUN (19; 14% instances), NUM (15; 11% instances), CONJ (9; 7% instances), PART (9; 7% instances), DET (7; 5% instances), X (6; 4% instances), ADV (3; 2% instances), PROPN (1; 1% instances)