NUM
: numeral
Description
A numeral is a word, functioning most typically as a determiner, adjective or pronoun, that expresses a number and a relation to the number, such as quantity, sequence, frequency or fraction.
Irish numbers are split into three categories: cardinal, ordinal and personal. The personal form is used for counting people. All three forms differ in spelling.
Examples
-
22 Meitheamh “22nd June”
-
1920
- ocht mbliana “eight years”
-
a hocht a chlog “8 o’clock”
-
11ú céad “11th century”
- a haon “one” (counting)
-
duine amháin “one person”
- dhá theanga “two languages”
- beirt duine “two people”
-
an dara huair “the second time”
- cuig ghlúin “five generations”
- cúigear “five people”
- cúigear fear “five men”
Treebank Statistics (UD_Irish)
There are 146 NUM
lemmas (4%), 167 NUM
types (3%) and 321 NUM
tokens (1%).
Out of 16 observed tags, the rank of NUM
is: 6 in number of lemmas, 6 in number of types and 13 in number of tokens.
The 10 most frequent NUM
lemmas: dó, céad, trí, ceathair, seacht, aon, 1, sé, 1997, dara
The 10 most frequent NUM
types: dhá, chéad, trí, céad, seacht, dá, 1, 1997, aon, ceithre
The 10 most frequent ambiguous lemmas: dó (NUM 44, NOUN 1), céad (NUM 31, NOUN 6), trí (ADP 33, NUM 19), aon (DET 73, NUM 8, NOUN 2), sé (PRON 218, NUM 6, VERB 1), fiche (NUM 5, NOUN 1), (1) (X 9, NUM 2), (2) (X 12, NUM 1), (3) (X 5, NUM 1), (4) (X 5, NUM 1)
The 10 most frequent ambiguous types: dhá (NUM 30, ADP 4), trí (ADP 17, NUM 14), céad (NUM 9, NOUN 3), dá (ADP 32, SCONJ 13, NUM 8, CONJ 1), aon (DET 67, NUM 5, NOUN 2), fiche (NUM 5, NOUN 1), sé (PRON 218, NUM 4), gcéad (NUM 4, NOUN 2), haon (NUM 2, DET 2), (1) (X 9, NUM 2)
- dhá
- trí
- céad
- dá
- ADP 32: D’ fhoilsigh Ó Cléirigh aistriúchán Breatnaise ar chuid dá shaothar .
- SCONJ 13: Tá chuile rud dá bhfuil le rá ráite a’m .
- NUM 8: Ba é Seán a d’ íoc as an dá thicéad , ticéid aisteacha , a shíl mé .
- CONJ 1: Airteagal 23 Oibríochtaí eachtracha Féadfaidh BCE agus bainc cheannais náisiúnta : - caidreamh a bhunú le bainc cheannais agus le hinstitiúidí airgeadais i dtíortha eile agus , más iomchuí , le heagraíochtaí idirnáisiúnta ; - gach saghas sócmhainní airgid eachtraigh agus miotal lómhar a fháil agus a dhíol trí spotbheart agus réamhdhéileáil ; cuimseoidh an abairt ‘ sócmhainn airgid eachtraigh ‘ urrúis agus gach sócmhainn eile in airgeadra aon tíre nó in aonaid chuntais , is cuma cén fhoirm ina sealbhaítear iad ; - na sócmhainní dá dtagraítear san Airteagal seo a shealbhú agus a bhainisteoireacht ; - gach saghas idirbheart baincéireachta a sheoladh i ndáil le tríú tíortha agus le heagraíochtaí idirnáisiúnta lena n-áirítear oibríochtaí chun iasachtaí a fháil agus a thabhairt .
- aon
- DET 67: Ar fhéachaint a bheadh fhios é , ar aon nós !
- NUM 5: ( 1A ) Aon duine a sháróidh , gan leithscéal réasúnach , aon rialachán arna dhéanamh faoin alt seo , féadfaidh an Bord aon chead gealltóireachta cúrsa a bheidh deonaithe dó a fhionraí nó a chulghairm .
- NOUN 2: Tá Bealach a’ Choin Ghlais , an caolas idir Lunga agus Sgarba ag dul thart le Eilean a’ Bhealaich chomh contúirteach le Coire Bhreacháin atá idir Sgarba agus Eilean Diùra an áit a raibh an sgríobhnóir George Orwell fá aon do bheith báite .
- fiche
- NUM 5: Bhí an-easpa cailíní agus ban idir dhá bhliain déag agus fiche bliain d’ aois .
- NOUN 1: (4) Gach rialachán a déanfar fén alt so leagfar é fé bhráid gach Tighe den Oireachtas chó luath agus is féidir é tar_éis a dhéanta agus má dhineann aon Tigh acu san laistigh den lá is fiche a shuidhfidh an Tigh sin ina dhiaidh sin rún do rith ag cur an rialacháin sin ar nea-mbrí beidh an rialachán san ar nea-mbrí dá réir sin ach beidh san gan dochar do dhleathacht éinní a dineadh roimhe sin fén rialachán san .
- sé
- gcéad
- haon
- NUM 2: ’ Ní haon droch-chuimhneamh é sin , ‘ arsa an fear eile agus do stop sé chun a scíth a ligean ar_feadh tamaill .
- DET 2: (6) Ní bheidh aon táillí ionfhálta san Oifig maidir_le haon phaitinn den tsórt a luaidhtear san alt so mara ndintar ná go_dtí go ndéanfar cóipeanna deimhnithe de sna hiontrála sa chlár Bhriotáineach a bhaineann leis an bpaitinn do thabhairt don cheannasaí chun a gcláruithe agus cóip den áireamhacht iomláin ar ar deonadh an phaitinn Bhriotáineach do lóisteáil leis an gceannasaí ach má dintar teip i lóisteáil na gcóipeanna san ní shaorfidh an teip sin an t-iarratasóir o oblagáid íoctha aon táillí ná o n-a dtiocfadh de_dheascaibh a neamh-íoctha .
- (1)
- X 9: ( 3B ) Ní bheidh feidhm ag fo-alt (1) maidir_le comaoin a fuarthas i leith diúscartha iomchuí arna cur i gcrích le hordú a rinneadh faoi alt 28 (1) den Acht um Údarás Forbartha Dugthailte Bhaile Átha_Cliath , 1997 .
- NUM 2: (3) Faoi réir fho-alt (5) , más rud é - (a) go bhfuil aon liúntas nó liúntais faoi Chaibidil 1 de Chuid 9 le tabhairt do bhliain mheasúnachta do phearsa aonair , ar pearsa aonair é nó í is comhpháirtí i dtrádáil chomhpháirtíochta , i leith caiteachais chaipitiúil arna thabhú an 3ú lá de Nollaig , 1997 , nó dá éis , ar fhoirgneamh sonraithe , agus (b) go bhfuil an liúntas nó na liúntais sin le tabhairt le_linn trádáil leithleach na pearsan aonair a bheith á cur faoi cháin , ansin , mura rud é , sa bhonntréimhse don bhliain mheasúnachta ar ina leith atá an liúntas nó na liúntais sin le tabhairt , gur comhpháirtí gníomhach i ndáil leis an trádáil chomhpháirtíochta an phearsa aonair , ní mó méid aon liúntais nó liúntas den sórt sin a bheidh le cur i gcuntas chun críocha alt 392 (1) ná méid a chinnfear de_réir na foirmle A plus IRP25,000 i gcás gurb é A méid bhrabúis nó ghnóchain thrádáil leithleach na pearsan aonair sa bhliain chaillteanais sula gcuirtear alt 392 (1) i bhfeidhm .
Morphology
The form / lemma ratio of NUM
is 1.143836 (the average of all parts of speech is 1.449988).
The 1st highest number of forms (5) was observed with the lemma “dó”: dha, dhá, dhó, dá, dó.
The 2nd highest number of forms (4) was observed with the lemma “ceathair”: ceithre, cheathrú, cheithre, gceithre.
The 3rd highest number of forms (4) was observed with the lemma “trí”: dtríú, thrí, thríú, trí.
NUM
occurs with 3 features: ga-feat/NumType (164; 51% instances), ga-feat/Form (40; 12% instances), ga-feat/Definite (9; 3% instances)
NUM
occurs with 6 feature-value pairs: Definite=Def
, Form=Ecl
, Form=HPref
, Form=Len
, NumType=Card
, NumType=Ord
NUM
occurs with 9 feature combinations.
The most frequent feature combination is _
(157 tokens).
Examples: 1, 1997, 1992, 2, 3, 4, (1), 11, 1965, 1980
Relations
NUM
nodes are attached to their parents using 11 different relations: ga-dep/nummod (269; 84% instances), ga-dep/nmod (25; 8% instances), ga-dep/conj (16; 5% instances), ga-dep/nsubj (3; 1% instances), ga-dep/dobj (2; 1% instances), ga-dep/advmod (1; 0% instances), ga-dep/appos (1; 0% instances), ga-dep/case (1; 0% instances), ga-dep/compound (1; 0% instances), ga-dep/det (1; 0% instances), ga-dep/root (1; 0% instances)
Parents of NUM
nodes belong to 10 different parts of speech: NOUN (247; 77% instances), VERB (22; 7% instances), X (16; 5% instances), NUM (15; 5% instances), PROPN (10; 3% instances), ADP (6; 2% instances), ADJ (2; 1% instances), ADV (1; 0% instances), CONJ (1; 0% instances), ROOT (1; 0% instances)
240 (75%) NUM
nodes are leaves.
49 (15%) NUM
nodes have one child.
17 (5%) NUM
nodes have two children.
15 (5%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 7.
Children of NUM
nodes are attached using 12 different relations: ga-dep/punct (41; 30% instances), ga-dep/case (24; 18% instances), ga-dep/nmod (21; 15% instances), ga-dep/conj (11; 8% instances), ga-dep/mark:prt (10; 7% instances), ga-dep/cc (8; 6% instances), ga-dep/det (7; 5% instances), ga-dep/nummod (7; 5% instances), ga-dep/advmod (3; 2% instances), ga-dep/compound (2; 1% instances), ga-dep/mark (1; 1% instances), ga-dep/nmod:prep (1; 1% instances)
Children of NUM
nodes belong to 10 different parts of speech: PUNCT (41; 30% instances), ADP (26; 19% instances), NOUN (19; 14% instances), NUM (15; 11% instances), CONJ (9; 7% instances), PART (9; 7% instances), DET (7; 5% instances), X (6; 4% instances), ADV (3; 2% instances), PROPN (1; 1% instances)
NUM in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]