Statistics of NUM in UD_Hausa-EasternAutogramm

home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

Treebank Statistics: UD_Hausa-EasternAutogramm: POS Tags: `NUM`

There are 31 NUM lemmas (2%), 34 NUM types (2%) and 271 NUM tokens (3%). Out of 16 observed tags, the rank of NUM is: 8 in number of lemmas, 9 in number of types and 13 in number of tokens.

The 10 most frequent NUM lemmas: ɗàriː, tar̃à, ɗaya, alìf, bìyar̃, biyu, ukù, shidà, tàmàːnin, goːmà

The 10 most frequent NUM types: ɗàriː, tar̃à, ɗaya, alìf, bìyar̃, biyu, ukù, tàmàːnin, shidà, goːmà

The 10 most frequent ambiguous lemmas: ɗàriː (NUM 34, NOUN 2), biyu (NUM 18, NOUN 1, PROPN 1), shidà (NUM 12, PRON 1), dubuː (NUM 7, NOUN 5), gùdaː (NOUN 8, NUM 2), hàmsin (NOUN 3, NUM 1), kashìː (NOUN 2, NUM 1), miliyàn (NOUN 2, NUM 1), ɗàːriː (NOUN 1, NUM 1)

The 10 most frequent ambiguous types: shidà (NUM 11, PRON 1), dubuː (NUM 7, NOUN 3), gùdaː (NOUN 7, NUM 2), biyûn (NOUN 1, NUM 1), hàmsin (NOUN 3, NUM 1), kashìː (NOUN 2, NUM 1), miliyàn (NOUN 2, NUM 1), ɗàːriː (NOUN 1, NUM 1)

shidà
- NUM 11: àbîn dà ya fàːru shiː nèː hakà kawài tafkìn ya bur̃tsoː dà wajen tân dubuː shidà na iskàr̃ ta carbon dioxide , har̃ ya jaːwoː ruwaː tân dubuː mèːtan ya yi àmbaːliyàː .
- PRON 1: wàtànniː kàmar̃ shidà baːyan wannàn hàrgitsiː kuma , an yi wasu tàːshe-tàːshen hankulàː à bir̃nin Kanòː , indà akà kashè à ƙallà mutàːneː goːmà shâː bìyar̃ , ɗaruːruwàː kuma sukà sàːmi raunukàː .
dubuː
- NUM 7: baːyan hakà kuma yaː ji wai waɗàndà akà ɗaurèː cikin shèːkàruː ukùn dà sukà shigèː sun wucè mùtûm dubuː , à ƙàrƙashin wannàn Dòːkaː ta Biyu .
- NOUN 3: à shèːkaràr̃ alìf dà ɗàriː tar̃à dà tàmàːnin dà shidà dai mutàneː fìye dà dubuː dà ɗàriː bakwài neː sukà mutù , kuma Allàh neː kawài ya san yawàn waɗàndà zaːsù mutù ìdan tafkìn ya saːkè yîn wani aman gâs ɗîn .
gùdaː
- NOUN 7: baːyan shèːkaràː gùdaː nèː kuma àlꞌamàr̃in na Ùmar̃ù Dikkò ya kai gà wani saːbon matsayiː baːyân dà akà yi ƙòːƙarin saːcèː shi à Ingìlà .
- NUM 2: hakà kuma ìdan anàː yi wà mutàːneː dàbam dàbam àlluːràː dà àlluːràː gùdaː , tòː ìdan wani dàgà cikin waɗàndà akà yi wà àlluːr̃àr̃ yanàː dà ƙwaːyoːyin cùːtar̃ AIDS à jìkinsà , zâi bazà ƙwaːyoːyin cùːtâr̃ gà sauran waɗàndà akà yi wà àlluːr̃àr̃ .
biyûn
- NOUN 1: yàːyîn dà hakàn kèː fàːruwaː , hêdkwatàr̃ ꞌyan sàndân à bir̃nin Ìkko taː bayyànà cêːwaː yawàn fàshe-fàshe dà sàːce-sàːcên dà akèː yîː à cikin Nàːjeːr̃iyàr̃ yaː fi irìn waɗàndà akà yi cikin shèːkàruː biyûn dà sukà wucèː .
- NUM 1: an yi zàngà-zangà ta biyûn à Kanòː indà ‘yan sàndan kashè tàr̃zòːmaː sukà yi sàmmakoː zuwàː hàr̃aːbàr̃ Jaːmi’àr̃ Bàyer̃ò ta Kanòː , don sù hanà ɗàːlìban jaːmi’àr̃ gudaːnar̃ dà zàngà-zangàr̃ lùmaːnàr̃ dà sukà shiryà yîː don nuːnà rashìn amìncêːwar̃sù dà harìn dà ƙasar̃ Amìr̃kà dà àːbòːkan ƙàwàncentà sukà kai wà ƙasar̃ Ìr̃aːƙì .
hàmsin
- NOUN 3: Gùdaː ɗàriː huɗu dà hàmsin dà tar̃à dàgà cikin tsàràrrûn sunàː jiràn à gabaːtar̃ dà suː nèː à gàban shàr̃i’àː .
- NUM 1: à gaskiyaː ìdan kaː ga Fela Kuti yanàː tìːƙar̃ rawar̃sà à gàban jàma’àː , dà ƙyar̃ zaːkà yàr̃da dà cêwaː shèːkàrunsà hàmsin nèː dà haihùwaː .
kashìː
- NOUN 2: Nàːjeːr̃iyàː dai tanàː dà kàmar̃ kashìː goːmà shâː bìyar̃ dàgà cikin ɗàriː na yawàn iyàːyeː maːtaː waɗàndà sukèː mutuwàː dàgà cikin iyàːyeː maːtaː na duːniyàː ;
- NUM 1: wannàn adàdiː kùwa wani àbin tsòːroː nèː gà ƙasaː waddà yawàn jàma’àr̃tà kashìː biyu nèː dàgà cikin ɗàriː na yawàn mutàːnên dà akè dà suː à duk duːniyàː bàːkiː ɗayantà .
miliyàn
- NOUN 2: tôː à duk loːkàcin zamansà à nân Bìr̃taːniyà dai , Ùːmar̃ù Dikkò yaː shaː naːnàːtà cêːwaː shiː bài sàːci kuɗiː nair̃àː miliyàn bìlaː adàdin ba ta hanyàr̃ gàdàː-gadar̃ shìnkaːfaː dà kuma duk sauran laifuffukàn dà akèː zàrgin yaː aikàtaː .
- NUM 1: sai à watàn Jànair̃u na shèːkaràr̃ alif dà ɗàriː tar̃à dà tàmàːnin dà bìyar̃ nèː gwamnatìn Nàjeːr̃iyàː ta bùkàːci Bìr̃taːniyà tà miːƙàː matà shiː don à gur̃faːnar̃ dà shiː à gàban shàr̃iꞌàː kân lâifin cîn hancìː dà kàrɓar̃ r̃ashawaː ta fâm miliyàn bàr̃kàtài .
ɗàːriː
- NOUN 1: Yaː fitoː à kaːnun làːbàːr̃ai nèː à shèːkaràr̃ alìf dà ɗàːriː tar̃à dà sìttin dà tar̃à loːkàcîn dà ya kaːrè wani leːbùr̃à dà akèː yîn zàrgin cêːwa wani jaːmìꞌin gwamnatì yaː yi wà màːtar̃sà fyàːɗeː .
- NUM 1: tòː dâː maː tun kwàːnàkin baːya anàː yîn wannàn hàyàːniyaː gàme dà littaːfìn na Aːyoːyin Shàiɗân , dòːmin kùwa à raːnar̃ Lahàdì dà ta wucèː maː , wasu Mùsùlmiː suː kìːmaːnìn ɗàːriː dà àshìr̃in à wata ùnguwar̃ Tokyo sun yi wata zàngà-zangà baːyân dà sukà idar̃ dà sallàː .

Morphology

The form / lemma ratio of NUM is 1.096774 (the average of all parts of speech is 1.352311).

The 1st highest number of forms (4) was observed with the lemma “ɗaya”: ɗaya, ɗayansà, ɗayansù, ɗayantà.

The 2nd highest number of forms (2) was observed with the lemma “huɗu”: huɗu, huɗûn.

The 3rd highest number of forms (2) was observed with the lemma “shidà”: shidà, shidàn.

NUM occurs with 2 features: Gender (33; 12% instances), Definite (10; 4% instances)

NUM occurs with 4 feature-value pairs: Definite=Cons, Definite=Def, Gender=Fem, Gender=Masc

NUM occurs with 7 feature combinations. The most frequent feature combination is _ (231 tokens). Examples: tar̃à, ɗaya, alìf, bìyar̃, biyu, ukù, tàmàːnin, shidà, goːmà, huɗu

Relations

NUM nodes are attached to their parents using 11 different relations: nummod (98; 36% instances), conj (86; 32% instances), flat (30; 11% instances), nmod:appos (20; 7% instances), nmod (19; 7% instances), nsubj (7; 3% instances), obl:arg (4; 1% instances), ccomp (3; 1% instances), compound (2; 1% instances), obl:mod (1; 0% instances), root (1; 0% instances)

Parents of NUM nodes belong to 9 different parts of speech: NUM (135; 50% instances), NOUN (111; 41% instances), VERB (12; 4% instances), PRON (6; 2% instances), PART (2; 1% instances), PROPN (2; 1% instances), ADJ (1; 0% instances), ADP (1; 0% instances), (1; 0% instances)

96 (35%) NUM nodes are leaves.

103 (38%) NUM nodes have one child.

40 (15%) NUM nodes have two children.

32 (12%) NUM nodes have three or more children.

The highest child degree of a NUM node is 7.

Children of NUM nodes are attached using 17 different relations: conj (90; 31% instances), cc (86; 30% instances), flat (30; 10% instances), case (27; 9% instances), nummod (18; 6% instances), nmod (14; 5% instances), advmod (4; 1% instances), nsubj (4; 1% instances), cop (3; 1% instances), discourse (3; 1% instances), mark (3; 1% instances), punct (2; 1% instances), advcl (1; 0% instances), aux (1; 0% instances), dep (1; 0% instances), dislocated (1; 0% instances), obl:mod (1; 0% instances)

Children of NUM nodes belong to 13 different parts of speech: NUM (135; 47% instances), CCONJ (86; 30% instances), ADP (18; 6% instances), NOUN (17; 6% instances), PART (15; 5% instances), ADV (4; 1% instances), AUX (4; 1% instances), PRON (2; 1% instances), PUNCT (2; 1% instances), SCONJ (2; 1% instances), X (2; 1% instances), ADJ (1; 0% instances), VERB (1; 0% instances)

Treebank Statistics: UD_Hausa-EasternAutogramm: POS Tags: NUM

Morphology

Relations

Treebank Statistics: UD_Hausa-EasternAutogramm: POS Tags: `NUM`