home fa/pos edit page issue tracker

NUM: numeral

This document is a placeholder for the language-specific documentation for NUM.


Treebank Statistics (UD_Persian)

There are 1 NUM lemmas (7%), 396 NUM types (2%) and 3406 NUM tokens (2%). Out of 15 observed tags, the rank of NUM is: 9 in number of lemmas, 5 in number of types and 11 in number of tokens.

The 10 most frequent NUM lemmas: _

The 10 most frequent NUM types: یک، دو، یکی، هزار، سه، میلیون، ۲، چهار، ۵، ۳

The 10 most frequent ambiguous lemmas: _ (NOUN 57475, ADP 17533, VERB 16902, ADJ 13589, PUNCT 13442, CONJ 8218, PRON 5772, SCONJ 5160, ADV 4150, DET 3561, NUM 3406, PART 2569, AUX 772, X 253, INTJ 69)

The 10 most frequent ambiguous types: یک (NUM 839, NOUN 12), دو (NUM 333, NOUN 3), یکی (NUM 172, NOUN 1), سه (NUM 121, NOUN 2), چهار (NUM 46, NOUN 2), ده (NUM 29, NOUN 5, VERB 1), میلیارد (NUM 29, NOUN 20), ۲۰ (NUM 27, NOUN 1), ۷ (NUM 24, NOUN 1), هشت (NUM 22, NOUN 3)

Morphology

The form / lemma ratio of NUM is 396.000000 (the average of all parts of speech is 1071.133333).

The 1st highest number of forms (396) was observed with the lemma “_”: اول, بیست, بیستمین, ده, دهها, دو, دوازده, دوهزار, دویست, ربع, سه, سی, سیصد, سی‌ام, شانزده, شانزدهمین, شش, ششصد, شصت, صد, صدها, صفر, میلیارد, میلیون, نه, نهصد, نهمی, نود, هجده, هزار, هزاران, هزارها, هشت, هشتاد, هفت, هفتاد, هفتصد, هفده, هفدهمین, پانزده, پانصد, پنج, پنجاه, چار, چهار, چهاردهمین, چهارصد, چهل, چهلم, یازده, یه, یک, یکصد, یکهزار, یکی, ۰, ۰۲۰, ۰۳, ۱, ۱۰, ۱۰۰, ۱۰۰۰, ۱۰۰۹, ۱۰۱۰, ۱۰۲۰, ۱۰۲۸, ۱۰۳۰, ۱۰۳۴, ۱۰۵۵, ۱۱, ۱۱۰, ۱۱۹, ۱۱۹۱, ۱۲, ۱۲۰, ۱۲۰۰, ۱۲۱, ۱۲۵۰, ۱۲۸۲, ۱۲۹, ۱۳, ۱۳۰, ۱۳۰۰, ۱۳۱۴, ۱۳۲, ۱۳۳, ۱۳۳۲, ۱۳۳۶, ۱۳۳۷, ۱۳۳۹, ۱۳۴۰, ۱۳۴۱, ۱۳۵۷, ۱۳۵۹, ۱۳۷۲, ۱۳۷۶, ۱۳۷۷, ۱۳۷۸, ۱۳۷۹, ۱۳۸۰, ۱۴, ۱۴۰, ۱۴۲۱, ۱۴۷, ۱۵, ۱۵۰, ۱۵۰۰, ۱۵۰۷, ۱۵۶۰, ۱۵۶۷, ۱۵۷۲, ۱۶, ۱۶۰, ۱۶۰۰, ۱۶۴, ۱۶۷, ۱۷, ۱۷۰, ۱۷۲, ۱۷۳, ۱۷۷, ۱۷۷۰, ۱۸, ۱۸۰, ۱۸۳۸, ۱۸۴, ۱۸۷۶, ۱۸۹۱, ۱۸۹۲, ۱۸۹۳, ۱۹, ۱۹۱۱, ۱۹۳۲, ۱۹۳۳, ۱۹۳۵, ۱۹۳۶, ۱۹۳۷, ۱۹۳۸, ۱۹۴۱, ۱۹۴۶, ۱۹۵۰, ۱۹۵۲, ۱۹۵۴, ۱۹۵۵, ۱۹۶۳, ۱۹۶۵, ۱۹۶۸, ۱۹۶۹, ۱۹۷۰, ۱۹۷۱, ۱۹۷۳, ۱۹۷۷, ۱۹۷۸, ۱۹۷۹, ۱۹۸۰, ۱۹۸۱, ۱۹۸۲, ۱۹۸۳, ۱۹۸۴, ۱۹۸۵, ۱۹۸۶, ۱۹۸۷, ۱۹۸۸, ۱۹۸۹, ۱۹۹۰, ۱۹۹۱, ۱۹۹۲, ۱۹۹۳, ۱۹۹۴, ۱۹۹۵, ۱۹۹۶, ۱۹۹۷, ۱۹۹۸, ۱۹۹۹, ۲, ۲۰, ۲۰۰, ۲۰۰۰, ۲۰۰۱, ۲۰۰۲, ۲۰۰۳, ۲۰۰۵, ۲۰۰۶, ۲۰۱, ۲۰۱۰, ۲۰۱۵, ۲۰۲, ۲۱, ۲۱۱, ۲۱۲, ۲۱۵, ۲۱۷, ۲۱۸, ۲۲, ۲۲۰, ۲۲۱, ۲۲۹۵, ۲۳, ۲۳۰, ۲۳۳, ۲۴, ۲۴۸, ۲۵, ۲۵۰, ۲۵۴, ۲۵۶, ۲۶, ۲۶۰, ۲۶۰۰, ۲۷, ۲۷۲, ۲۸, ۲۸۰, ۲۸۰۰, ۲۸۲, ۲۸۶, ۲۹, ۳, ۳۰, ۳۰۰, ۳۰۰۰, ۳۰۲, ۳۰۵, ۳۱, ۳۱۵, ۳۲, ۳۲۰, ۳۲۰۰, ۳۳, ۳۴, ۳۴۷۲, ۳۵, ۳۶, ۳۶۰, ۳۷, ۳۷۰۰, ۳۸, ۳۸۱, ۳۸۸, ۴, ۴۰, ۴۰۰, ۴۰۱, ۴۰۶۷, ۴۱, ۴۱۱, ۴۱۲, ۴۱۳, ۴۲, ۴۲۱, ۴۲۳, ۴۲۷۷, ۴۳, ۴۳۰, ۴۳۱, ۴۴, ۴۴۴, ۴۵, ۴۵۰, ۴۵۲, ۴۶, ۴۷, ۴۷۲, ۴۷۳, ۴۸, ۴۸۰, ۴۹, ۴۹۹, ۵, ۵۰, ۵۰۰, ۵۰۰۰, ۵۱, ۵۱۰, ۵۱۲, ۵۲, ۵۲۱, ۵۲۳, ۵۲۵, ۵۳, ۵۳۱, ۵۴, ۵۴۰, ۵۴۳, ۵۵, ۵۵۰, ۵۵۰۰, ۵۵۱, ۵۵۷, ۵۶, ۵۶۰, ۵۶۸, ۵۷, ۵۷۰, ۵۷۱, ۵۸, ۵۸۱, ۵۹, ۵۹۴, ۵۹۶, ۵۹۹, ۶, ۶۰, ۶۰۰, ۶۰۰۰, ۶۰۱, ۶۱, ۶۱۳۱, ۶۲, ۶۲۳, ۶۳, ۶۳۱, ۶۴, ۶۵, ۶۵۰, ۶۵۱, ۶۶, ۶۷, ۶۷۰۰, ۶۷۵, ۶۷۸, ۶۸, ۶۸۵۲, ۶۸۶, ۶۸۸۲, ۷, ۷۰, ۷۰۰, ۷۰۰۰, ۷۰۰۵, ۷۱, ۷۱۱, ۷۲, ۷۲۲, ۷۳, ۷۳۲, ۷۳۳, ۷۴, ۷۴۰, ۷۵, ۷۵۱, ۷۶, ۷۶۲, ۷۶۷, ۷۷, ۷۷۴, ۷۸, ۷۹, ۸, ۸۰, ۸۰۰, ۸۰۰۰, ۸۰۴۶, ۸۱, ۸۲, ۸۲۰۱, ۸۲۴۲, ۸۳, ۸۳۰۰, ۸۳۳, ۸۴, ۸۵, ۸۵۰, ۸۵۰۰, ۸۶, ۸۶۶, ۸۷, ۸۸, ۸۸۱, ۸۸۸۸, ۸۹, ۹, ۹۰, ۹۰۰, ۹۰۵, ۹۱, ۹۱۱, ۹۱۴, ۹۱۷, ۹۲, ۹۲۰, ۹۲۲, ۹۲۳, ۹۳, ۹۴, ۹۴۰, ۹۵, ۹۵۱, ۹۶۷۶, ۹۷, ۹۸, ۹۸۰, ۹۸۵, ۹۹, ۹۹۰, ۹۹۱.

NUM occurs with 1 features: fa-feat/NumType (3406; 100% instances)

NUM occurs with 1 feature-value pairs: NumType=Card

NUM occurs with 1 feature combinations. The most frequent feature combination is NumType=Card (3406 tokens). Examples: یک، دو، یکی، هزار، سه، میلیون، ۲، چهار، ۵، ۳

Relations

NUM nodes are attached to their parents using 19 different relations: fa-dep/nummod (2767; 81% instances), fa-dep/compound (197; 6% instances), fa-dep/conj (192; 6% instances), fa-dep/nmod (88; 3% instances), fa-dep/nsubj (76; 2% instances), fa-dep/nmod:poss (19; 1% instances), fa-dep/root (16; 0% instances), fa-dep/dobj (9; 0% instances), fa-dep/amod (8; 0% instances), fa-dep/appos (7; 0% instances), fa-dep/ccomp (7; 0% instances), fa-dep/name (5; 0% instances), fa-dep/mwe (4; 0% instances), fa-dep/acl:relcl (3; 0% instances), fa-dep/xcomp (3; 0% instances), fa-dep/advcl (2; 0% instances), fa-dep/advmod (1; 0% instances), fa-dep/det (1; 0% instances), fa-dep/nsubjpass (1; 0% instances)

Parents of NUM nodes belong to 10 different parts of speech: NOUN (2686; 79% instances), NUM (394; 12% instances), ADJ (138; 4% instances), VERB (119; 3% instances), ADP (22; 1% instances), ROOT (16; 0% instances), DET (14; 0% instances), PRON (11; 0% instances), ADV (5; 0% instances), X (1; 0% instances)

2746 (81%) NUM nodes are leaves.

390 (11%) NUM nodes have one child.

192 (6%) NUM nodes have two children.

78 (2%) NUM nodes have three or more children.

The highest child degree of a NUM node is 9.

Children of NUM nodes are attached using 19 different relations: fa-dep/nummod (215; 20% instances), fa-dep/conj (193; 18% instances), fa-dep/nmod (153; 14% instances), fa-dep/punct (117; 11% instances), fa-dep/cc (108; 10% instances), fa-dep/case (96; 9% instances), fa-dep/advmod (71; 7% instances), fa-dep/cop (29; 3% instances), fa-dep/nsubj (27; 3% instances), fa-dep/det (24; 2% instances), fa-dep/ccomp (10; 1% instances), fa-dep/mark (9; 1% instances), fa-dep/amod (6; 1% instances), fa-dep/compound (5; 0% instances), fa-dep/mwe (5; 0% instances), fa-dep/nmod:poss (5; 0% instances), fa-dep/name (2; 0% instances), fa-dep/acl:relcl (1; 0% instances), fa-dep/advcl (1; 0% instances)

Children of NUM nodes belong to 12 different parts of speech: NUM (394; 37% instances), NOUN (238; 22% instances), PUNCT (116; 11% instances), CONJ (108; 10% instances), ADP (92; 9% instances), VERB (36; 3% instances), ADJ (26; 2% instances), DET (22; 2% instances), SCONJ (14; 1% instances), ADV (12; 1% instances), PRON (11; 1% instances), PART (8; 1% instances)


NUM in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]