NUM
: numeral
This document is a placeholder for the language-specific documentation
for NUM
.
Treebank Statistics (UD_Persian)
There are 1 NUM
lemmas (7%), 396 NUM
types (2%) and 3406 NUM
tokens (2%).
Out of 15 observed tags, the rank of NUM
is: 9 in number of lemmas, 5 in number of types and 11 in number of tokens.
The 10 most frequent NUM
lemmas: _
The 10 most frequent NUM
types: یک، دو، یکی، هزار، سه، میلیون، ۲، چهار، ۵، ۳
The 10 most frequent ambiguous lemmas: _ (NOUN 57475, ADP 17533, VERB 16902, ADJ 13589, PUNCT 13442, CONJ 8218, PRON 5772, SCONJ 5160, ADV 4150, DET 3561, NUM 3406, PART 2569, AUX 772, X 253, INTJ 69)
The 10 most frequent ambiguous types: یک (NUM 839, NOUN 12), دو (NUM 333, NOUN 3), یکی (NUM 172, NOUN 1), سه (NUM 121, NOUN 2), چهار (NUM 46, NOUN 2), ده (NUM 29, NOUN 5, VERB 1), میلیارد (NUM 29, NOUN 20), ۲۰ (NUM 27, NOUN 1), ۷ (NUM 24, NOUN 1), هشت (NUM 22, NOUN 3)
- یک
- دو
- یکی
- سه
- چهار
- ده
- NUM 29: همان طور که من الان ، آدم ده سال پیش نیستم ؛ دگرگون شدهام .
- NOUN 5: باژ که زادگاه فردوسی معرفی شده ، در ناحیهٔ طابران یکی از این هزار ده است .
- VERB 1: ۵ - دل خود را در پوششی از رؤفت و محبت و لطف به رعیت قرار ده و برای آنها مبادا به صورت درندهای زیانبخش باشی که خوردن و از بین بردن آنها غنیمت شمری زیرا ایشان دو گروه ند ، یا برادر دینی تو هستند و یا بمانند تو انسانی میباشند .
- میلیارد
- ۲۰
- ۷
- هشت
Morphology
The form / lemma ratio of NUM
is 396.000000 (the average of all parts of speech is 1071.133333).
The 1st highest number of forms (396) was observed with the lemma “_”: اول, بیست, بیستمین, ده, دهها, دو, دوازده, دوهزار, دویست, ربع, سه, سی, سیصد, سیام, شانزده, شانزدهمین, شش, ششصد, شصت, صد, صدها, صفر, میلیارد, میلیون, نه, نهصد, نهمی, نود, هجده, هزار, هزاران, هزارها, هشت, هشتاد, هفت, هفتاد, هفتصد, هفده, هفدهمین, پانزده, پانصد, پنج, پنجاه, چار, چهار, چهاردهمین, چهارصد, چهل, چهلم, یازده, یه, یک, یکصد, یکهزار, یکی, ۰, ۰۲۰, ۰۳, ۱, ۱۰, ۱۰۰, ۱۰۰۰, ۱۰۰۹, ۱۰۱۰, ۱۰۲۰, ۱۰۲۸, ۱۰۳۰, ۱۰۳۴, ۱۰۵۵, ۱۱, ۱۱۰, ۱۱۹, ۱۱۹۱, ۱۲, ۱۲۰, ۱۲۰۰, ۱۲۱, ۱۲۵۰, ۱۲۸۲, ۱۲۹, ۱۳, ۱۳۰, ۱۳۰۰, ۱۳۱۴, ۱۳۲, ۱۳۳, ۱۳۳۲, ۱۳۳۶, ۱۳۳۷, ۱۳۳۹, ۱۳۴۰, ۱۳۴۱, ۱۳۵۷, ۱۳۵۹, ۱۳۷۲, ۱۳۷۶, ۱۳۷۷, ۱۳۷۸, ۱۳۷۹, ۱۳۸۰, ۱۴, ۱۴۰, ۱۴۲۱, ۱۴۷, ۱۵, ۱۵۰, ۱۵۰۰, ۱۵۰۷, ۱۵۶۰, ۱۵۶۷, ۱۵۷۲, ۱۶, ۱۶۰, ۱۶۰۰, ۱۶۴, ۱۶۷, ۱۷, ۱۷۰, ۱۷۲, ۱۷۳, ۱۷۷, ۱۷۷۰, ۱۸, ۱۸۰, ۱۸۳۸, ۱۸۴, ۱۸۷۶, ۱۸۹۱, ۱۸۹۲, ۱۸۹۳, ۱۹, ۱۹۱۱, ۱۹۳۲, ۱۹۳۳, ۱۹۳۵, ۱۹۳۶, ۱۹۳۷, ۱۹۳۸, ۱۹۴۱, ۱۹۴۶, ۱۹۵۰, ۱۹۵۲, ۱۹۵۴, ۱۹۵۵, ۱۹۶۳, ۱۹۶۵, ۱۹۶۸, ۱۹۶۹, ۱۹۷۰, ۱۹۷۱, ۱۹۷۳, ۱۹۷۷, ۱۹۷۸, ۱۹۷۹, ۱۹۸۰, ۱۹۸۱, ۱۹۸۲, ۱۹۸۳, ۱۹۸۴, ۱۹۸۵, ۱۹۸۶, ۱۹۸۷, ۱۹۸۸, ۱۹۸۹, ۱۹۹۰, ۱۹۹۱, ۱۹۹۲, ۱۹۹۳, ۱۹۹۴, ۱۹۹۵, ۱۹۹۶, ۱۹۹۷, ۱۹۹۸, ۱۹۹۹, ۲, ۲۰, ۲۰۰, ۲۰۰۰, ۲۰۰۱, ۲۰۰۲, ۲۰۰۳, ۲۰۰۵, ۲۰۰۶, ۲۰۱, ۲۰۱۰, ۲۰۱۵, ۲۰۲, ۲۱, ۲۱۱, ۲۱۲, ۲۱۵, ۲۱۷, ۲۱۸, ۲۲, ۲۲۰, ۲۲۱, ۲۲۹۵, ۲۳, ۲۳۰, ۲۳۳, ۲۴, ۲۴۸, ۲۵, ۲۵۰, ۲۵۴, ۲۵۶, ۲۶, ۲۶۰, ۲۶۰۰, ۲۷, ۲۷۲, ۲۸, ۲۸۰, ۲۸۰۰, ۲۸۲, ۲۸۶, ۲۹, ۳, ۳۰, ۳۰۰, ۳۰۰۰, ۳۰۲, ۳۰۵, ۳۱, ۳۱۵, ۳۲, ۳۲۰, ۳۲۰۰, ۳۳, ۳۴, ۳۴۷۲, ۳۵, ۳۶, ۳۶۰, ۳۷, ۳۷۰۰, ۳۸, ۳۸۱, ۳۸۸, ۴, ۴۰, ۴۰۰, ۴۰۱, ۴۰۶۷, ۴۱, ۴۱۱, ۴۱۲, ۴۱۳, ۴۲, ۴۲۱, ۴۲۳, ۴۲۷۷, ۴۳, ۴۳۰, ۴۳۱, ۴۴, ۴۴۴, ۴۵, ۴۵۰, ۴۵۲, ۴۶, ۴۷, ۴۷۲, ۴۷۳, ۴۸, ۴۸۰, ۴۹, ۴۹۹, ۵, ۵۰, ۵۰۰, ۵۰۰۰, ۵۱, ۵۱۰, ۵۱۲, ۵۲, ۵۲۱, ۵۲۳, ۵۲۵, ۵۳, ۵۳۱, ۵۴, ۵۴۰, ۵۴۳, ۵۵, ۵۵۰, ۵۵۰۰, ۵۵۱, ۵۵۷, ۵۶, ۵۶۰, ۵۶۸, ۵۷, ۵۷۰, ۵۷۱, ۵۸, ۵۸۱, ۵۹, ۵۹۴, ۵۹۶, ۵۹۹, ۶, ۶۰, ۶۰۰, ۶۰۰۰, ۶۰۱, ۶۱, ۶۱۳۱, ۶۲, ۶۲۳, ۶۳, ۶۳۱, ۶۴, ۶۵, ۶۵۰, ۶۵۱, ۶۶, ۶۷, ۶۷۰۰, ۶۷۵, ۶۷۸, ۶۸, ۶۸۵۲, ۶۸۶, ۶۸۸۲, ۷, ۷۰, ۷۰۰, ۷۰۰۰, ۷۰۰۵, ۷۱, ۷۱۱, ۷۲, ۷۲۲, ۷۳, ۷۳۲, ۷۳۳, ۷۴, ۷۴۰, ۷۵, ۷۵۱, ۷۶, ۷۶۲, ۷۶۷, ۷۷, ۷۷۴, ۷۸, ۷۹, ۸, ۸۰, ۸۰۰, ۸۰۰۰, ۸۰۴۶, ۸۱, ۸۲, ۸۲۰۱, ۸۲۴۲, ۸۳, ۸۳۰۰, ۸۳۳, ۸۴, ۸۵, ۸۵۰, ۸۵۰۰, ۸۶, ۸۶۶, ۸۷, ۸۸, ۸۸۱, ۸۸۸۸, ۸۹, ۹, ۹۰, ۹۰۰, ۹۰۵, ۹۱, ۹۱۱, ۹۱۴, ۹۱۷, ۹۲, ۹۲۰, ۹۲۲, ۹۲۳, ۹۳, ۹۴, ۹۴۰, ۹۵, ۹۵۱, ۹۶۷۶, ۹۷, ۹۸, ۹۸۰, ۹۸۵, ۹۹, ۹۹۰, ۹۹۱.
NUM
occurs with 1 features: fa-feat/NumType (3406; 100% instances)
NUM
occurs with 1 feature-value pairs: NumType=Card
NUM
occurs with 1 feature combinations.
The most frequent feature combination is NumType=Card
(3406 tokens).
Examples: یک، دو، یکی، هزار، سه، میلیون، ۲، چهار، ۵، ۳
Relations
NUM
nodes are attached to their parents using 19 different relations: fa-dep/nummod (2767; 81% instances), fa-dep/compound (197; 6% instances), fa-dep/conj (192; 6% instances), fa-dep/nmod (88; 3% instances), fa-dep/nsubj (76; 2% instances), fa-dep/nmod:poss (19; 1% instances), fa-dep/root (16; 0% instances), fa-dep/dobj (9; 0% instances), fa-dep/amod (8; 0% instances), fa-dep/appos (7; 0% instances), fa-dep/ccomp (7; 0% instances), fa-dep/name (5; 0% instances), fa-dep/mwe (4; 0% instances), fa-dep/acl:relcl (3; 0% instances), fa-dep/xcomp (3; 0% instances), fa-dep/advcl (2; 0% instances), fa-dep/advmod (1; 0% instances), fa-dep/det (1; 0% instances), fa-dep/nsubjpass (1; 0% instances)
Parents of NUM
nodes belong to 10 different parts of speech: NOUN (2686; 79% instances), NUM (394; 12% instances), ADJ (138; 4% instances), VERB (119; 3% instances), ADP (22; 1% instances), ROOT (16; 0% instances), DET (14; 0% instances), PRON (11; 0% instances), ADV (5; 0% instances), X (1; 0% instances)
2746 (81%) NUM
nodes are leaves.
390 (11%) NUM
nodes have one child.
192 (6%) NUM
nodes have two children.
78 (2%) NUM
nodes have three or more children.
The highest child degree of a NUM
node is 9.
Children of NUM
nodes are attached using 19 different relations: fa-dep/nummod (215; 20% instances), fa-dep/conj (193; 18% instances), fa-dep/nmod (153; 14% instances), fa-dep/punct (117; 11% instances), fa-dep/cc (108; 10% instances), fa-dep/case (96; 9% instances), fa-dep/advmod (71; 7% instances), fa-dep/cop (29; 3% instances), fa-dep/nsubj (27; 3% instances), fa-dep/det (24; 2% instances), fa-dep/ccomp (10; 1% instances), fa-dep/mark (9; 1% instances), fa-dep/amod (6; 1% instances), fa-dep/compound (5; 0% instances), fa-dep/mwe (5; 0% instances), fa-dep/nmod:poss (5; 0% instances), fa-dep/name (2; 0% instances), fa-dep/acl:relcl (1; 0% instances), fa-dep/advcl (1; 0% instances)
Children of NUM
nodes belong to 12 different parts of speech: NUM (394; 37% instances), NOUN (238; 22% instances), PUNCT (116; 11% instances), CONJ (108; 10% instances), ADP (92; 9% instances), VERB (36; 3% instances), ADJ (26; 2% instances), DET (22; 2% instances), SCONJ (14; 1% instances), ADV (12; 1% instances), PRON (11; 1% instances), PART (8; 1% instances)
NUM in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fi] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]