Treebank Statistics: UD_Persian-Seraji: Features: Number
This feature is universal.
It occurs with 2 different values: Plur, Sing.
80283 tokens (52%) have a non-empty value of Number.
11513 types (76%) occur at least once with a non-empty value of Number.
7614 lemmas (70%) occur at least once with a non-empty value of Number.
The feature is used with 5 part-of-speech tags: NOUN (57575; 38% instances), VERB (12625; 8% instances), PRON (5251; 3% instances), AUX (4593; 3% instances), ADJ (239; 0% instances).
NOUN
57575 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Number.
NOUN tokens may have the following values of Number:
Plur(8648; 15% of non-emptyNumber): انتخابات، افراد، مواد، کسانی، کشورهای، برنامههای، اصلاحات، حدود، مطبوعات، آثارSing(48927; 85% of non-emptyNumber): ایران، سال، مردم، کشور، روز، کار، قرار، دست، انقلاب، تهرانEMPTY(4): پروردگارا، الهی، حافظا
| Paradigm کشور | Sing | Plur |
|---|---|---|
| کشور | کشورهای, کشورها, کشورهایی |
VERB
12625 VERB tokens (100% of all VERB tokens) have a non-empty value of Number.
The most frequent other feature values with which VERB and Number co-occurred: Person=3 (10848; 86%), Mood=EMPTY (10541; 83%), VerbForm=EMPTY (8394; 66%).
VERB tokens may have the following values of Number:
Plur(3541; 28% of non-emptyNumber): کنند، میکنند، هستند، دارند، کردند، ند، کردهاند، میشوند، کنیم، داشتندSing(9084; 72% of non-emptyNumber): کرد، گفت، شد، شده، میشود، دارد، میکند، کرده، نیست، استEMPTY(28): ی، نکن، بده، بفرما، کنین، ام، باشه، بره، بمان، بگذار
| Paradigm کرد | Sing | Plur |
|---|---|---|
| Mood=Imp|Person=2|Polarity=Neg|VerbForm=Fin | مکن, نکن | |
| Mood=Imp|Person=2|VerbForm=Fin | کن, بکن | |
| Mood=Sub|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin | نکنیم | |
| Mood=Sub|Person=1|Tense=Pres|VerbForm=Fin | کنم, بکنم | کنیم, بکنیم, شویم |
| Mood=Sub|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin | نکنی | نکنید, نشوید |
| Mood=Sub|Person=2|Tense=Pres|VerbForm=Fin | کنی, بکنی, کنید | کنید, بکنید |
| Mood=Sub|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin | نشود, نکند | نکنند |
| Mood=Sub|Person=3|Tense=Pres|VerbForm=Fin | کند, شود, بشود, بکند | کنند, شوند, بکنند |
| Person=1|Polarity=Neg|Tense=Past | نکردم, نمیکردم | نکردیم, نمیکردیم |
| Person=1|Polarity=Neg|Tense=Pres | نمیکنم | نمیکنیم |
| Person=1|Polarity=Neg|VerbForm=Part | نکردهام | نکردهایم |
| Person=1|Tense=Past | کردم, میکردم, شدم | کردیم, میکردیم |
| Person=1|Tense=Pres | میکنم, میشوم | میکنیم |
| Person=1|VerbForm=Part | کردهام, شدهام, میشدهام | کردهایم, شدهایم |
| Person=2|Polarity=Neg|Tense=Past | نکردی | نکردید |
| Person=2|Polarity=Neg|Tense=Pres | نمیکنی | نمیکنید |
| Person=2|Tense=Past | کردی | کردید, میکردید |
| Person=2|Tense=Pres | میکنی | میکنید, میشوید, نمیکنید |
| Person=2|VerbForm=Part | کردهای, شدهای | کردهاید |
| Person=3|Polarity=Neg|Tense=Past | نکردند, نمیکردند, نشدهاند | |
| Person=3|Polarity=Neg|Tense=Pres | نمیکند | نمیکنند, نمیشوند |
| Person=3|Polarity=Neg|VerbForm=Part | نکرده, نشده | نشدهاند, نکردهاند |
| Person=3|Tense=Past | کرد, شد, میکرد, میشد, نکرد, نشد, نمیکرد, نمیشد, کرده | کردند, شدند, میکردند, میشدند, کنند |
| Person=3|Tense=Pres | میشود, میکند, نمیشود, میکنه | میکنند, میشوند, نمیشوند |
| Person=3|VerbForm=Part | شده, کرده, میکرده, نشده | کردهاند, شدهاند, میکردهاند |
PRON
5251 PRON tokens (90% of all PRON tokens) have a non-empty value of Number.
The most frequent other feature values with which PRON and Number co-occurred: Reflex=EMPTY (4455; 85%), PronType=Prs (3622; 69%).
PRON tokens may have the following values of Number:
Plur(1303; 25% of non-emptyNumber): ما، آنها، شان، شما، آنان، اینها، مان، ایشان، تان، اینانSing(3948; 75% of non-emptyNumber): خود، آن، او، این، ش، من، وی، تو، م، اشEMPTY(556): همه، بعضی، هم، آنچه، برخی، یکدیگر، دیگران، همهٔ، هرکس، یک
| Paradigm آن | Sing | Plur |
|---|---|---|
| Person=3|PronType=Prs | ش, اش | |
| PronType=Dem | آن, دان, اش | آنها, آنان, آنها, آنهایی |
Number seems to be lexical feature of PRON. 94% lemmas (30) occur only with one value of Number.
AUX
4593 AUX tokens (91% of all AUX tokens) have a non-empty value of Number.
The most frequent other feature values with which AUX and Number co-occurred: Person=3 (4295; 94%), Mood=EMPTY (3817; 83%), VerbForm=EMPTY (3608; 79%), Tense=Pres (3079; 67%).
AUX tokens may have the following values of Number:
Plur(625; 14% of non-emptyNumber): بودند، باشند، خواهند، میتوانند، نیستند، باشیم، بودهاند، نمیتوانند، میخواهند، میخواهیمSing(3968; 86% of non-emptyNumber): است، بود، خواهد، باشد، ست، بوده، شده، میتواند، میشود، نبودEMPTY(434): باید، میتوان، نباید، نمیتوان، بایستی، میباید، میبایست، بتوان، باشه، نتوان
| Paradigm است | Sing | Plur |
|---|---|---|
| Polarity=Neg | نیستند | |
| است, ست, ه | اند, اند |
ADJ
239 ADJ tokens (2% of all ADJ tokens) have a non-empty value of Number.
The most frequent other feature values with which ADJ and Number co-occurred: Degree=EMPTY (239; 100%).
ADJ tokens may have the following values of Number:
Sing(239; 100% of non-emptyNumber): آمده، ساخته، یادشده، بسته، توقیفشده، ناخواسته، انجامشده، عقبافتاده، کاسته، کشتهEMPTY(13435): اسلامی، دیگر، سیاسی، دوم، گذشته، فرهنگی، جدید، چند، بیشتر، ملی
Number seems to be lexical feature of ADJ. 100% lemmas (118) occur only with one value of Number.
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number:
NOUN –[nmod:poss]–> NOUN (9874; 70%),
VERB –[obl]–> NOUN (5360; 69%),
VERB –[nsubj]–> NOUN (3929; 82%),
NOUN –[conj]–> NOUN (3649; 86%),
NOUN –[nmod]–> NOUN (3591; 72%),
NOUN –[flat]–> NOUN (3109; 96%),
VERB –[compound:lvc]–> NOUN (3107; 69%),
VERB –[obj]–> NOUN (2081; 63%),
NOUN –[nmod:poss]–> PRON (1518; 65%),
VERB –[ccomp]–> VERB (1467; 69%).