Treebank Statistics: UD_Persian-PerDT: Features: Number
This feature is universal.
It occurs with 2 different values: Plur, Sing.
281769 tokens (56%) have a non-empty value of Number.
28024 types (83%) occur at least once with a non-empty value of Number.
16687 lemmas (78%) occur at least once with a non-empty value of Number.
The feature is used with 10 part-of-speech tags: NOUN (167688; 33% instances), VERB (54276; 11% instances), PROPN (22238; 4% instances), PRON (20256; 4% instances), AUX (16749; 3% instances), NUM (517; 0% instances), ADP (41; 0% instances), PUNCT (2; 0% instances), ADJ (1; 0% instances), SCONJ (1; 0% instances).
NOUN
167688 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Number.
NOUN tokens may have the following values of Number:
Plur(28260; 17% of non-emptyNumber): مردم، همهٔ، تمام، همه، کسانی، دیگران، افراد، حقوق، بسیاری، کشورهایSing(139428; 83% of non-emptyNumber): سال، کار، کسی، دست، روز، خدا، سر، صورت، کشور، بارEMPTY(526): کنار، حدود، دهها، فراموش، اسلام، صدها، میلیونها، وقتی، پشت، میلیاردها
| Paradigm کس | Sing | Plur |
|---|---|---|
| کسی, کس, کسانی, که | کسانی, کسان |
VERB
54276 VERB tokens (100% of all VERB tokens) have a non-empty value of Number.
The most frequent other feature values with which VERB and Number co-occurred: Voice=Act (50981; 94%), VerbForm=EMPTY (46001; 85%), Person=3 (40708; 75%).
VERB tokens may have the following values of Number:
Plur(17642; 33% of non-emptyNumber): کنید، میکنند، کردهاند، کردند، کنند، میکنیم، میکردند، هستند، کنیم، میکنیدSing(36634; 67% of non-emptyNumber): کرد، کرده، میکند، شد، کند، شده، میکرد، میشود، داد، داشتEMPTY(45): باید، نمیشود، میشود، میشد، نباید، میتوان، نمیشد، آید، بایست، بایستی
| Paradigm کرد | Sing | Plur |
|---|---|---|
| Mood=Imp|Person=1|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | نکن | نکنیم |
| Mood=Imp|Person=1|Tense=Pres|VerbForm=Fin|Voice=Act | کنیم | |
| Mood=Imp|Person=2|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | نکن, نشو | نکنید |
| Mood=Imp|Person=2|Tense=Pres|VerbForm=Fin|Voice=Act | کن, بکن, مکن, کرده, برمکن, شو, مشو, کنید | کنید, بکنید, کرده, برشوید, درکنید, مکنید |
| Mood=Imp|Person=3|Polarity=Neg|Tense=Pres|VerbForm=Fin|Voice=Act | نکند | |
| Mood=Imp|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act | کن, کرده | کنند |
| Person=1|Polarity=Neg|Tense=Past|Voice=Act | نکردم | نکردیم |
| Person=1|Polarity=Neg|Tense=Pres|Voice=Act | نمیکنم, نکنم | نمیکنیم |
| Person=1|Polarity=Neg|VerbForm=Part|Voice=Act | نکردهام, نکرده | نکردهایم |
| Person=1|Polarity=Neg|Voice=Act | نمیکردم, نکنم | نکنیم, نمیکردیم |
| Person=1|Tense=Past|Voice=Act | کردم, شدم, کرد, کرده | کردیم, کرده, شدیم, درکردیم, فروکردیم |
| Person=1|Tense=Pres|Voice=Act | میکنم, کنم, میشوم, کردم, کرده | میکنیم, کرده, میشویم |
| Person=1|Tense=Pres|Voice=Pass | فرومیشویم | |
| Person=1|VerbForm=Part|Voice=Act | کردهام, کرده | کردهایم, کرده, کردهام |
| Person=1|Voice=Act | کنم, میکردم, بکنم, شوم, کرده | کنیم, میکردیم, بکنیم, کرده, شویم |
| Person=1|Voice=Pass | فرومیشدیم | |
| Person=2|Polarity=Neg|Tense=Past|Voice=Act | نکردی | نکردید |
| Person=2|Polarity=Neg|Tense=Pres|Voice=Act | نمیکنی | نمیکنید, نکنید |
| Person=2|Polarity=Neg|VerbForm=Part|Voice=Act | نکردهای | نکردهاید |
| Person=2|Polarity=Neg|Voice=Act | نکنی | نکنید, نمیکردید |
| Person=2|Tense=Past|Voice=Act | کردی | کردید, شدید, کرده, کردیم |
| Person=2|Tense=Pres|Voice=Act | میکنی, کن | میکنید, کنید, بکنید, میکنند, کرده |
| Person=2|VerbForm=Part|Voice=Act | کردهای, برکردهای | کردهاید, کرده, درکردهاید |
| Person=2|Voice=Act | کنی, بکنی, میکردی, شوی, کرده | کنید, بکنید, میکردید, کرده, بشوید, بکنیم, کنند, کنیم |
| Person=3|Polarity=Neg|Tense=Past|VerbForm=Part|Voice=Act | نکرده | |
| Person=3|Polarity=Neg|Tense=Past|Voice=Act | نکرده, نکرد, نمیکرده, نکردی | نکردند, نکردیم |
| Person=3|Polarity=Neg|Tense=Past|Voice=Pass | نشد | |
| Person=3|Polarity=Neg|Tense=Pres|Voice=Act | نمیکند, نمیشود, نمیکنم | نمیکنند, نشوند, نکنند |
| Person=3|Polarity=Neg|VerbForm=Part|Voice=Act | نکرده, نشده, نکردهاند | نکردهاند |
| Person=3|Polarity=Neg|Voice=Act | نکند, نمیکرد, نکرده, نکنم | نکنند, نمیکردند, نشوند, نکرده |
| Person=3|Polarity=Neg|Voice=Pass | نشود | |
| Person=3|Tense=Past | شد | |
| Person=3|Tense=Past|VerbForm=Part|Voice=Act | کرده, شده, فروکرده | |
| Person=3|Tense=Past|Voice=Act | کرد, کرده, شد, میکرده, کردم, شده, فروکرده, کند, درکرده, برکرد, برکرده, فروکرد | کردند, میکردهاند, کرده, شدند, کردیم, فروشدند, میشدهاند, کرد |
| Person=3|Tense=Past|Voice=Pass | شد | |
| Person=3|Tense=Pres|Voice=Act | میکند, کرده, میشود, میکنم, شده, فرومیکند, میشوند, میگردد | میکنند, کرده, میکنیم, میشوند, کنند, برمیکنند, فرومیکنند, میکنید |
| Person=3|Tense=Pres|Voice=Pass | میشود | |
| Person=3|VerbForm=Part|Voice=Act | کرده, شده, کردهاند, کردهاست | کردهاند, کرده, کردهایم, شدهاند, میشدهاند, کردهاید |
| Person=3|VerbForm=Part|Voice=Pass | شده, فروکرده | |
| Person=3|Voice=Act | کند, میکرد, بکند, کرده, کنم, شود, میکند, برمیشد, برمیشود, بکنید, دربکند, درمیکرد, شده, فروکند, میشد, میکردم, کنی | کنند, میکردند, بکنند, کرده, کنیم, میکنند, کنید, بشوند, بکنیم, فرومیکردند |
| Person=3|Voice=Pass | شود, میشد | فرومیشدند |
| Voice=Act | کنم |
PROPN
22238 PROPN tokens (94% of all PROPN tokens) have a non-empty value of Number.
PROPN tokens may have the following values of Number:
Plur(685; 3% of non-emptyNumber): ملل، طالبان، امور، ایالات، علوم، منافقین، پاسداران، اطلاعات، دختران، تیمهایSing(21553; 97% of non-emptyNumber): ایران، امام، آمریکا، قرآن، علی، جهان، تهران، پیامبر، حسین، افغانستانEMPTY(1495): اسلامی، ملی، مرکزی، اکرم، صهیونیستی، معظم، بینالمللی، عالی، آزاد، جنوبی
| Paradigm امام | Sing | Plur |
|---|---|---|
| امام | ائمهٔ |
Number seems to be lexical feature of PROPN. 97% lemmas (5452) occur only with one value of Number.
PRON
20256 PRON tokens (84% of all PRON tokens) have a non-empty value of Number.
The most frequent other feature values with which PRON and Number co-occurred: PronType=Prs (16853; 83%).
PRON tokens may have the following values of Number:
Plur(7230; 36% of non-emptyNumber): ما، آنها، شما، شان، تان، مان، آنان، خود، ایشان، آنهاSing(13026; 64% of non-emptyNumber): آن، او، ش، این، من، م، تو، ت، خود، ویEMPTY(3884): خود، هم، خویش، یکدیگر، کجا، همدیگر، چه، آن، چنین، خویشتن
| Paradigm خود | Sing | Plur |
|---|---|---|
| _ | خود | خود |
| Person=1|PronType=Prs | خود | |
| Person=3|PronType=Prs | خود | خود |
AUX
16749 AUX tokens (91% of all AUX tokens) have a non-empty value of Number.
The most frequent other feature values with which AUX and Number co-occurred: Person=3 (14043; 84%), Mood=EMPTY (10808; 65%), VerbForm=EMPTY (10808; 65%).
AUX tokens may have the following values of Number:
Plur(3977; 24% of non-emptyNumber): خواهند، بودند، باشند، خواهیم، باشید، بودیم، خواهید، باشیم، بودید، نخواهندSing(12772; 76% of non-emptyNumber): است، بود، خواهد، باشد، خواهم، ست، بودم، نبود، باشم، نخواهدEMPTY(1747): باید، میتوان، نباید، نمیتوان، بایستی، بتوان، میبایست، میشود، میباید، نتوان
| Paradigm بود | Sing | Plur |
|---|---|---|
| Mood=Sub|Person=1|Tense=Pres|VerbForm=Fin | باشم | باشیم |
| Mood=Sub|Person=2|Tense=Pres|VerbForm=Fin | باشی | باشید |
| Mood=Sub|Person=3|Tense=Pres|VerbForm=Fin | باشد | باشند |
| Person=1 | بودم, باشم, بودهام, میباشم, بوده | بودیم, باشیم, بودهایم, میبودیم |
| Person=1|Polarity=Neg | نبودم, نباشم, نبودهام | نباشیم, نبودهایم, نبودیم |
| Person=1|Tense=Past | بودم | بودیم |
| Person=2 | باش, باشی, بودی, بودهای | باشید, بودید, میباشید, بوده, بودهاید |
| Person=2|Polarity=Neg | نباشی, نباش, نبودی | نباشید |
| Person=2|Tense=Past | بودی | بودید |
| Person=2|Tense=Pres | باش | |
| Person=3 | بود, باشد, بوده, میباشد, باد, بودم, میبود, مباد, باشم, باشی, بودهام, بودی, شد, مباش | بودند, باشند, بودهاند, بوده, میباشند, باشید, شوند |
| Person=3|Polarity=Neg | نبود, نباشد, نبوده, نمیباشد, نمیبود | نبودند, نباشند, نبودهاند, نبودهایم, نمیباشند |
| Person=3|Polarity=Neg|Tense=Past | بود | |
| Person=3|Tense=Past | بود, بوده | بودند |
NUM
517 NUM tokens (8% of all NUM tokens) have a non-empty value of Number.
NUM tokens may have the following values of Number:
Plur(11; 2% of non-emptyNumber): هزار، میلیونSing(506; 98% of non-emptyNumber): هزار، میلیون، میلیارد، صد، 251، 950، بیلیونEMPTY(5664): یک، دو، سه، چهار، 10، 20، پنج، 5، 2، هزار
| Paradigm هزار | Sing | Plur |
|---|---|---|
| هزار | هزار |
ADP
41 ADP tokens (0% of all ADP tokens) have a non-empty value of Number.
ADP tokens may have the following values of Number:
Sing(41; 100% of non-emptyNumber): جلوی، حدود، پیشEMPTY(71046): را، به، در، از، با، برای، بر، تا، روی، پس
PUNCT
2 PUNCT tokens (0% of all PUNCT tokens) have a non-empty value of Number.
PUNCT tokens may have the following values of Number:
Sing(2; 100% of non-emptyNumber): سطح، چیزیEMPTY(44334): .، ،، ؟، (، )، “، !، «، »، :
ADJ
1 ADJ tokens (0% of all ADJ tokens) have a non-empty value of Number.
ADJ tokens may have the following values of Number:
Sing(1; 100% of non-emptyNumber): نوزادیEMPTY(35349): پیدا، دیگر، بیشتر، بیش، اسلامی، جدید، بزرگ، ممکن، مختلف، زیادی
SCONJ
1 SCONJ tokens (0% of all SCONJ tokens) have a non-empty value of Number.
SCONJ tokens may have the following values of Number:
Sing(1; 100% of non-emptyNumber): اگرEMPTY(13776): که، اگر، تا، چون، زیرا، چنانچه، چرا، اگرچه، گرچه، وگرنه
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number:
NOUN –[nmod]–> NOUN (29038; 71%),
VERB –[compound:lvc]–> NOUN (20344; 67%),
VERB –[obl]–> NOUN (15695; 65%),
VERB –[nsubj]–> NOUN (13197; 83%),
VERB –[obj]–> NOUN (10118; 59%),
NOUN –[conj]–> NOUN (8254; 88%),
VERB –[obl:arg]–> NOUN (8244; 61%),
VERB –[aux]–> AUX (7763; 61%),
VERB –[conj]–> VERB (7199; 87%),
PROPN –[flat:name]–> PROPN (6167; 78%).