Treebank Statistics: UD_Persian-Seraji: Features: Number
This feature is universal.
It occurs with 2 different values: Plur
, Sing
.
80282 tokens (52%) have a non-empty value of Number
.
11516 types (76%) occur at least once with a non-empty value of Number
.
7326 lemmas (69%) occur at least once with a non-empty value of Number
.
The feature is used with 5 part-of-speech tags: NOUN (57574; 38% instances), VERB (12624; 8% instances), PRON (5251; 3% instances), AUX (4594; 3% instances), ADJ (239; 0% instances).
NOUN
57574 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Number
.
NOUN
tokens may have the following values of Number
:
Plur
(8648; 15% of non-emptyNumber
): انتخابات، افراد، مواد، کسانی، کشورهای، برنامههای، اصلاحات، حدود، مطبوعات، آثارSing
(48926; 85% of non-emptyNumber
): ایران، سال، مردم، کشور، روز، کار، قرار، دست، انقلاب، تهرانEMPTY
(4): پروردگارا، الهی، حافظا
Paradigm کشور | Sing | Plur |
---|---|---|
کشور | کشورهای, کشورها, کشورهایی |
VERB
12624 VERB tokens (100% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Person=3 (10847; 86%), Mood=EMPTY (10540; 83%), VerbForm=EMPTY (10478; 83%).
VERB
tokens may have the following values of Number
:
Plur
(3541; 28% of non-emptyNumber
): کنند، میکنند، هستند، دارند، کردند، ند، کردهاند، میشوند، کنیم، داشتندSing
(9083; 72% of non-emptyNumber
): کرد، گفت، شد، شده، میشود، دارد، میکند، کرده، نیست، استEMPTY
(28): ی، نکن، بده، بفرما، کنین، ام، باشه، بره، بمان، بگذار
Paradigm کرد | Sing | Plur |
---|---|---|
Mood=Imp|Person=2 | کن | |
Mood=Imp|Person=2|Polarity=Neg | مکن, نکن | |
Mood=Sub|Person=1|Polarity=Neg|Tense=Pres | نکنیم | |
Mood=Sub|Person=1|Tense=Pres | کنم | کنیم, بکنیم, شویم |
Mood=Sub|Person=2|Polarity=Neg|Tense=Pres | نکنید, نشوید | |
Mood=Sub|Person=2|Tense=Pres | کنی, کنید | کنید, بکنید |
Mood=Sub|Person=3|Polarity=Neg|Tense=Pres | نشود | نکنند |
Mood=Sub|Person=3|Tense=Pres | کند, شود, بشود | کنند, شوند, بکنند |
Person=1|Polarity=Neg|Tense=Past | نکردم | |
Person=1|Polarity=Neg|Tense=Pres | نمیکنم | |
Person=1|Polarity=Neg|VerbForm=Part | نکردهام | |
Person=1|Tense=Past | کردم, میکردم, شدم | کردیم |
Person=1|Tense=Pres | میکنم, میشوم | میکنیم |
Person=1|VerbForm=Part | کردهام, شدهام, میشدهام | کردهایم, شدهایم |
Person=2|Polarity=Neg|Tense=Past | نکردید | |
Person=2|Polarity=Neg|Tense=Pres | نمیکنید | |
Person=2|Tense=Past | کردید | |
Person=2|Tense=Pres | میکنی | میکنید, میشوید, نمیکنید |
Person=2|VerbForm=Part | کردهای, شدهای | |
Person=3|Polarity=Neg|Tense=Past | نکردند, نشدهاند | |
Person=3|Polarity=Neg|Tense=Pres | نمیکند | نمیکنند, نمیشوند |
Person=3|Polarity=Neg|VerbForm=Part | نکرده, نشده | نشدهاند, نکردهاند |
Person=3|Tense=Past | کرد, شد, میکرد, میشد, نکرد, نشد, نمیشد, کرده | کردند, شدند, میکردند, میشدند, کنند |
Person=3|Tense=Pres | میشود, میکند, نمیشود | میکنند, میشوند, نمیشوند |
Person=3|VerbForm=Part | شده, کرده, نشده | کردهاند, شدهاند |
PRON
5251 PRON tokens (90% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (4455; 85%), PronType=Prs (3615; 69%).
PRON
tokens may have the following values of Number
:
Plur
(1303; 25% of non-emptyNumber
): ما، آنها، شان، شما، آنان، اینها، مان، ایشان، تان، اینانSing
(3948; 75% of non-emptyNumber
): خود، آن، او، این، ش، من، وی، تو، م، اشEMPTY
(556): همه، بعضی، هم، آنچه، برخی، یکدیگر، دیگران، همهٔ، هرکس، یک
Paradigm آن | Sing | Plur |
---|---|---|
Person=3|PronType=Prs | ش, اش | |
PronType=Dem | آن, دان, اش | آنها, آنان, آنها, آنهایی |
Number
seems to be lexical feature of PRON
. 93% lemmas (28) occur only with one value of Number
.
AUX
4594 AUX tokens (91% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Person=3 (4296; 94%), VerbForm=EMPTY (4038; 88%), Tense=Pres (3079; 67%).
AUX
tokens may have the following values of Number
:
Plur
(625; 14% of non-emptyNumber
): بودند، باشند، خواهند، میتوانند، نیستند، باشیم، بودهاند، نمیتوانند، میخواهند، میخواهیمSing
(3969; 86% of non-emptyNumber
): است، بود، خواهد، باشد، ست، بوده، شده، میتواند، میشود، نبودEMPTY
(434): باید، میتوان، نباید، نمیتوان، بایستی، میباید، میبایست، بتوان، باشه، نتوان
Paradigm است | Sing | Plur |
---|---|---|
Polarity=Neg | نیستند | |
است, ست, ه |
ADJ
239 ADJ tokens (2% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Degree=EMPTY (239; 100%).
ADJ
tokens may have the following values of Number
:
Sing
(239; 100% of non-emptyNumber
): آمده، ساخته، یادشده، بسته، توقیفشده، ناخواسته، انجامشده، عقبافتاده، کاسته، کشتهEMPTY
(13435): اسلامی، دیگر، سیاسی، دوم، گذشته، فرهنگی، جدید، چند، بیشتر، ملی
Number
seems to be lexical feature of ADJ
. 100% lemmas (118) occur only with one value of Number
.
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[nmod:poss]–> NOUN (9874; 70%),
VERB –[obl]–> NOUN (5360; 69%),
VERB –[nsubj]–> NOUN (3928; 82%),
NOUN –[conj]–> NOUN (3649; 86%),
NOUN –[nmod]–> NOUN (3588; 72%),
NOUN –[flat]–> NOUN (3109; 96%),
VERB –[compound:lvc]–> NOUN (3106; 69%),
VERB –[obj]–> NOUN (2080; 63%),
NOUN –[nmod:poss]–> PRON (1518; 65%),
VERB –[ccomp]–> VERB (1467; 69%).