Treebank Statistics: UD_Persian-Seraji: Features: Number
This feature is universal.
It occurs with 2 different values: Plur
, Sing
.
80282 tokens (52%) have a non-empty value of Number
.
11516 types (76%) occur at least once with a non-empty value of Number
.
5384 lemmas (71%) occur at least once with a non-empty value of Number
.
The feature is used with 5 part-of-speech tags: NOUN (57574; 38% instances), VERB (12221; 8% instances), PRON (5251; 3% instances), AUX (4997; 3% instances), ADJ (239; 0% instances).
NOUN
57574 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Number
.
NOUN
tokens may have the following values of Number
:
Plur
(8648; 15% of non-emptyNumber
): انتخابات، افراد، مواد، کسانی، کشورهای، برنامههای، اصلاحات، حدود، مطبوعات، آثارSing
(48926; 85% of non-emptyNumber
): ایران، سال، مردم، کشور، روز، کار، قرار، دست، انقلاب، تهرانEMPTY
(4): پروردگارا، الهی، حافظا
VERB
12221 VERB tokens (100% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: Person=3 (10410; 85%), VerbForm=EMPTY (10371; 85%), Mood=EMPTY (10151; 83%), Tense=Pres (6170; 50%).
VERB
tokens may have the following values of Number
:
Plur
(3367; 28% of non-emptyNumber
): کنند، میکنند، دارند، کردند، بودند، کردهاند، کنیم، داشتند، میگویند، کردیمSing
(8854; 72% of non-emptyNumber
): است، کرد، گفت، دارد، میکند، بود، کرده، کند، داشت، دادEMPTY
(20): نکن، بده، بفرما، کنین، باشه، بره، بمان، بگذار، بگردان، نشه
Paradigm کرد#کن | Sing | Plur |
---|---|---|
Mood=Imp|Person=2 | کن | |
Mood=Imp|Person=2|Polarity=Neg | مکن, نکن | |
Mood=Sub|Person=1|Polarity=Neg|Tense=Pres | نکنیم | |
Mood=Sub|Person=1|Tense=Pres | کنم | کنیم, بکنیم, شویم |
Mood=Sub|Person=2|Polarity=Neg|Tense=Pres | نکنید | |
Mood=Sub|Person=2|Tense=Pres | کنی, کنید | کنید, بکنید |
Mood=Sub|Person=3|Polarity=Neg|Tense=Pres | نشود | نکنند |
Mood=Sub|Person=3|Tense=Pres | کند, شود, بشود | کنند, بکنند, شوند |
Person=1|Polarity=Neg|Tense=Past | نکردم | |
Person=1|Polarity=Neg|Tense=Pres | نمیکنم | |
Person=1|Polarity=Neg|VerbForm=Part | نکردهام | |
Person=1|Tense=Past | کردم, میکردم | کردیم |
Person=1|Tense=Pres | میکنم | میکنیم |
Person=1|VerbForm=Part | کردهام | کردهایم |
Person=2|Polarity=Neg|Tense=Past | نکردید | |
Person=2|Polarity=Neg|Tense=Pres | نمیکنید | |
Person=2|Tense=Past | کردید | |
Person=2|Tense=Pres | میکنی | میکنید, میشوید, نمیکنید |
Person=2|VerbForm=Part | کردهای | |
Person=3|Polarity=Neg|Tense=Past | نکردند | |
Person=3|Polarity=Neg|Tense=Pres | نمیکند, نمیشود | نمیکنند |
Person=3|Polarity=Neg|VerbForm=Part | نکرده, نشده | نکردهاند |
Person=3|Tense=Past | کرد, میکرد, شد, نکرد, میشد, نشد, نمیشد, کرده | کردند, میکردند, شدند, میشدند, کنند |
Person=3|Tense=Pres | میکند, میشود, نمیشود | میکنند, میشوند |
Person=3|VerbForm=Part | کرده, شده | کردهاند |
PRON
5251 PRON tokens (90% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Reflex=EMPTY (4455; 85%), PronType=Prs (3615; 69%).
PRON
tokens may have the following values of Number
:
Plur
(1303; 25% of non-emptyNumber
): ما، آنها، شان، شما، آنان، اینها، مان، ایشان، تان، اینانSing
(3948; 75% of non-emptyNumber
): خود، آن، او، این، ش، من، وی، تو، م، اشEMPTY
(556): همه، بعضی، هم، آنچه، برخی، یکدیگر، دیگران، همهٔ، هرکس، یک
Paradigm آن | Sing | Plur |
---|---|---|
Person=3|PronType=Prs | ش, اش | |
PronType=Dem | آن, دان, اش | آنها, آنان, آنها, آنهایی |
AUX
4997 AUX tokens (92% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: Person=3 (4733; 95%), VerbForm=EMPTY (4145; 83%), Tense=Pres (2982; 60%).
AUX
tokens may have the following values of Number
:
Plur
(799; 16% of non-emptyNumber
): هستند، بودند، ند، میشوند، شدند، باشند، خواهند، شدهاند، شوند، اندSing
(4198; 84% of non-emptyNumber
): است، بود، شد، شده، میشود، خواهد، نیست، شود، باشد، ستEMPTY
(442): باید، میتوان، نباید، نمیتوان، بایستی، میباید، ی، میبایست، بتوان، باشه
Paradigm کرد#کن | Sing | Plur |
---|---|---|
Mood=Sub|Person=1|Tense=Pres | شویم | |
Mood=Sub|Person=2|Polarity=Neg|Tense=Pres | نشوید | |
Mood=Sub|Person=3|Polarity=Neg|Tense=Pres | نشود | |
Mood=Sub|Person=3|Tense=Pres | شود, بشود | شوند, کنند |
Person=1|Tense=Past | شدم | |
Person=1|Tense=Pres | میشوم | |
Person=1|VerbForm=Part | شدهام, میشدهام | شدهایم |
Person=2|Tense=Pres | میکنی | میشوید |
Person=2|VerbForm=Part | شدهای | |
Person=3|Polarity=Neg|Tense=Past | نشدهاند | |
Person=3|Polarity=Neg|Tense=Pres | نمیشوند | |
Person=3|Polarity=Neg|VerbForm=Part | نشده | نشدهاند |
Person=3|Tense=Past | شد, میشد, نشد, نمیشد, میکرد, کرد | شدند, میشدند |
Person=3|Tense=Pres | میشود, نمیشود | میشوند, نمیشوند, میکنند |
Person=3|VerbForm=Part | شده, نشده |
ADJ
239 ADJ tokens (2% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Degree=EMPTY (239; 100%).
ADJ
tokens may have the following values of Number
:
Sing
(239; 100% of non-emptyNumber
): آمده، ساخته، یادشده، بسته، توقیفشده، ناخواسته، انجامشده، عقبافتاده، کاسته، کشتهEMPTY
(13435): اسلامی، دیگر، سیاسی، دوم، گذشته، فرهنگی، جدید، چند، بیشتر، ملی
Number
seems to be lexical feature of ADJ
. 100% lemmas (75) occur only with one value of Number
.
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[nmod:poss]–> NOUN (9873; 70%),
VERB –[obl]–> NOUN (5123; 69%),
VERB –[nsubj]–> NOUN (3760; 82%),
NOUN –[conj]–> NOUN (3656; 86%),
NOUN –[nmod]–> NOUN (3526; 73%),
NOUN –[flat]–> NOUN (3108; 96%),
VERB –[compound:lvc]–> NOUN (3106; 69%),
VERB –[obj]–> NOUN (2071; 63%),
NOUN –[cop]–> AUX (1960; 87%),
NOUN –[nmod:poss]–> PRON (1519; 65%).