home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Persian-Seraji: POS Tags: VERB

There are 276 VERB lemmas (2%), 1535 VERB types (10%) and 12653 VERB tokens (8%). Out of 15 observed tags, the rank of VERB is: 5 in number of lemmas, 3 in number of types and 5 in number of tokens.

The 10 most frequent VERB lemmas: کرد، داشت، گفت، داد، هست، گرفت، آمد، رفت، بود، رسید

The 10 most frequent VERB types: کرد، گفت، شد، شده، می‌شود، دارد، می‌کند، کرده، کنند، نیست

The 10 most frequent ambiguous lemmas: کرد (VERB 4342, AUX 225, NOUN 6), داشت (VERB 1193, AUX 42), هست (VERB 659, AUX 1, NOUN 1), آمد (VERB 340, NOUN 1), بود (AUX 1355, VERB 232), است (AUX 2221, VERB 223, NOUN 1), دید (VERB 197, NOUN 4), خواست (AUX 403, VERB 110, NOUN 7), ساخت (VERB 102, NOUN 29), نمود (VERB 71, NOUN 1)

The 10 most frequent ambiguous types: کرد (VERB 497, NOUN 4, ADJ 3), شد (VERB 412, AUX 35), شده (VERB 367, AUX 71), می‌شود (VERB 357, AUX 49), دارد (VERB 335, AUX 14), است (AUX 2069, VERB 188), کند (VERB 183, ADJ 3), داشت (VERB 164, AUX 1), دارند (VERB 157, AUX 9), شود (VERB 131, AUX 20)

Morphology

The form / lemma ratio of VERB is 5.561594 (the average of all parts of speech is 1.372220).

The 1st highest number of forms (95) was observed with the lemma “کرد”: بشود, بکن, بکند, بکنم, بکنند, بکنی, بکنید, بکنیم, شد, شدم, شدند, شده, شده‌ام, شده‌اند, شده‌ای, شده‌ایم, شود, شوند, شویم, مکن, میشده‌ام, می‌شد, می‌شدند, می‌شود, می‌شوم, می‌شوند, می‌شوید, می‌کرد, می‌کردم, می‌کردند, می‌کرده, می‌کرده‌اند, می‌کردید, می‌کردیم, می‌کند, می‌کنم, می‌کنند, می‌کنه, می‌کنی, می‌کنید, می‌کنیم, نشد, نشده, نشده‌اند, نشود, نشوید, نمی‌شد, نمی‌شود, نمی‌شوند, نمی‌کرد, نمی‌کردم, نمی‌کردند, نمی‌کردیم, نمی‌کند, نمی‌کنم, نمی‌کنند, نمی‌کنی, نمی‌کنید, نمی‌کنیم, نکرد, نکردم, نکردند, نکرده, نکرده‌ام, نکرده‌اند, نکرده‌ایم, نکردی, نکردید, نکردیم, نکن, نکند, نکنند, نکنی, نکنید, نکنیم, کرد, کردم, کردند, کرده, کرده‌ام, کرده‌اند, کرده‌ای, کرده‌اید, کرده‌ایم, کردی, کردید, کردیم, کن, کند, کنم, کنند, کنی, کنید, کنیم, کنین.

The 2nd highest number of forms (49) was observed with the lemma “داد”: بده, بدهد, بدهم, بدهند, بدهی, بدهید, بدهیم, داد, دادم, دادند, داده, داده‌ام, داده‌اند, داده‌ای, داده‌ایم, دادید, دادیم, درداد, دهد, دهند, دهی, دهید, دهیم, مده, میدهد, می‌داد, می‌دادم, می‌دادند, می‌داده‌اند, می‌دادیم, می‌دهد, می‌دهم, می‌دهند, می‌دهی, می‌دهیم, نداد, نداده, ندادید, نده, ندهد, ندهم, ندهیم, نمی‌داد, نمی‌دادند, نمی‌دادید, نمی‌دهد, نمی‌دهم, نمی‌دهند, نمی‌دهیم.

The 3rd highest number of forms (49) was observed with the lemma “داشت”: بازدارند, بدار, بداریم, بردارد, برداشت, برداشتند, برمی‌دارد, برمی‌دارند, برندارد, دارد, دارم, دارند, داری, دارید, داریم, داشت, داشتم, داشتند, داشته, داشته‌اند, داشته‌ایم, داشتی, داشتید, داشتیم, می‌دارد, می‌دارند, می‌داشت, می‌داشتند, می‌داشته‌اند, ندارد, ندارم, ندارند, نداره, نداری, ندارید, نداریم, نداشت, نداشتند, نداشته, نداشته‌ام, نداشته‌اند, نداشتی, نداشتید, نداشتیم, نمی‌دارند, نمی‌داشت, نگه‌می‌دارد, وادارد, وامی‌داشت.

VERB occurs with 6 features: Number (12625; 100% instances), Person (12625; 100% instances), Tense (10320; 82% instances), VerbForm (4250; 34% instances), Mood (2103; 17% instances), Polarity (809; 6% instances)

VERB occurs with 12 feature-value pairs: Mood=Imp, Mood=Sub, Number=Plur, Number=Sing, Person=1, Person=2, Person=3, Polarity=Neg, Tense=Past, Tense=Pres, VerbForm=Fin, VerbForm=Part

VERB occurs with 52 feature combinations. The most frequent feature combination is Number=Sing|Person=3|Tense=Past (3023 tokens). Examples: کرد، گفت، شد، داشت، داد، افزود، بود، گرفت، می‌کرد، می‌شد

Relations

VERB nodes are attached to their parents using 20 different relations: root (4116; 33% instances), ccomp (2863; 23% instances), conj (2387; 19% instances), compound (1639; 13% instances), acl:relcl (991; 8% instances), advcl (490; 4% instances), parataxis (66; 1% instances), fixed (29; 0% instances), xcomp (19; 0% instances), obl (15; 0% instances), appos (11; 0% instances), nmod:poss (7; 0% instances), nmod (5; 0% instances), amod (4; 0% instances), flat (3; 0% instances), compound:lvc (2; 0% instances), dep (2; 0% instances), obj (2; 0% instances), acl (1; 0% instances), flat:foreign (1; 0% instances)

Parents of VERB nodes belong to 12 different parts of speech: VERB (4249; 34% instances), (4116; 33% instances), NOUN (2621; 21% instances), ADJ (1372; 11% instances), PRON (197; 2% instances), ADV (75; 1% instances), NUM (7; 0% instances), ADP (6; 0% instances), AUX (4; 0% instances), X (3; 0% instances), DET (2; 0% instances), CCONJ (1; 0% instances)

1700 (13%) VERB nodes are leaves.

231 (2%) VERB nodes have one child.

1035 (8%) VERB nodes have two children.

9687 (77%) VERB nodes have three or more children.

The highest child degree of a VERB node is 12.

Children of VERB nodes are attached using 35 different relations: obl (8395; 18% instances), punct (5993; 13% instances), nsubj (5936; 13% instances), compound:lvc (5086; 11% instances), mark (3760; 8% instances), obj (3713; 8% instances), ccomp (3065; 7% instances), cc (2209; 5% instances), conj (2184; 5% instances), advmod (1886; 4% instances), aux (1732; 4% instances), xcomp (910; 2% instances), advcl (643; 1% instances), aux:pass (197; 0% instances), nsubj:pass (107; 0% instances), compound:prt (98; 0% instances), case (77; 0% instances), dep (75; 0% instances), fixed (50; 0% instances), vocative (45; 0% instances), dislocated (39; 0% instances), nummod (37; 0% instances), nmod:poss (34; 0% instances), parataxis (27; 0% instances), appos (24; 0% instances), cop (23; 0% instances), cc:preconj (17; 0% instances), compound (12; 0% instances), acl:relcl (8; 0% instances), det (7; 0% instances), amod (6; 0% instances), nsubj:nc (4; 0% instances), nmod (3; 0% instances), discourse (2; 0% instances), flat:foreign (1; 0% instances)

Children of VERB nodes belong to 15 different parts of speech: NOUN (21703; 47% instances), PUNCT (5993; 13% instances), VERB (4249; 9% instances), SCONJ (3625; 8% instances), CCONJ (2243; 5% instances), ADV (2095; 5% instances), PRON (2053; 4% instances), ADJ (1990; 4% instances), AUX (1954; 4% instances), ADP (290; 1% instances), NUM (121; 0% instances), X (38; 0% instances), DET (30; 0% instances), INTJ (19; 0% instances), PART (2; 0% instances)