home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Hebrew: POS Tags: VERB

There are 1861 VERB lemmas (17%), 5551 VERB types (29%) and 15920 VERB tokens (10%). Out of 16 observed tags, the rank of VERB is: 3 in number of lemmas, 2 in number of types and 5 in number of tokens.

The 10 most frequent VERB lemmas: היה, _, הוא, אמר, אינו, יש, הגיע, אין, קיבל, עשה

The 10 most frequent VERB types: היה, יש, היו, הוא, היא, אין, היתה, אמר, אינו, יהיה

The 10 most frequent ambiguous lemmas: _ (VERB 420, NOUN 368, ADJ 231, ADP 190, ADV 174, PRON 130, CCONJ 113, AUX 99, X 86, SCONJ 47, PART 34, DET 33), הוא (PRON 5615, VERB 394), יש (VERB 214, AUX 49), אין (VERB 154, AUX 17, ADV 10, NOUN 2), עלה (VERB 113, NOUN 3), עבר (VERB 112, NOUN 46), נתן (VERB 88, PROPN 3), ידע (VERB 84, NOUN 7), בא (VERB 79, ADJ 53), מסר (VERB 71, NOUN 11)

The 10 most frequent ambiguous types: היה (VERB 423, X 1), יש (VERB 211, AUX 49), הוא (PRON 554, VERB 164), היא (PRON 198, VERB 164), אין (VERB 154, ADV 76, AUX 17, NOUN 2), עבר (VERB 54, NOUN 46), מדובר (VERB 53, ADJ 2), הם (PRON 209, VERB 49), כולל (VERB 37, ADJ 10), רבים (ADJ 49, VERB 35)

Morphology

The form / lemma ratio of VERB is 2.982805 (the average of all parts of speech is 1.709692).

The 1st highest number of forms (132) was observed with the lemma “_”: אבדנו, אבקשכם, אומרו, אינך, איננו, אירגן, אספר, בטוח, ברכתיו, גלומות, דומה, דוקלם, דיקלם, הגזה, הוותה, הטרידו, היה, היו, היזו, הייתי, הישווה, הישוותה, היתה, הנחה, העמידני, הפכוהו, הציבו, התחממה, התעקבה, התקים, חדל, חוללה, חיה, חסרות, חשודים, יהיה, יהיו, יחוללו, ייצגו, ייתלוו, יכלו, ינטש, יעבירם, ירבו, ירוקנו, ישנה, יתנו, לאבטח, לבכות, לבלות, לגבות, לגלות, לגשת, לדמיין, להדק, להחיות, להפנות, להקנות, להראות, להרוג, להתחיל, לזכות, לחיות, לחקותו, לכבות, לכלות, לכפות, למנות, לסוכך, לעודדם, לענות, לפנות, לפצותו, לצוות, לצפות, לקבלו, לקחת, לקרות, לראותו, לשבות, לשנות, לשתות, לתכנן, מאוהב, מבוסס, מבוססות, מבוססים, מבוססת, מודה, מודע, מוכר, מונה, מידרדר, מכופפת, מכנה, מסולפים, מסקרן, מעורב, מקובלים, מקובלת, משנה, משתנה, מת, נבוך, נגחו, נחוץ, נטש, ניבא, ניבאו, ניצב, ניצבות, ניצל, ניצלה, ניצלו, נשקרה, עדה, עוינת, עולה, עושה, ער, עשה, עשו, פיקפק, פעילות, קיים, רואה, שובה, שונה, שקוע, תהיה, תמה, תפוס.

The 2nd highest number of forms (16) was observed with the lemma “נתן”: ייתן, יתן, ליתן, לתת, נותן, נותנות, נותנים, נותנת, ניתן, נתון, נתונה, נתונות, נתונים, נתן, נתנה, נתנו.

The 3rd highest number of forms (15) was observed with the lemma “אמר”: אומר, אומרות, אומרים, אומרת, אמור, אמר, אמרה, אמרו, אמרנו, אמרת, אמרתי, יאמר, יאמרו, לומר, תאמר.

VERB occurs with 13 features: Gender (12823; 81% instances), Number (12823; 81% instances), Person (12814; 80% instances), HebBinyan (12510; 79% instances), Voice (11415; 72% instances), Tense (7804; 49% instances), VerbForm (7634; 48% instances), VerbType (1815; 11% instances), Polarity (1811; 11% instances), HebExistential (368; 2% instances), HebSource (314; 2% instances), Definite (84; 1% instances), Mood (52; 0% instances)

VERB occurs with 31 feature-value pairs: Definite=Cons, Gender=Fem, Gender=Fem,Masc, Gender=Masc, HebBinyan=HIFIL, HebBinyan=HITPAEL, HebBinyan=HUFAL, HebBinyan=NIFAL, HebBinyan=PAAL, HebBinyan=PIEL, HebBinyan=PUAL, HebExistential=True, HebSource=ConvUncertainHead, HebSource=ConvUncertainLabel, Mood=Imp, Number=Plur, Number=Sing, Person=1, Person=1,2,3, Person=2, Person=3, Polarity=Neg, Polarity=Pos, Tense=Fut, Tense=Past, VerbForm=Inf, VerbForm=Part, VerbType=Cop, Voice=Act, Voice=Mid, Voice=Pass

VERB occurs with 283 feature combinations. The most frequent feature combination is HebBinyan=PAAL|VerbForm=Inf|Voice=Act (774 tokens). Examples: לעשות, לתת, למנוע, למצוא, לומר, לצאת, לחזור, לפגוע, לגרום, לעמוד

Relations

VERB nodes are attached to their parents using 32 different relations: root (4736; 30% instances), acl:relcl (2466; 15% instances), conj (1961; 12% instances), xcomp (1747; 11% instances), advcl (859; 5% instances), aux (772; 5% instances), ccomp (659; 4% instances), cop (387; 2% instances), dep (350; 2% instances), advmod (340; 2% instances), obl (336; 2% instances), acl:inf (281; 2% instances), amod (222; 1% instances), iobj (125; 1% instances), acl (119; 1% instances), parataxis (91; 1% instances), appos (77; 0% instances), nmod (76; 0% instances), conj:discourse (72; 0% instances), nsubj (64; 0% instances), compound:smixut (53; 0% instances), obj (32; 0% instances), case (30; 0% instances), advmod:inf (16; 0% instances), csubj (12; 0% instances), fixed (12; 0% instances), nmod:poss (9; 0% instances), det:quant (7; 0% instances), nsubj:cop (4; 0% instances), advmod:phrase (2; 0% instances), det (2; 0% instances), dislocated (1; 0% instances)

Parents of VERB nodes belong to 16 different parts of speech: VERB (5108; 32% instances), (4736; 30% instances), NOUN (3774; 24% instances), AUX (1065; 7% instances), ADJ (525; 3% instances), PROPN (244; 2% instances), ADV (215; 1% instances), PRON (149; 1% instances), CCONJ (27; 0% instances), SCONJ (20; 0% instances), ADP (14; 0% instances), DET (14; 0% instances), X (12; 0% instances), NUM (10; 0% instances), PUNCT (6; 0% instances), INTJ (1; 0% instances)

1954 (12%) VERB nodes are leaves.

1730 (11%) VERB nodes have one child.

2859 (18%) VERB nodes have two children.

9377 (59%) VERB nodes have three or more children.

The highest child degree of a VERB node is 50.

Children of VERB nodes are attached using 37 different relations: punct (9067; 19% instances), obl (7472; 16% instances), nsubj (6963; 15% instances), mark (4258; 9% instances), obj (3873; 8% instances), iobj (3491; 7% instances), advmod (2757; 6% instances), cc (1956; 4% instances), conj (1943; 4% instances), xcomp (982; 2% instances), dep (973; 2% instances), ccomp (879; 2% instances), advcl (858; 2% instances), case (707; 1% instances), parataxis (320; 1% instances), obl:tmod (218; 0% instances), det:def (186; 0% instances), advmod:phrase (148; 0% instances), aux (145; 0% instances), conj:discourse (84; 0% instances), compound:smixut (78; 0% instances), nsubj:cop (69; 0% instances), cop (62; 0% instances), amod (29; 0% instances), det (27; 0% instances), aux:q (26; 0% instances), case:acc (23; 0% instances), appos (18; 0% instances), case:gen (14; 0% instances), acl:relcl (13; 0% instances), csubj (12; 0% instances), nummod (7; 0% instances), dislocated (6; 0% instances), acl (5; 0% instances), nmod:poss (3; 0% instances), flat:name (2; 0% instances), fixed (1; 0% instances)

Children of VERB nodes belong to 16 different parts of speech: NOUN (17288; 36% instances), PUNCT (9198; 19% instances), VERB (5108; 11% instances), SCONJ (4340; 9% instances), ADV (2841; 6% instances), PRON (2756; 6% instances), CCONJ (2121; 4% instances), PROPN (1923; 4% instances), ADP (676; 1% instances), ADJ (420; 1% instances), NUM (345; 1% instances), DET (295; 1% instances), AUX (246; 1% instances), X (71; 0% instances), PART (46; 0% instances), INTJ (1; 0% instances)