home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Hebrew-HTB: POS Tags: VERB

There are 1856 VERB lemmas (17%), 5528 VERB types (29%) and 14276 VERB tokens (9%). Out of 15 observed tags, the rank of VERB is: 3 in number of lemmas, 2 in number of types and 5 in number of tokens.

The 10 most frequent VERB lemmas: אמר, _, יש, הגיע, אין, היה, קיבל, עשה, עלה, עבר

The 10 most frequent VERB types: יש, אין, אמר, אומר, עבר, מדובר, נראה, חולים, היו, לעשות

The 10 most frequent ambiguous lemmas: _ (NOUN 368, AUX 268, VERB 251, ADJ 231, ADV 177, CCONJ 110, X 86, PRON 57, SCONJ 47, DET 33), יש (VERB 214, AUX 49), אין (VERB 154, AUX 17, ADV 10, NOUN 2), היה (AUX 778, VERB 148), עלה (VERB 113, NOUN 3), עבר (VERB 112, NOUN 46), נתן (VERB 88, PROPN 3), ידע (VERB 84, NOUN 7), בא (VERB 79, ADJ 53), מסר (VERB 71, NOUN 11)

The 10 most frequent ambiguous types: יש (VERB 211, AUX 49), אין (VERB 154, ADV 76, AUX 17, NOUN 2), עבר (VERB 54, NOUN 46), מדובר (VERB 53, ADJ 2), היו (AUX 139, VERB 46), היה (AUX 385, VERB 38, X 1), כולל (VERB 37, ADJ 10), רבים (ADJ 49, VERB 35), עלה (VERB 32, NOUN 1), עולה (NOUN 37, VERB 30)

Morphology

The form / lemma ratio of VERB is 2.978448 (the average of all parts of speech is 1.701251).

The 1st highest number of forms (129) was observed with the lemma “_”: אבדנו, אבקשכם, אומרו, אירגן, אספר, בטוח, ברכתיו, גלומות, דומה, דוקלם, דיקלם, הגזה, הוותה, הטרידו, היה, היו, היזו, הישווה, הישוותה, היתה, הנחה, העמידני, הפכוהו, הציבו, התחממה, התעקבה, התקים, חדל, חוללה, חיה, חסרות, חשודים, יהיה, יהיו, יחוללו, ייצגו, ייתלוו, יכלו, ינטש, יעבירם, ירבו, ירוקנו, ישנה, יתנו, לאבטח, לבכות, לבלות, לגבות, לגלות, לגשת, לדמיין, להדק, להחיות, להפנות, להקנות, להראות, להרוג, להתחיל, לזכות, לחיות, לחקותו, לכבות, לכלות, לכפות, למנות, לסוכך, לעודדם, לענות, לפנות, לפצותו, לצוות, לצפות, לקבלו, לקחת, לקרות, לראותו, לשבות, לשנות, לשתות, לתכנן, מאוהב, מבוסס, מבוססות, מבוססים, מבוססת, מודה, מודע, מוכר, מונה, מידרדר, מכופפת, מכנה, מסולפים, מסקרן, מעורב, מקובלים, מקובלת, משנה, משתנה, מת, נבוך, נגחו, נחוץ, נטש, ניבא, ניבאו, ניצב, ניצבות, ניצל, ניצלה, ניצלו, נשקרה, עדה, עוינת, עולה, עושה, ער, עשה, עשו, פיקפק, פעילות, קיים, רואה, שובה, שונה, שקוע, תהיה, תמה, תפוס.

The 2nd highest number of forms (16) was observed with the lemma “נתן”: ייתן, יתן, ליתן, לתת, נותן, נותנות, נותנים, נותנת, ניתן, נתון, נתונה, נתונות, נתונים, נתן, נתנה, נתנו.

The 3rd highest number of forms (15) was observed with the lemma “אמר”: אומר, אומרות, אומרים, אומרת, אמור, אמר, אמרה, אמרו, אמרנו, אמרת, אמרתי, יאמר, יאמרו, לומר, תאמר.

VERB occurs with 12 features: HebBinyan (12510; 88% instances), Voice (11415; 80% instances), Gender (11272; 79% instances), Number (11272; 79% instances), Person (11263; 79% instances), Tense (6972; 49% instances), VerbForm (6829; 48% instances), HebExistential (539; 4% instances), HebSource (305; 2% instances), Polarity (171; 1% instances), Definite (84; 1% instances), Mood (49; 0% instances)

VERB occurs with 29 feature-value pairs: Definite=Cons, Gender=Fem, Gender=Fem,Masc, Gender=Masc, HebBinyan=HIFIL, HebBinyan=HITPAEL, HebBinyan=HUFAL, HebBinyan=NIFAL, HebBinyan=PAAL, HebBinyan=PIEL, HebBinyan=PUAL, HebExistential=True, HebSource=ConvUncertainHead, HebSource=ConvUncertainLabel, Mood=Imp, Number=Plur, Number=Sing, Person=1, Person=1,2,3, Person=2, Person=3, Polarity=Pos, Tense=Fut, Tense=Past, VerbForm=Inf, VerbForm=Part, Voice=Act, Voice=Mid, Voice=Pass

VERB occurs with 259 feature combinations. The most frequent feature combination is HebBinyan=PAAL|VerbForm=Inf|Voice=Act (774 tokens). Examples: לעשות, לתת, למנוע, למצוא, לומר, לצאת, לחזור, לפגוע, לגרום, לעמוד

Relations

VERB nodes are attached to their parents using 25 different relations: root (4978; 35% instances), acl:relcl (2532; 18% instances), conj (2030; 14% instances), advcl (1065; 7% instances), xcomp (1037; 7% instances), ccomp (726; 5% instances), acl (414; 3% instances), dep (347; 2% instances), obl (330; 2% instances), amod (222; 2% instances), parataxis (165; 1% instances), appos (75; 1% instances), nsubj (64; 0% instances), nmod (59; 0% instances), compound:smixut (53; 0% instances), aux (49; 0% instances), obj (32; 0% instances), case (30; 0% instances), advmod (19; 0% instances), fixed (15; 0% instances), csubj (12; 0% instances), nmod:poss (9; 0% instances), det (7; 0% instances), nsubj:cop (5; 0% instances), dislocated (1; 0% instances)

Parents of VERB nodes belong to 16 different parts of speech: (4978; 35% instances), VERB (4807; 34% instances), NOUN (3284; 23% instances), AUX (281; 2% instances), ADJ (264; 2% instances), ADV (210; 1% instances), PROPN (208; 1% instances), PRON (138; 1% instances), CCONJ (30; 0% instances), SCONJ (21; 0% instances), ADP (14; 0% instances), DET (14; 0% instances), X (12; 0% instances), NUM (8; 0% instances), PUNCT (6; 0% instances), INTJ (1; 0% instances)

448 (3%) VERB nodes are leaves.

1390 (10%) VERB nodes have one child.

3015 (21%) VERB nodes have two children.

9423 (66%) VERB nodes have three or more children.

The highest child degree of a VERB node is 50.

Children of VERB nodes are attached using 35 different relations: obl (10804; 23% instances), punct (9000; 19% instances), nsubj (6925; 15% instances), mark (4193; 9% instances), obj (3858; 8% instances), advmod (3075; 6% instances), conj (1928; 4% instances), cc (1916; 4% instances), xcomp (1060; 2% instances), advcl (984; 2% instances), dep (927; 2% instances), ccomp (879; 2% instances), aux (620; 1% instances), case (502; 1% instances), parataxis (207; 0% instances), cop (205; 0% instances), det:def (186; 0% instances), compound:smixut (78; 0% instances), nsubj:cop (60; 0% instances), amod (29; 0% instances), det (26; 0% instances), mark:q (25; 0% instances), case:acc (23; 0% instances), compound:affix (22; 0% instances), appos (17; 0% instances), case:gen (14; 0% instances), acl:relcl (13; 0% instances), csubj (11; 0% instances), fixed (7; 0% instances), nummod (7; 0% instances), dislocated (6; 0% instances), acl (5; 0% instances), flat:name (3; 0% instances), nmod:poss (3; 0% instances), discourse (1; 0% instances)

Children of VERB nodes belong to 15 different parts of speech: NOUN (17125; 36% instances), PUNCT (9128; 19% instances), VERB (4807; 10% instances), SCONJ (4081; 9% instances), ADV (2948; 6% instances), PRON (2736; 6% instances), CCONJ (1952; 4% instances), PROPN (1897; 4% instances), AUX (1139; 2% instances), ADP (715; 2% instances), ADJ (387; 1% instances), NUM (340; 1% instances), DET (294; 1% instances), X (69; 0% instances), INTJ (1; 0% instances)