home edit page issue tracker

This page pertains to UD version 2.

Treebank Statistics: UD_Hebrew-HTB: POS Tags: VERB

There are 1854 VERB lemmas (17%), 5537 VERB types (29%) and 14288 VERB tokens (9%). Out of 15 observed tags, the rank of VERB is: 3 in number of lemmas, 2 in number of types and 5 in number of tokens.

The 10 most frequent VERB lemmas: אמר, _, יש, הגיע, אין, היה, קיבל, עשה, עלה, עבר

The 10 most frequent VERB types: יש, אין, אמר, יכול, אומר, נראה, עבר, מדובר, היו, חולים

The 10 most frequent ambiguous lemmas: _ (NOUN 365, VERB 326, ADJ 230, ADV 192, AUX 169, CCONJ 109, X 76, PRON 57, SCONJ 46, DET 33), יש (VERB 213, ADV 49), אין (VERB 152, ADV 26, NOUN 2), היה (AUX 774, VERB 146), עלה (VERB 113, NOUN 3), עבר (VERB 111, NOUN 45), נתן (VERB 85, PROPN 3), יכול (VERB 80, ADV 6), בא (VERB 79, ADJ 53), ידע (VERB 79, NOUN 7)

The 10 most frequent ambiguous types: יש (VERB 210, ADV 49), אין (VERB 152, ADV 92, NOUN 2), עבר (VERB 53, NOUN 45), מדובר (VERB 52, ADJ 2), היו (AUX 139, VERB 46), חולים (VERB 45, NOUN 1), היה (AUX 382, VERB 38, X 1), כולל (VERB 37, ADJ 10), עלה (VERB 32, NOUN 1), עולה (NOUN 34, VERB 30)

Morphology

The form / lemma ratio of VERB is 2.986516 (the average of all parts of speech is 1.702584).

The 1st highest number of forms (134) was observed with the lemma “_”: אבדנו, אבקשכם, אומרו, אירגן, אספר, בטוח, ברכתיו, גלומות, דומה, דוקלם, דיקלם, הגזה, הטרידו, היה, היו, היזו, הישווה, הישוותה, היתה, הנחה, העמידני, הפכוהו, הציבו, התחממה, התעקבה, התקים, חדל, חוללה, חיה, חסרות, חשודים, יהיה, יהיו, יחוללו, ייצגו, ייתלוו, יכול, יכולה, יכלו, ינטש, יעבירם, ירבו, ירוקנו, ישנה, יתנו, לאבטח, לבכות, לבלות, לגבות, לגלות, לגשת, לדמיין, להדק, להחיות, להפנות, להקנות, להראות, להרוג, להתחיל, לזכות, לחיות, לחקותו, לכבות, לכלות, לכפות, למנות, לסוכך, לעודדם, לענות, לפנות, לפצותו, לצוות, לצפות, לקבלו, לקחת, לקרות, לראותו, לשבות, לשנות, לשתות, לתכנן, מאוהב, מאפשר, מאפשרות, מאפשרים, מאפשרת, מבוסס, מבוססות, מבוססים, מבוססת, מודע, מוכר, מונה, מידרדר, מכופפת, מכנה, מסולפים, מסקרן, מעורב, מקובלים, מקובלת, משנה, משתנה, מת, נבוך, נגחו, נחוץ, נטש, ניבא, ניבאו, ניצב, ניצבות, ניצל, ניצלה, ניצלו, נשקרה, עדה, עוינת, עולה, עושה, ער, עשה, עשו, פיקפק, פעילות, קיים, רואה, שובה, שונה, שקוע, תהיה, תוכל, תמה, תפוס.

The 2nd highest number of forms (16) was observed with the lemma “נתן”: ייתן, יתן, ליתן, לתת, נותן, נותנות, נותנים, נותנת, ניתן, נתון, נתונה, נתונות, נתונים, נתן, נתנה, נתנו.

The 3rd highest number of forms (15) was observed with the lemma “אמר”: אומר, אומרות, אומרים, אומרת, אמור, אמר, אמרה, אמרו, אמרנו, אמרת, אמרתי, יאמר, יאמרו, לומר, תאמר.

VERB occurs with 11 features: HebBinyan (12382; 87% instances), Gender (11302; 79% instances), Number (11302; 79% instances), Voice (11299; 79% instances), Person (11273; 79% instances), Tense (6968; 49% instances), VerbForm (6847; 48% instances), HebExistential (534; 4% instances), Polarity (169; 1% instances), Definite (84; 1% instances), Mood (49; 0% instances)

VERB occurs with 27 feature-value pairs: Definite=Cons, Gender=Fem, Gender=Fem,Masc, Gender=Masc, HebBinyan=HIFIL, HebBinyan=HITPAEL, HebBinyan=HUFAL, HebBinyan=NIFAL, HebBinyan=PAAL, HebBinyan=PIEL, HebBinyan=PUAL, HebExistential=Yes, Mood=Imp, Number=Plur, Number=Sing, Person=1, Person=1,2,3, Person=2, Person=3, Polarity=Pos, Tense=Fut, Tense=Past, VerbForm=Inf, VerbForm=Part, Voice=Act, Voice=Mid, Voice=Pass

VERB occurs with 186 feature combinations. The most frequent feature combination is HebBinyan=PAAL|VerbForm=Inf|Voice=Act (799 tokens). Examples: לעשות, לתת, למנוע, למצוא, לומר, לצאת, לפגוע, לחזור, לעמוד, לפעול

Relations

VERB nodes are attached to their parents using 22 different relations: root (4746; 33% instances), acl:relcl (2444; 17% instances), conj (1947; 14% instances), xcomp (1565; 11% instances), advcl (1050; 7% instances), ccomp (675; 5% instances), acl (414; 3% instances), dep (331; 2% instances), obl (322; 2% instances), amod (222; 2% instances), parataxis (155; 1% instances), csubj (102; 1% instances), appos (73; 1% instances), nmod (58; 0% instances), compound:smixut (51; 0% instances), nsubj (46; 0% instances), obj (33; 0% instances), case (29; 0% instances), fixed (12; 0% instances), nmod:poss (8; 0% instances), nsubj:cop (4; 0% instances), dislocated (1; 0% instances)

Parents of VERB nodes belong to 15 different parts of speech: VERB (4792; 34% instances), (4746; 33% instances), NOUN (3142; 22% instances), ADJ (657; 5% instances), ADV (484; 3% instances), PROPN (208; 1% instances), PRON (136; 1% instances), AUX (32; 0% instances), CCONJ (26; 0% instances), SCONJ (17; 0% instances), DET (15; 0% instances), ADP (14; 0% instances), X (10; 0% instances), NUM (8; 0% instances), INTJ (1; 0% instances)

446 (3%) VERB nodes are leaves.

1655 (12%) VERB nodes have one child.

2845 (20%) VERB nodes have two children.

9342 (65%) VERB nodes have three or more children.

The highest child degree of a VERB node is 50.

Children of VERB nodes are attached using 35 different relations: obl (10882; 23% instances), punct (9227; 19% instances), nsubj (6979; 15% instances), mark (4253; 9% instances), obj (3860; 8% instances), advmod (2749; 6% instances), conj (1935; 4% instances), cc (1887; 4% instances), xcomp (1235; 3% instances), advcl (1004; 2% instances), ccomp (867; 2% instances), dep (856; 2% instances), case (561; 1% instances), cop (417; 1% instances), det (208; 0% instances), parataxis (200; 0% instances), compound:smixut (78; 0% instances), nsubj:cop (36; 0% instances), nsubj:outer (35; 0% instances), amod (28; 0% instances), mark:q (26; 0% instances), case:acc (23; 0% instances), compound:affix (22; 0% instances), appos (17; 0% instances), case:gen (13; 0% instances), csubj (11; 0% instances), acl:relcl (10; 0% instances), nummod (7; 0% instances), acl (6; 0% instances), dislocated (6; 0% instances), fixed (5; 0% instances), flat:name (3; 0% instances), nmod (3; 0% instances), nmod:poss (3; 0% instances), discourse (1; 0% instances)

Children of VERB nodes belong to 15 different parts of speech: NOUN (17138; 36% instances), PUNCT (9227; 19% instances), VERB (4792; 10% instances), SCONJ (4151; 9% instances), ADV (3061; 6% instances), PRON (2800; 6% instances), CCONJ (1996; 4% instances), PROPN (1901; 4% instances), ADP (708; 1% instances), ADJ (523; 1% instances), AUX (422; 1% instances), NUM (391; 1% instances), DET (278; 1% instances), X (64; 0% instances), INTJ (1; 0% instances)