Treebank Statistics: UD_Hebrew-HTB: POS Tags: VERB
There are 1856 VERB
lemmas (17%), 5528 VERB
types (29%) and 14276 VERB
tokens (9%).
Out of 15 observed tags, the rank of VERB
is: 3 in number of lemmas, 2 in number of types and 5 in number of tokens.
The 10 most frequent VERB
lemmas: אמר, _, יש, הגיע, אין, היה, קיבל, עשה, עלה, עבר
The 10 most frequent VERB
types: יש, אין, אמר, אומר, עבר, מדובר, נראה, חולים, היו, לעשות
The 10 most frequent ambiguous lemmas: _ (NOUN 366, AUX 268, VERB 251, ADJ 231, ADV 177, CCONJ 110, X 86, PRON 57, SCONJ 47, DET 33), יש (VERB 214, AUX 49), אין (VERB 154, AUX 17, ADV 10, NOUN 2), היה (AUX 778, VERB 148), עלה (VERB 113, NOUN 3), עבר (VERB 112, NOUN 46), נתן (VERB 88, PROPN 3), ידע (VERB 84, NOUN 7), בא (VERB 79, ADJ 53), מסר (VERB 71, NOUN 11)
The 10 most frequent ambiguous types: יש (VERB 211, AUX 49), אין (VERB 154, ADV 76, AUX 17, NOUN 2), עבר (VERB 54, NOUN 46), מדובר (VERB 53, ADJ 2), היו (AUX 139, VERB 46), היה (AUX 385, VERB 38, X 1), כולל (VERB 37, ADJ 10), רבים (ADJ 49, VERB 35), עלה (VERB 32, NOUN 1), עולה (NOUN 37, VERB 30)
- יש
- אין
- VERB 154: זו היתה התרברבות לא - דיסקרטית , ו אין ספק ש יימנע מן_ _היא השנה .
- ADV 76: לא רק ש אין זה עניין פוליטי אלא זה נושא חינוכי - לאומי מ מדרגה ראשונה .
- AUX 17: ו אולם לכאורה , אין להסיק ש ה חברה זכאית לעכב את מסירת ה דירות כש ישולם ה מע”ם .
- NOUN 2: שיקאגו של שנות ה שלושים , אמרו ו חזרו ו אמרו קציני משטרה בכירים , כ אין ו כ אפס לעומת דרום איטליה של היום .
- עבר
- מדובר
- היו
- היה
- כולל
- רבים
- עלה
- עולה
Morphology
The form / lemma ratio of VERB
is 2.978448 (the average of all parts of speech is 1.701287).
The 1st highest number of forms (129) was observed with the lemma “_”: אבדנו, אבקשכם, אומרו, אירגן, אספר, בטוח, ברכתיו, גלומות, דומה, דוקלם, דיקלם, הגזה, הוותה, הטרידו, היה, היו, היזו, הישווה, הישוותה, היתה, הנחה, העמידני, הפכוהו, הציבו, התחממה, התעקבה, התקים, חדל, חוללה, חיה, חסרות, חשודים, יהיה, יהיו, יחוללו, ייצגו, ייתלוו, יכלו, ינטש, יעבירם, ירבו, ירוקנו, ישנה, יתנו, לאבטח, לבכות, לבלות, לגבות, לגלות, לגשת, לדמיין, להדק, להחיות, להפנות, להקנות, להראות, להרוג, להתחיל, לזכות, לחיות, לחקותו, לכבות, לכלות, לכפות, למנות, לסוכך, לעודדם, לענות, לפנות, לפצותו, לצוות, לצפות, לקבלו, לקחת, לקרות, לראותו, לשבות, לשנות, לשתות, לתכנן, מאוהב, מבוסס, מבוססות, מבוססים, מבוססת, מודה, מודע, מוכר, מונה, מידרדר, מכופפת, מכנה, מסולפים, מסקרן, מעורב, מקובלים, מקובלת, משנה, משתנה, מת, נבוך, נגחו, נחוץ, נטש, ניבא, ניבאו, ניצב, ניצבות, ניצל, ניצלה, ניצלו, נשקרה, עדה, עוינת, עולה, עושה, ער, עשה, עשו, פיקפק, פעילות, קיים, רואה, שובה, שונה, שקוע, תהיה, תמה, תפוס.
The 2nd highest number of forms (16) was observed with the lemma “נתן”: ייתן, יתן, ליתן, לתת, נותן, נותנות, נותנים, נותנת, ניתן, נתון, נתונה, נתונות, נתונים, נתן, נתנה, נתנו.
The 3rd highest number of forms (15) was observed with the lemma “אמר”: אומר, אומרות, אומרים, אומרת, אמור, אמר, אמרה, אמרו, אמרנו, אמרת, אמרתי, יאמר, יאמרו, לומר, תאמר.
VERB
occurs with 11 features: HebBinyan (12510; 88% instances), Voice (11415; 80% instances), Gender (11272; 79% instances), Number (11272; 79% instances), Person (11263; 79% instances), Tense (6972; 49% instances), VerbForm (6829; 48% instances), HebExistential (539; 4% instances), Polarity (171; 1% instances), Definite (84; 1% instances), Mood (49; 0% instances)
VERB
occurs with 27 feature-value pairs: Definite=Cons
, Gender=Fem
, Gender=Fem,Masc
, Gender=Masc
, HebBinyan=HIFIL
, HebBinyan=HITPAEL
, HebBinyan=HUFAL
, HebBinyan=NIFAL
, HebBinyan=PAAL
, HebBinyan=PIEL
, HebBinyan=PUAL
, HebExistential=Yes
, Mood=Imp
, Number=Plur
, Number=Sing
, Person=1
, Person=1,2,3
, Person=2
, Person=3
, Polarity=Pos
, Tense=Fut
, Tense=Past
, VerbForm=Inf
, VerbForm=Part
, Voice=Act
, Voice=Mid
, Voice=Pass
VERB
occurs with 182 feature combinations.
The most frequent feature combination is HebBinyan=PAAL|VerbForm=Inf|Voice=Act
(804 tokens).
Examples: לעשות, לתת, למנוע, למצוא, לומר, לצאת, לחזור, לפגוע, לעמוד, לפעול
Relations
VERB
nodes are attached to their parents using 25 different relations: root (4981; 35% instances), acl:relcl (2532; 18% instances), conj (2027; 14% instances), advcl (1065; 7% instances), xcomp (1037; 7% instances), ccomp (726; 5% instances), acl (414; 3% instances), dep (347; 2% instances), obl (330; 2% instances), amod (222; 2% instances), parataxis (165; 1% instances), appos (75; 1% instances), nsubj (64; 0% instances), nmod (59; 0% instances), compound:smixut (53; 0% instances), aux (49; 0% instances), obj (32; 0% instances), case (30; 0% instances), advmod (19; 0% instances), fixed (15; 0% instances), csubj (12; 0% instances), nmod:poss (9; 0% instances), det (7; 0% instances), nsubj:cop (5; 0% instances), dislocated (1; 0% instances)
Parents of VERB
nodes belong to 15 different parts of speech: (4981; 35% instances), VERB (4810; 34% instances), NOUN (3284; 23% instances), AUX (281; 2% instances), ADJ (264; 2% instances), ADV (210; 1% instances), PROPN (208; 1% instances), PRON (138; 1% instances), CCONJ (30; 0% instances), SCONJ (21; 0% instances), ADP (14; 0% instances), DET (14; 0% instances), X (12; 0% instances), NUM (8; 0% instances), INTJ (1; 0% instances)
415 (3%) VERB
nodes are leaves.
1262 (9%) VERB
nodes have one child.
2443 (17%) VERB
nodes have two children.
10156 (71%) VERB
nodes have three or more children.
The highest child degree of a VERB
node is 47.
Children of VERB
nodes are attached using 34 different relations: obl (10804; 23% instances), punct (8547; 18% instances), nsubj (6925; 15% instances), mark (4194; 9% instances), obj (3858; 8% instances), advmod (3077; 7% instances), conj (1933; 4% instances), cc (1846; 4% instances), xcomp (1060; 2% instances), advcl (984; 2% instances), dep (890; 2% instances), ccomp (877; 2% instances), aux (620; 1% instances), case (502; 1% instances), det (212; 0% instances), cop (205; 0% instances), parataxis (200; 0% instances), compound:smixut (78; 0% instances), nsubj:cop (60; 0% instances), amod (29; 0% instances), mark:q (25; 0% instances), case:acc (23; 0% instances), compound:affix (22; 0% instances), appos (17; 0% instances), case:gen (14; 0% instances), acl:relcl (13; 0% instances), csubj (11; 0% instances), fixed (7; 0% instances), nummod (7; 0% instances), dislocated (6; 0% instances), acl (5; 0% instances), flat:name (3; 0% instances), nmod:poss (3; 0% instances), discourse (1; 0% instances)
Children of VERB
nodes belong to 15 different parts of speech: NOUN (17133; 36% instances), PUNCT (8547; 18% instances), VERB (4810; 10% instances), SCONJ (4082; 9% instances), ADV (2950; 6% instances), PRON (2736; 6% instances), CCONJ (1955; 4% instances), PROPN (1900; 4% instances), AUX (1139; 2% instances), ADP (715; 2% instances), ADJ (387; 1% instances), NUM (340; 1% instances), DET (294; 1% instances), X (69; 0% instances), INTJ (1; 0% instances)