Treebank Statistics: UD_Hebrew-HTB: POS Tags: X
There are 29 X
lemmas (0%), 86 X
types (0%) and 165 X
tokens (0%).
Out of 15 observed tags, the rank of X
is: 10 in number of lemmas, 9 in number of types and 14 in number of tokens.
The 10 most frequent X
lemmas: _, ה, ב, קפספקו, קפכות, ו, בנק, מ, 21פליון, 51פ6ארבעים
The 10 most frequent X
types: ה, קפידבין, ב, קפספבין, ה_, קפכות, קפספקו, ו, בנקים, יחסים
The 10 most frequent ambiguous lemmas: _ (NOUN 366, AUX 268, VERB 251, ADJ 231, ADV 177, CCONJ 110, X 86, PRON 57, SCONJ 47, DET 33), ה (DET 16515, SCONJ 745, X 28), ב (ADP 7928, PROPN 18, X 12), ו (CCONJ 4080, ADV 5, X 3), בנק (NOUN 118, X 2), מ (ADP 1697, PROPN 33, NUM 2, X 2, NOUN 1), ביילין (PROPN 4, X 1), חודש (NOUN 141, X 1), ל (ADP 4438, PROPN 4, X 1), מגמה (NOUN 12, X 1)
The 10 most frequent ambiguous types: ה (DET 13596, SCONJ 745, X 21), ב (ADP 7588, PROPN 12, X 12), ה_ (DET 2935, X 8), ו (CCONJ 4151, ADV 6, X 3), בנקים (NOUN 22, X 2), יחסים (NOUN 15, X 2), מ (ADP 1699, PROPN 36, NOUN 2, NUM 2, X 2), אחד (NUM 199, X 1), אמריקאים (NOUN 16, ADJ 10, X 1), ביילין (PROPN 4, X 1)
- ה
- ב
- ה_
- ו
- בנקים
- יחסים
- מ
- ADP 1699: ה מוח מתפלץ לא רק מ ה תופעה ה מבישה אלא גם מ דרכי ה הערמה .
- PROPN 36: יש ב יוניוורסל תשובה ל כל מה ש יש ב מ - ג - מ , ו אף יותר .
- NOUN 2: ב ה_ דקה ה - 6 העלה יובל נעים את ר”ג ל יתרון ב בעיטה מ - 02 מ .
- NUM 2: ה יבוא הגיע ל 1.3 מ ד , ו ה ייצוא ל 149 מ ד .
- X 2: מ מועמדי מפלגת ה שלטון ה מצרית הודחו מן ה רשימה לאחר ש התברר כי נחשדו ב שחיתות .
- אחד
- אמריקאים
- NOUN 16: “ אמריקאים “ , אמר , “ מתרעמים על עצם ה שאלה איך תצביע .
- ADJ 10: קבוצת כדורסלנים אמריקאים שיחקו כדורסל תחת ה שם סאברס .
- X 1: חוגים בכירים ב משרד ה ביטחון טענו ב סוף ה שבוע , כי אין כל צורך להגיע עם ה אמריקאים ל תיאום מראש , ב ה_ דרג ה מדיני ה עליון , ב כל ה אמור ב ה_ מהלכים ה אסטראטגיים של שתי ה מדינות , ה צפויים ב מקרה של התלקחות .
- ביילין
Morphology
The form / lemma ratio of X
is 2.965517 (the average of all parts of speech is 1.701287).
The 1st highest number of forms (60) was observed with the lemma “”: 71פעל, אולדהאם, אחד, אמריקאים, באפסיס, בית, גרעון, דק, ה, היה, הסתדרות, העדת, הערב, הרבה, הרים, התאחדות, וקפכות, זאתו, חוקרים, חצי, יחסים, ימים, כי, לאנשי, לראשונה, מארק, מהלכים, מהשך, מועמדי, מחצית, מטבע, מילואה, מלך, ממשלתו, מנכ”ל, מקורות, מקסים, מקרים, משחק, משמעות, סוף, סניף, עיתון, פועלים, פחות, קולת, קפידבין, קפכות, קפספבין, קפתמונה1, רצועה, ש22חת, שבועיים, שביתת, של, תובעת, תוך, תוכנית, תומכיו, תח22שאחדים.
The 2nd highest number of forms (2) was observed with the lemma “ה”: ה, ה_.
The 3rd highest number of forms (1) was observed with the lemma “21פליון”: 21פליון.
X
occurs with 1 features: Abbr (2; 1% instances)
X
occurs with 1 feature-value pairs: Abbr=Yes
X
occurs with 2 feature combinations.
The most frequent feature combination is _
(163 tokens).
Examples: ה, קפידבין, ב, קפספבין, ה_, קפכות, קפספקו, ו, בנקים, יחסים
Relations
X
nodes are attached to their parents using 15 different relations: dep (86; 52% instances), nsubj (17; 10% instances), det (14; 8% instances), case (13; 8% instances), advmod (10; 6% instances), root (6; 4% instances), obl (5; 3% instances), nmod (3; 2% instances), acl (2; 1% instances), compound:smixut (2; 1% instances), mark (2; 1% instances), nsubj:cop (2; 1% instances), appos (1; 1% instances), cc (1; 1% instances), conj (1; 1% instances)
Parents of X
nodes belong to 9 different parts of speech: VERB (69; 42% instances), X (45; 27% instances), NOUN (31; 19% instances), ADJ (6; 4% instances), (6; 4% instances), ADP (4; 2% instances), AUX (2; 1% instances), ADV (1; 1% instances), PROPN (1; 1% instances)
105 (64%) X
nodes are leaves.
28 (17%) X
nodes have one child.
10 (6%) X
nodes have two children.
22 (13%) X
nodes have three or more children.
The highest child degree of a X
node is 7.
Children of X
nodes are attached using 20 different relations: dep (30; 22% instances), punct (22; 16% instances), case (18; 13% instances), det (12; 9% instances), obl (11; 8% instances), compound:smixut (9; 7% instances), amod (7; 5% instances), advmod (4; 3% instances), conj (4; 3% instances), acl:relcl (3; 2% instances), nmod:poss (3; 2% instances), appos (2; 1% instances), flat:name (2; 1% instances), nsubj (2; 1% instances), acl (1; 1% instances), cc (1; 1% instances), ccomp (1; 1% instances), fixed (1; 1% instances), nummod (1; 1% instances), parataxis (1; 1% instances)
Children of X
nodes belong to 11 different parts of speech: X (45; 33% instances), NOUN (23; 17% instances), PUNCT (22; 16% instances), VERB (12; 9% instances), ADJ (10; 7% instances), PROPN (10; 7% instances), ADP (7; 5% instances), NUM (2; 1% instances), PRON (2; 1% instances), ADV (1; 1% instances), CCONJ (1; 1% instances)