Treebank Statistics: UD_Hebrew-IAHLTwiki: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem, Masc.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc.
59940 tokens (43%) have a non-empty value of Gender.
10721 types (75%) occur at least once with a non-empty value of Gender.
6236 lemmas (67%) occur at least once with a non-empty value of Gender.
The feature is used with 9 part-of-speech tags: NOUN (34543; 25% instances), VERB (8830; 6% instances), ADJ (8672; 6% instances), PRON (5265; 4% instances), AUX (922; 1% instances), NUM (858; 1% instances), PROPN (780; 1% instances), SYM (58; 0% instances), DET (12; 0% instances).
NOUN
34543 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (25489; 74%), Definite=EMPTY (25151; 73%).
NOUN tokens may have the following values of Gender:
Fem(13566; 39% of non-emptyGender): שנת, ידי, סוכרת, שנים, כנסייה, שנה, ארץ, שנות, מדינה, וועדהFem,Masc(7; 0% of non-emptyGender): פניMasc(20970; 61% of non-emptyGender): בית, משפט, חוק, אלבום, חלק, שימוש, שיר, פי, דם, שיריםEMPTY(84): mg/dl, מארק, FFP, דרום, מזרח, מספר, 34, Rising, gl/dl, wellness
| Paradigm פנים | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Definite=Cons|Number=Plur | פני | פני | פני |
| Number=Sing | פנים | ||
| Number=Plur | פני | פני, פנים | פנים, פני |
Gender seems to be lexical feature of NOUN. 96% lemmas (3642) occur only with one value of Gender.
VERB
8830 VERB tokens (83% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Person=3 (8655; 98%), VerbForm=EMPTY (6222; 70%), Number=Sing (6179; 70%), Tense=Past (5806; 66%), Voice=Act (5432; 62%).
VERB tokens may have the following values of Gender:
Fem(2621; 30% of non-emptyGender): החלה, הוקמה, נערכה, הגיעה, הייתה, כללה, החליטה, מהווה, ביצעה, קיבלהFem,Masc(109; 1% of non-emptyGender): החלו, נערכו, עמדו, הגיעו, טענו, החזיקו, הפכו, הראו, השתתפו, יצטרכוMasc(6100; 69% of non-emptyGender): ניתן, כתב, הלחין, יצא, זכה, החל, כולל, היו, כלל, נמצאEMPTY(1815): יש, אין, לקבל, לגרום, למנוע, לבצע, ליצור, להופיע, לתת, למצוא
| Paradigm כלל | Fem,Masc | Masc | Fem |
|---|---|---|---|
| ExtPos=ADP|HebBinyan=PAAL|Number=Sing|Tense=Pres|VerbForm=Part|Voice=Act | כולל | ||
| HebBinyan=HIFIL|Number=Sing|Tense=Past|Voice=Act | כללה | ||
| HebBinyan=PAAL|Number=Sing|Tense=Fut|Voice=Act | יכלול | ||
| HebBinyan=PAAL|Number=Sing|Tense=Past|Voice=Act | כלל | כללה | |
| HebBinyan=PAAL|Number=Sing|Tense=Pres|VerbForm=Part|Voice=Act | כולל, כלל | כוללת | |
| HebBinyan=PAAL|Number=Sing|Tense=Pres|VerbForm=Part|Voice=Pass | כלול | ||
| HebBinyan=PAAL|Number=Sing|VerbForm=Part|Voice=Act | כולל | ||
| HebBinyan=PAAL|Number=Plur|Tense=Past|Voice=Act | כללו | כללו | |
| HebBinyan=PAAL|Number=Plur|Tense=Pres|VerbForm=Part|Voice=Act | כוללים | כוללות | |
| HebBinyan=PAAL|Number=Plur|Tense=Pres|VerbForm=Part|Voice=Pass | כלולים | ||
| HebBinyan=PIEL|Number=Plur|Tense=Past|Voice=Act | כללו |
ADJ
8672 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (6285; 72%).
ADJ tokens may have the following values of Gender:
Fem(3319; 38% of non-emptyGender): ראשונה, ישראלית, שונות, רבות, שנייה, מערבית, יהודית, חדשה, אחרות, פלסטיניתMasc(5353; 62% of non-emptyGender): עליון, ראשון, נוסף, רבים, יהודי, שונים, אחרים, גרעיני, בריטי, ישראליEMPTY(39): אי, 20, 5, 50, 9, 90, 1, 13, 18, 19
| Paradigm רב | Masc | Fem |
|---|---|---|
| Definite=Cons|Number=Sing | רב | רבת |
| Definite=Cons|Number=Plur | רבי | |
| Number=Sing | רב | רבה |
| Number=Plur | רבים | רבות |
PRON
5265 PRON tokens (93% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Person=3 (5072; 96%), PronType=Prs (4340; 82%), Number=Sing (3977; 76%), Poss=EMPTY (3139; 60%), Case=EMPTY (3084; 59%), Definite=EMPTY (2955; 56%).
PRON tokens may have the following values of Gender:
Fem(1838; 35% of non-emptyGender): ה, היא, זו, הן, זאת, אותה, ן, אלו, עצמה, ךFem,Masc(31; 1% of non-emptyGender): אלו, אני, י, נו, עצמיMasc(3396; 65% of non-emptyGender): ו, הם, ם, הוא, זה, אלה, אלו, אותו, עצמו, נוEMPTY(368): כך, כן, מה, מי, י, נו, אני, ך, כמה, איזה
| Paradigm הוא | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Case=Acc|Definite=Def|Number=Sing|Person=3 | ו | ||
| Case=Acc|Definite=Def|Number=Plur|Person=3 | ם | ||
| Case=Acc|Number=Sing|Person=1 | ני | ||
| Case=Acc|Number=Sing|Person=3 | ו, הו, וֹ | ה | |
| Case=Acc|Number=Plur|Person=3 | ם | ||
| Case=Gen|Definite=Def|Number=Sing|Person=1|Poss=Yes | י | י | |
| Case=Gen|Definite=Def|Number=Sing|Person=2|Poss=Yes | ך | ך, ה | |
| Case=Gen|Definite=Def|Number=Sing|Person=3|Poss=Yes | ו, ם, הם, וֹ, י, ן | ה, הּ, ך, ם | |
| Case=Gen|Definite=Def|Number=Plur|Person=1|Poss=Yes | נו | ||
| Case=Gen|Definite=Def|Number=Plur|Person=3|Poss=Yes | ם, הם | ן, הן, ם, ה | |
| Definite=Def|Number=Sing|Person=3 | ו | ה | |
| Number=Sing|Person=1 | אני, י | אני, י, ני | אני |
| Number=Sing|Person=2 | אתה, ך, ךָ | את, ך | |
| Number=Sing|Person=3|Polarity=Pos | הוא, היא, הם | היא, הוא, י | |
| Number=Sing|Person=3 | ו, הוא, ך, ה, וֹ, יו, ם | ה, היא, ך, את, הן, ו | |
| Number=Sing|Polarity=Pos | הוא | היא | |
| Number=Plur|Person=1 | נו | נו, אנחנו, אנו | |
| Number=Plur|Person=2 | כם | ||
| Number=Plur|Person=3|Polarity=Pos | הם, ם | הן | |
| Number=Plur|Person=3 | הם, ם, ן | הן, ן, הם | |
| Number=Plur|Polarity=Pos | הם | ||
| Number=Plur | הן |
AUX
922 AUX tokens (96% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: VerbForm=EMPTY (799; 87%), Person=3 (712; 77%), Number=Sing (647; 70%), VerbType=EMPTY (591; 64%), HebBinyan=PAAL (541; 59%), Tense=Past (499; 54%).
AUX tokens may have the following values of Gender:
Fem(321; 35% of non-emptyGender): הייתה, אינה, היו, יכולה, תהיה, אינן, איננה, עלולה, עשויה, תוכלFem,Masc(22; 2% of non-emptyGender): היו, יהיוMasc(579; 63% of non-emptyGender): היה, היו, אינו, אינם, יכול, יהיה, יכולים, עלול, איננו, צריךEMPTY(39): להיות, היו, היות, הייתי
| Paradigm היה | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Number=Sing|Person=1|Polarity=Pos|Tense=Past | הייתי | הייתי | |
| Number=Sing|Person=1|Polarity=Pos|Tense=Past|VerbType=Cop | הייתי | ||
| Number=Sing|Person=1|Tense=Fut | אהיה | ||
| Number=Sing|Person=1|Tense=Past|VerbType=Cop | הייתי | ||
| Number=Sing|Person=3 | הייתה | ||
| Number=Sing|Person=3|Polarity=Pos|Tense=Fut | יהיה | תהיה | |
| Number=Sing|Person=3|Polarity=Pos|Tense=Fut|VerbType=Cop | יהיה | תהיה | |
| Number=Sing|Person=3|Polarity=Pos|Tense=Past | היה | הייתה | |
| Number=Sing|Person=3|Polarity=Pos|Tense=Past|Typo=Yes|VerbType=Cop | הייתה, היה | ||
| Number=Sing|Person=3|Polarity=Pos|Tense=Past|VerbType=Cop | היה | הייתה | |
| Number=Sing|Person=3|Tense=Fut | יהיה | תהא | |
| Number=Sing|Person=3|Tense=Fut|VerbType=Cop | יהיה, יהא | תהיה, תהא | |
| Number=Sing|Person=3|Tense=Past | היה | הייתה | |
| Number=Sing|Person=3|Tense=Past|VerbType=Cop | היה | הייתה | |
| Number=Sing|Person=3|VerbType=Cop | הייתה | ||
| Number=Plur|Person=1|Polarity=Pos|Tense=Past | היינו | ||
| Number=Plur|Person=1|Tense=Fut|VerbType=Cop | נהיה | ||
| Number=Plur|Person=3|Polarity=Pos|Tense=Fut | יהיו | יהיו | יהיו |
| Number=Plur|Person=3|Polarity=Pos|Tense=Fut|VerbType=Cop | יהיו | תהיינה | |
| Number=Plur|Person=3|Polarity=Pos|Tense=Past | היו | היו | היו |
| Number=Plur|Person=3|Polarity=Pos|Tense=Past|Typo=Yes|VerbType=Cop | היה | ||
| Number=Plur|Person=3|Polarity=Pos|Tense=Past|VerbType=Cop | היו | היו | היו |
| Number=Plur|Person=3|Tense=Fut|VerbType=Cop | יהיו | ||
| Number=Plur|Person=3|Tense=Past | היו | היו | |
| Number=Plur|Person=3|Tense=Past|VerbType=Cop | היו | היו | היו |
NUM
858 NUM tokens (27% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: NumType=Card (731; 85%).
NUM tokens may have the following values of Gender:
Fem(308; 36% of non-emptyGender): שתי, אחת, שלוש, מאה, ארבע, מאות, עשרות, חמש, שלושים, אחדותFem,Masc(2; 0% of non-emptyGender): שלושים, ארבעיםMasc(548; 64% of non-emptyGender): אחד, שני, מיליון, שלושה, ארבעה, חמישה, שניים, ששת, חצי, אלףEMPTY(2269): 2, 1, 2017, 15, 20, 3, 5, 7, 1948, 4
| Paradigm שלושים | Fem,Masc | Masc | Fem |
|---|---|---|---|
| _ | שלושים | שלושים | |
| NumType=Card | שלושים | שלושים |
PROPN
780 PROPN tokens (7% of all PROPN tokens) have a non-empty value of Gender.
PROPN tokens may have the following values of Gender:
Fem(268; 34% of non-emptyGender): מכפלה, מערת, חירות, כנסיית, ועדת, חטיבה, קפלת, בורסה, ברית, חקיקהMasc(512; 66% of non-emptyGender): בנק, אמפטמין, אדם, אוצר, מעו”ף, כבוד, קבר, ילדי, ניירות, ערךEMPTY(9667): ישראל, איינשטיין, כנסת, ירושלים, גרמניה, יהודה, ארץ, תל, שומרון, ישו
| Paradigm עין | Masc | Fem |
|---|---|---|
| Definite=Cons | עין | |
| עין | עין |
Gender seems to be lexical feature of PROPN. 99% lemmas (262) occur only with one value of Gender.
SYM
58 SYM tokens (40% of all SYM tokens) have a non-empty value of Gender.
SYM tokens may have the following values of Gender:
Masc(58; 100% of non-emptyGender): %, =EMPTY(88): –, -, /, %, +, :, °, &, (
DET
12 DET tokens (0% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: PronType=EMPTY (12; 100%), Definite=Cons (11; 92%).
DET tokens may have the following values of Gender:
Fem(2; 17% of non-emptyGender): כמות, מחציתMasc(10; 83% of non-emptyGender): שאר, מספר, כולםEMPTY(14165): ה, כל, מספר, רוב, כמה, מרבית, עוד, כלל, מדי, אל
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (6647; 99%),
NOUN –[compound]–> NOUN (3613; 52%),
VERB –[nsubj]–> NOUN (2825; 88%),
NOUN –[nmod]–> NOUN (2231; 51%),
NOUN –[acl:relcl]–> VERB (1841; 82%),
NOUN –[conj]–> NOUN (1311; 62%),
NOUN –[nmod:poss]–> PRON (1208; 55%),
VERB –[conj]–> VERB (1085; 79%),
NOUN –[nmod:poss]–> NOUN (748; 52%),
VERB –[nsubj:pass]–> NOUN (717; 96%).