Treebank Statistics: UD_Hebrew-PostRab: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem, Masc.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc.
4097 tokens (51%) have a non-empty value of Gender.
1605 types (83%) occur at least once with a non-empty value of Gender.
1084 lemmas (83%) occur at least once with a non-empty value of Gender.
The feature is used with 8 part-of-speech tags: NOUN (1763; 22% instances), VERB (922; 11% instances), PRON (876; 11% instances), ADJ (243; 3% instances), NUM (105; 1% instances), AUX (92; 1% instances), PROPN (89; 1% instances), DET (7; 0% instances).
NOUN
1763 NOUN tokens (97% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Number=Sing (1331; 75%).
NOUN tokens may have the following values of Gender:
Fem(626; 36% of non-emptyGender): ארץ, יד, שנה, מעות, תורה, דרך, כנסת, תפלה, ידי, מצוהFem,Masc(2; 0% of non-emptyGender): דרכיMasc(1135; 64% of non-emptyGender): בית, מקום, יום, גט, ראש, זמן, בעל, שליח, בני, ימיEMPTY(56): פי, הן, יד, אל, כל, כלום, לאו, אי, אמן, דורות
| Paradigm דרך | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Number=Sing | דרך | ||
| Number=Plur | דרכי | דרכים |
Gender seems to be lexical feature of NOUN. 96% lemmas (571) occur only with one value of Gender.
VERB
922 VERB tokens (80% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Number=Sing (705; 76%), VerbForm=EMPTY (613; 66%), Person=3 (469; 51%).
VERB tokens may have the following values of Gender:
Fem(86; 9% of non-emptyGender): מגורשת, עמדה, אמרה, יודעת, נכנסת, סולדת, אומרת, באה, הגיעה, הוחזקהFem,Masc(142; 15% of non-emptyGender): נהגו, ידעו, ימכרו, נ, נאבדו, ראו, ראיתי, אדרוש, אמרו, אעשהMasc(694; 75% of non-emptyGender): אמר, אומר, אומרים, אוכל, יצא, נאמר, קורא, בא, נותן, נתנEMPTY(235): יש, אין, ליתן, לעשות, לומר, להתפלל, לכתוב, להגיד, להיות, להניח
| Paradigm אמר | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Number=Sing|Person=1,2,3|VerbForm=Part | אומר | אומרת | |
| Number=Sing|Person=1|Tense=Past | אמרתי | ||
| Number=Sing|Person=2|Tense=Fut | תאמר | ||
| Number=Sing|Person=3|Tense=Fut | יאמר | ||
| Number=Sing|Person=3|Tense=Past | אמר | אמרה | |
| Number=Plur|Person=1,2,3|VerbForm=Part | אומרים | ||
| Number=Plur|Person=3|Tense=Past | אמרו |
PRON
876 PRON tokens (93% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Person=3 (766; 87%), Number=Sing (686; 78%).
PRON tokens may have the following values of Gender:
Fem(159; 18% of non-emptyGender): ה, היא, זו, זאת, נה, הן, ן, ך, אותן, אןFem,Masc(79; 9% of non-emptyGender): י, אלו, נו, אני, אנו, אלה, הללו, אנחנו, אנכי, הןMasc(638; 73% of non-emptyGender): ו, הוא, ם, הם, זה, ך, הו, נו, אתה, הEMPTY(62): מי, מה, ה, כך, עצמו, י, ו, אותו, אלה, אלו
| Paradigm הוא | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Number=Sing | ה | ||
| Number=Sing|Person=1 | י, אני, אנכי, ני | י, ני, תיך | |
| Number=Sing|Person=2 | ך, אתה, כם | ך | |
| Number=Sing|Person=3 | ו, הוא, הו, ה, תתיו, ך, ם, נה, נו, תו, תיו | ה, היא, נה, תו | |
| Number=Plur|Person=1 | נו, אנו, אנחנו | נו, ו | |
| Number=Plur|Person=2 | כם, אתם | ||
| Number=Plur|Person=3 | הן | הם, ם, הן, ן, תם, תיהם, תים, אום, אתם, נו, תיהן | הן, ן, אן |
ADJ
243 ADJ tokens (95% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (183; 75%).
ADJ tokens may have the following values of Gender:
Fem(49; 20% of non-emptyGender): אחרות, זרה, חדשות, קטנה, אחרת, נקיות, פשוטה, רצויה, אחרונה, אלהיתMasc(194; 80% of non-emptyGender): אחר, מותר, אסור, ברוך, גדול, אחרים, קדוש, גבוה, זול, חייבEMPTY(13): מותר, אסור, אחר, דאוריתא, טוב, מוטב
| Paradigm אחר | Masc | Fem |
|---|---|---|
| Number=Sing | אחר | אחרת |
| Number=Plur | אחרים | אחרות |
Gender seems to be lexical feature of ADJ. 91% lemmas (101) occur only with one value of Gender.
NUM
105 NUM tokens (73% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Number=Sing (62; 59%).
NUM tokens may have the following values of Gender:
Fem(28; 27% of non-emptyGender): ארבע, אחת, מאות, עשר, עשרה, שלוש, שש, שתי, שתים, ראשונהFem,Masc(1; 1% of non-emptyGender): עשריםMasc(76; 72% of non-emptyGender): אחד, שני, ראשון, שניה, שנים, ארבעה, מחצה, עשר, עשרה, רביעיEMPTY(39): ד, י’, ג, א, א’, ד’, י”ב, יב, שפח, ב’
| Paradigm אחת | Masc | Fem |
|---|---|---|
| אחד | אחת |
AUX
92 AUX tokens (94% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: VerbForm=EMPTY (68; 74%), Number=Sing (65; 71%), Person=3 (55; 60%).
AUX tokens may have the following values of Gender:
Fem(10; 11% of non-emptyGender): היתה, יכולה, עתידה, תהא, תהיהFem,Masc(21; 23% of non-emptyGender): היו, יהיו, אמרתי, הייתיMasc(61; 66% of non-emptyGender): היה, צריך, יכול, יהיה, יהא, יהיו, עתידין, צריכים, יוכל, עשוייםEMPTY(6): הוי, בהיות, להיות
| Paradigm היה | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Number=Sing | היה | ||
| Number=Sing|Person=1|Tense=Past | הייתי | ||
| Number=Sing|Person=3|Tense=Fut | יהיה, יהא | תהא, תהיה | |
| Number=Sing|Person=3|Tense=Past | היה | היתה | |
| Number=Plur|Person=3|Tense=Fut | יהיו | יהיו | |
| Number=Plur|Person=3|Tense=Past | היו |
PROPN
89 PROPN tokens (63% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Number=Sing (87; 98%).
PROPN tokens may have the following values of Gender:
Fem(7; 8% of non-emptyGender): שרה, חובה, חנוכה, ירושלים, שמעMasc(82; 92% of non-emptyGender): ניסן, אברהם, נח, ישראל, אדם, ה’, הקב”ה, משה, עמרם, קהתEMPTY(53): ישראל, מצרים, ה’, השם, למנצח, ניסן, עדן, שם, אויניון, אוקיאנוס
| Paradigm שמע | Masc | Fem |
|---|---|---|
| שמע | שמע |
Gender seems to be lexical feature of PROPN. 98% lemmas (49) occur only with one value of Gender.
DET
7 DET tokens (1% of all DET tokens) have a non-empty value of Gender.
DET tokens may have the following values of Gender:
Fem(2; 29% of non-emptyGender): הMasc(5; 71% of non-emptyGender): שאר, אותו, ה, מעט, רובEMPTY(629): ה, כל, כול, הרבה, קצת, שאר, כמה, מקצת, רוב, שום
| Paradigm ה | Masc | Fem |
|---|---|---|
| Number=Sing | ה | ה |
| Number=Plur | ה |
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
VERB –[conj]–> VERB (173; 74%),
NOUN –[nmod:poss]–> PRON (138; 56%),
VERB –[nsubj]–> NOUN (129; 70%),
NOUN –[conj]–> NOUN (91; 66%),
NOUN –[amod]–> ADJ (79; 93%),
VERB –[nsubj]–> PRON (62; 76%),
VERB –[obj]–> PRON (62; 55%),
NOUN –[acl:relcl]–> VERB (50; 54%),
NOUN –[nmod]–> NOUN (45; 63%),
NOUN –[nummod]–> NUM (40; 57%).