Gender: gender
This document is a placeholder for the language-specific documentation
for Gender.
Treebank Statistics (UD_Hebrew)
This feature is universal.
It occurs with 2 different values: Fem, Masc.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc.
67547 tokens (43%) have a non-empty value of Gender.
13729 types (75%) occur at least once with a non-empty value of Gender.
1 lemmas (0) occur at least once with a non-empty value of Gender.
The feature is used with 7 part-of-speech tags: he-pos/NOUN (37696; 24% instances), he-pos/VERB (12823; 8% instances), he-pos/ADJ (7901; 5% instances), he-pos/PRON (7125; 4% instances), he-pos/NUM (1384; 1% instances), he-pos/AUX (600; 0% instances), he-pos/DET (18; 0% instances).
NOUN
37696 he-pos/NOUN tokens (99% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Definite=EMPTY (28444; 75%), Number=Sing (27851; 74%).
NOUN tokens may have the following values of Gender:
Fem(14155; 38% of non-emptyGender): משטרה, ארץ, ממשלה, חברה, שנים, שנה, עבודה, ידי, מדינה, דרךFem,Masc(96; 0% of non-emptyGender): פני, סכין, פניו, פנים, מטבע, פניה, סכינים, פניהם, דופן, מטבעותMasc(23445; 62% of non-emptyGender): בית, יום, משרד, %, שר, משפט, דבר, פועל, מקום, תלEMPTY(553): הכל, נק, ד, רעולי, אחים, רב, רח, באי, בטון, מאה
VERB
12823 he-pos/VERB tokens (81% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Negative=EMPTY (11101; 87%), VerbType=EMPTY (11101; 87%), Number=Sing (8813; 69%), Person=3 (8131; 63%), VerbForm=EMPTY (7865; 61%).
VERB tokens may have the following values of Gender:
Fem(2972; 23% of non-emptyGender): היא, היתה, אינה, תהיה, אומרת, ניצחה, אינן, החליטה, אמרה, הןFem,Masc(2463; 19% of non-emptyGender): היו, יהיו, הגיעו, אמרו, מסרו, הייתי, יצאו, נפצעו, עלו, עשוMasc(7388; 58% of non-emptyGender): היה, הוא, אמר, אינו, יהיה, אינם, אומר, עבר, נראה, מדוברEMPTY(3097): יש, אין, להיות, לעשות, לתת, לשלם, למנוע, לבצע, לקבל, למצוא
ADJ
7901 he-pos/ADJ tokens (98% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (5619; 71%).
ADJ tokens may have the following values of Gender:
Fem(3064; 39% of non-emptyGender): ראשונה, חדשה, רבה, אחרת, ישראלית, לאומית, רבות, אחרות, כללית, גדולהMasc(4837; 61% of non-emptyGender): אחרים, ראשון, גדול, לאומי, חדש, אחר, רבים, רב, טוב, ישראליEMPTY(131): יתר, הינדית, בלטית, דמוי, הבעתי, התאבדותית, טכסיים, טרוריסטי, מינסוטיים, סטליניסטית
PRON
7125 he-pos/PRON tokens (97% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Person=3 (6448; 90%), PronType=Prs (5890; 83%), Number=Sing (5211; 73%), Case=EMPTY (4437; 62%).
PRON tokens may have the following values of Gender:
Fem(1811; 25% of non-emptyGender): היא_, זו, היא, הן_, זאת, הן, עצמה, אותה, אותן, כלשהיFem,Masc(572; 8% of non-emptyGender): אני_, אנחנו_, אני, אנו, אלו, אנחנו, עצמי, עצמנו, הננו, אילוMasc(4742; 67% of non-emptyGender): הוא_, הם_, הוא, זה, הם, אלה, עצמו, אתה_, אותו, עצמםEMPTY(256): כך, כן
NUM
1384 he-pos/NUM tokens (42% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Number=Sing (1007; 73%), Definite=EMPTY (960; 69%).
NUM tokens may have the following values of Gender:
Fem(472; 34% of non-emptyGender): אחת, שתי, שלוש, מאות, עשרות, מאה, ארבע, שנייה, שניה, שבעFem,Masc(27; 2% of non-emptyGender): עשרים, ששים, שמונים, שבעים, שישים, שלושים, אלפיים, ארבעים, מאתייםMasc(885; 64% of non-emptyGender): אחד, שני, מיליון, אלף, שלושה, ארבעה, מיליארד, שניים, אלפי, שלישיEMPTY(1925): 1, 0, 2, 3, 4, 02, 5, 01, 11, 21
AUX
600 he-pos/AUX tokens (71% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: VerbType=Mod (600; 100%), Tense=EMPTY (494; 82%), VerbForm=EMPTY (486; 81%), Number=Sing (478; 80%), Person=1,2,3 (472; 79%).
AUX tokens may have the following values of Gender:
Fem(137; 23% of non-emptyGender): יכולה, עלולה, חייבת, מאפשרת, צריכה, מוכנה, רשאית, מסוגלת, עשויה, ראויהFem,Masc(24; 4% of non-emptyGender): יוכלו, מאפשר, נוכל, מאפשריםMasc(439; 73% of non-emptyGender): יכול, צריך, קשה, ניתן, אמור, עלול, חייב, יוכל, מוכן, חשובEMPTY(243): אפשר, יש, ייתכן, אין, אסור, כדאי, מוטב, מותר, תוכל, זכאים
DET
18 he-pos/DET tokens (0% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: PronType=EMPTY (18; 100%).
DET tokens may have the following values of Gender:
Masc(18; 100% of non-emptyGender): שאר, המון, מספיקEMPTY(17406): ה, ה_, כל, כמה, הרבה, רוב, שום, מספר, אף, מרבית
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (6169; 97%),
VERB –[nsubj]–> NOUN (3204; 67%),
NOUN –[nmod]–> NOUN (2687; 52%),
NOUN –[nmod:poss]–> PRON (1348; 50%),
NOUN –[acl:relcl]–> VERB (1332; 65%),
NOUN –[conj]–> NOUN (1213; 60%),
VERB –[conj]–> VERB (1040; 72%),
VERB –[nsubj]–> PRON (767; 76%),
NOUN –[nmod:poss]–> NOUN (521; 52%),
NOUN –[amod]–> PRON (518; 90%).
Gender in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]