Gender
: gender
This document is a placeholder for the language-specific documentation
for Gender
.
Treebank Statistics (UD_Hebrew)
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc
.
67547 tokens (43%) have a non-empty value of Gender
.
13729 types (75%) occur at least once with a non-empty value of Gender
.
1 lemmas (0) occur at least once with a non-empty value of Gender
.
The feature is used with 7 part-of-speech tags: he-pos/NOUN (37696; 24% instances), he-pos/VERB (12823; 8% instances), he-pos/ADJ (7901; 5% instances), he-pos/PRON (7125; 4% instances), he-pos/NUM (1384; 1% instances), he-pos/AUX (600; 0% instances), he-pos/DET (18; 0% instances).
NOUN
37696 he-pos/NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Definite=EMPTY (28444; 75%), Number=Sing (27851; 74%).
NOUN
tokens may have the following values of Gender
:
Fem
(14155; 38% of non-emptyGender
): משטרה, ארץ, ממשלה, חברה, שנים, שנה, עבודה, ידי, מדינה, דרךFem,Masc
(96; 0% of non-emptyGender
): פני, סכין, פניו, פנים, מטבע, פניה, סכינים, פניהם, דופן, מטבעותMasc
(23445; 62% of non-emptyGender
): בית, יום, משרד, %, שר, משפט, דבר, פועל, מקום, תלEMPTY
(553): הכל, נק, ד, רעולי, אחים, רב, רח, באי, בטון, מאה
VERB
12823 he-pos/VERB tokens (81% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Negative=EMPTY (11101; 87%), VerbType=EMPTY (11101; 87%), Number=Sing (8813; 69%), Person=3 (8131; 63%), VerbForm=EMPTY (7865; 61%).
VERB
tokens may have the following values of Gender
:
Fem
(2972; 23% of non-emptyGender
): היא, היתה, אינה, תהיה, אומרת, ניצחה, אינן, החליטה, אמרה, הןFem,Masc
(2463; 19% of non-emptyGender
): היו, יהיו, הגיעו, אמרו, מסרו, הייתי, יצאו, נפצעו, עלו, עשוMasc
(7388; 58% of non-emptyGender
): היה, הוא, אמר, אינו, יהיה, אינם, אומר, עבר, נראה, מדוברEMPTY
(3097): יש, אין, להיות, לעשות, לתת, לשלם, למנוע, לבצע, לקבל, למצוא
ADJ
7901 he-pos/ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (5619; 71%).
ADJ
tokens may have the following values of Gender
:
Fem
(3064; 39% of non-emptyGender
): ראשונה, חדשה, רבה, אחרת, ישראלית, לאומית, רבות, אחרות, כללית, גדולהMasc
(4837; 61% of non-emptyGender
): אחרים, ראשון, גדול, לאומי, חדש, אחר, רבים, רב, טוב, ישראליEMPTY
(131): יתר, הינדית, בלטית, דמוי, הבעתי, התאבדותית, טכסיים, טרוריסטי, מינסוטיים, סטליניסטית
PRON
7125 he-pos/PRON tokens (97% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Person=3 (6448; 90%), PronType=Prs (5890; 83%), Number=Sing (5211; 73%), Case=EMPTY (4437; 62%).
PRON
tokens may have the following values of Gender
:
Fem
(1811; 25% of non-emptyGender
): היא_, זו, היא, הן_, זאת, הן, עצמה, אותה, אותן, כלשהיFem,Masc
(572; 8% of non-emptyGender
): אני_, אנחנו_, אני, אנו, אלו, אנחנו, עצמי, עצמנו, הננו, אילוMasc
(4742; 67% of non-emptyGender
): הוא_, הם_, הוא, זה, הם, אלה, עצמו, אתה_, אותו, עצמםEMPTY
(256): כך, כן
NUM
1384 he-pos/NUM tokens (42% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Number=Sing (1007; 73%), Definite=EMPTY (960; 69%).
NUM
tokens may have the following values of Gender
:
Fem
(472; 34% of non-emptyGender
): אחת, שתי, שלוש, מאות, עשרות, מאה, ארבע, שנייה, שניה, שבעFem,Masc
(27; 2% of non-emptyGender
): עשרים, ששים, שמונים, שבעים, שישים, שלושים, אלפיים, ארבעים, מאתייםMasc
(885; 64% of non-emptyGender
): אחד, שני, מיליון, אלף, שלושה, ארבעה, מיליארד, שניים, אלפי, שלישיEMPTY
(1925): 1, 0, 2, 3, 4, 02, 5, 01, 11, 21
AUX
600 he-pos/AUX tokens (71% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: VerbType=Mod (600; 100%), Tense=EMPTY (494; 82%), VerbForm=EMPTY (486; 81%), Number=Sing (478; 80%), Person=1,2,3 (472; 79%).
AUX
tokens may have the following values of Gender
:
Fem
(137; 23% of non-emptyGender
): יכולה, עלולה, חייבת, מאפשרת, צריכה, מוכנה, רשאית, מסוגלת, עשויה, ראויהFem,Masc
(24; 4% of non-emptyGender
): יוכלו, מאפשר, נוכל, מאפשריםMasc
(439; 73% of non-emptyGender
): יכול, צריך, קשה, ניתן, אמור, עלול, חייב, יוכל, מוכן, חשובEMPTY
(243): אפשר, יש, ייתכן, אין, אסור, כדאי, מוטב, מותר, תוכל, זכאים
DET
18 he-pos/DET tokens (0% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: PronType=EMPTY (18; 100%).
DET
tokens may have the following values of Gender
:
Masc
(18; 100% of non-emptyGender
): שאר, המון, מספיקEMPTY
(17406): ה, ה_, כל, כמה, הרבה, רוב, שום, מספר, אף, מרבית
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (6169; 97%),
VERB –[nsubj]–> NOUN (3204; 67%),
NOUN –[nmod]–> NOUN (2687; 52%),
NOUN –[nmod:poss]–> PRON (1348; 50%),
NOUN –[acl:relcl]–> VERB (1332; 65%),
NOUN –[conj]–> NOUN (1213; 60%),
VERB –[conj]–> VERB (1040; 72%),
VERB –[nsubj]–> PRON (767; 76%),
NOUN –[nmod:poss]–> NOUN (521; 52%),
NOUN –[amod]–> PRON (518; 90%).
Gender in other languages: [bg] [cs] [de] [el] [en] [es] [eu] [fa] [fr] [ga] [he] [hu] [it] [ja] [ko] [sv] [u]