Treebank Statistics: UD_Hebrew-IAHLTknesset: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem, Masc.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc.
27740 tokens (41%) have a non-empty value of Gender.
5941 types (79%) occur at least once with a non-empty value of Gender.
3529 lemmas (76%) occur at least once with a non-empty value of Gender.
The feature is used with 9 part-of-speech tags: NOUN (12992; 19% instances), PRON (5548; 8% instances), VERB (4879; 7% instances), ADJ (3090; 5% instances), AUX (648; 1% instances), NUM (439; 1% instances), PROPN (107; 0% instances), DET (19; 0% instances), SYM (18; 0% instances).
NOUN
12992 NOUN tokens (100% of all NOUN tokens) have a non-empty value of Gender.
The most frequent other feature values with which NOUN and Gender co-occurred: Definite=EMPTY (10284; 79%), Number=Sing (9628; 74%).
NOUN tokens may have the following values of Gender:
Fem(4969; 38% of non-emptyGender): ממשלה, מדינה, וועדה, מדינת, שנים, שנה, ידי, דרך, בעיה, פעםFem,Masc(14; 0% of non-emptyGender): פני, אוכלוסייה, אנוש, טבע, ישע, סופ, עצם, פנים, ציפוריMasc(8009; 62% of non-emptyGender): ראש, חוק, דבר, יושב, חברי, שר, חבר, נושא, אדונ, דברים
| Paradigm פנים | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Definite=Cons|Number=Plur | פני | פני | |
| Number=Sing | פנים | ||
| Number=Plur | פני, פנים | פנים, פני | פני |
Gender seems to be lexical feature of NOUN. 97% lemmas (2052) occur only with one value of Gender.
PRON
5548 PRON tokens (87% of all PRON tokens) have a non-empty value of Gender.
The most frequent other feature values with which PRON and Gender co-occurred: Poss=EMPTY (4906; 88%), Case=EMPTY (4896; 88%), Definite=EMPTY (4819; 87%), PronType=Prs (4087; 74%), Number=Sing (3965; 71%), Person=3 (3436; 62%).
PRON tokens may have the following values of Gender:
Fem(1089; 20% of non-emptyGender): ה, זאת, היא, אני, זו, הן, י, ן, אותה, אתFem,Masc(181; 3% of non-emptyGender): אני, י, נו, אנחנו, אלו, ך, עצמיMasc(4278; 77% of non-emptyGender): זה, אני, ו, הם, הוא, אנחנו, י, נו, אתה, םEMPTY(814): מה, י, נו, מי, כך, אני, אנחנו, כן, ך, ני
| Paradigm הוא | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Case=Acc|Number=Sing|Person=1 | ני | ||
| Case=Acc|Number=Sing|Person=2 | אתה | ||
| Case=Acc|Number=Sing|Person=3 | ה | ||
| Case=Acc|Number=Plur|Person=1 | נו | ||
| Case=Acc|Number=Plur|Person=2 | כם | ||
| Case=Acc|Number=Plur|Person=3 | ן | ||
| Case=Gen|Definite=Def|Number=Sing|Person=1|Poss=Yes | י | י | י |
| Case=Gen|Definite=Def|Number=Sing|Person=2|Poss=Yes | ך | ||
| Case=Gen|Definite=Def|Number=Sing|Person=3|Poss=Yes | ו, הו | ה | |
| Case=Gen|Definite=Def|Number=Plur|Person=1|Poss=Yes | נו | נו | נו |
| Case=Gen|Definite=Def|Number=Plur|Person=2|Poss=Yes | כם | ||
| Case=Gen|Definite=Def|Number=Plur|Person=3|Poss=Yes | ם, הם, נו | ן, הן | |
| Definite=Def|Number=Sing|Person=3 | ו | ||
| Number=Sing|Person=1 | אני, י | אני, י | אני, י |
| Number=Sing|Person=2 | ך | אתה, ך | את, ך |
| Number=Sing|Person=3 | הוא, ו, יו | היא, ה | |
| Number=Plur|Person=1 | אנחנו, נו | אנחנו, נו, אנו | נו, אנחנו |
| Number=Plur|Person=2 | אתם, כם | ||
| Number=Plur|Person=3 | הם, ם, המה, נו | הן, ן, ה | |
| Person=2 | ך |
VERB
4879 VERB tokens (66% of all VERB tokens) have a non-empty value of Gender.
The most frequent other feature values with which VERB and Gender co-occurred: Voice=Act (3937; 81%), Person=3 (3120; 64%), Number=Sing (3081; 63%), VerbForm=Part (2557; 52%), Tense=Pres (2497; 51%).
VERB tokens may have the following values of Gender:
Fem(891; 18% of non-emptyGender): אומרת, היתה, חושבת, הייתה, היו, תהיה, רוצה, יודעת, נמצאת, מבקשתFem,Masc(67; 1% of non-emptyGender): אמרתי, באו, קיבלתי, שמעתי, אמרת, אסביר, דיברו, הבנו, נצליח, עשיתיMasc(3921; 80% of non-emptyGender): צריך, רוצה, אומר, חושב, יודע, רוצים, מדברים, יודעים, היה, נמצאיםEMPTY(2488): יש, אין, אפשר, לעשות, להיות, להגיד, לדבר, לומר, לתת, לראות
| Paradigm אמר | Fem,Masc | Masc | Fem |
|---|---|---|---|
| Aspect=Prog|Number=Sing|Person=1|Tense=Past|VerbForm=Part | אומר | ||
| Aspect=Prog|Number=Sing|Person=3|Tense=Past|VerbForm=Part | אומר | ||
| Mood=Irr|Number=Sing|Person=3|VerbForm=Part | אומר | ||
| Mood=Irr|Number=Plur|Person=3|Tense=Pres|VerbForm=Part | אומרים | ||
| Number=Sing|Person=1|Tense=Fut|VerbForm=Part | אומר | ||
| Number=Sing|Person=1|Tense=Fut | אומר | ||
| Number=Sing|Person=1|Tense=Past | אמרתי | אמרתי | אמרתי |
| Number=Sing|Person=1|Tense=Pres|VerbForm=Part | אומר | אומרת | |
| Number=Sing|Person=2|Tense=Fut | תאמר | ||
| Number=Sing|Person=2|Tense=Past | אמרת | אמרת | אמרת |
| Number=Sing|Person=2|Tense=Pres|VerbForm=Part | אומר | אומרת | |
| Number=Sing|Person=3|Tense=Fut | נאמר | ||
| Number=Sing|Person=3|Tense=Past | אמר | אמרה | |
| Number=Sing|Person=3|Tense=Pres|VerbForm=Part | אומר | אומרת | |
| Number=Plur|Person=1|Tense=Past | אמרנו | אמרנו | |
| Number=Plur|Person=1|Tense=Pres|VerbForm=Part | אומרים | ||
| Number=Plur|Person=2|Tense=Past | אמרתם | ||
| Number=Plur|Person=3|Tense=Past | אמרו | אמרו | |
| Number=Plur|Person=3|Tense=Pres|VerbForm=Part | אומרים |
ADJ
3090 ADJ tokens (100% of all ADJ tokens) have a non-empty value of Gender.
The most frequent other feature values with which ADJ and Gender co-occurred: Number=Sing (2339; 76%).
ADJ tokens may have the following values of Gender:
Fem(1146; 37% of non-emptyGender): ראשונה, רבה, קודמת, גדולה, אחרת, מקומיות, אחרונות, ערבית, ציבורית, טובהMasc(1944; 63% of non-emptyGender): חשוב, נכון, יהודי, גדול, טוב, שני, ראשון, אחרים, אחר, בר
| Paradigm אחר | Masc | Fem |
|---|---|---|
| Number=Sing | אחר | אחרת |
| Number=Plur | אחרים | אחרות |
AUX
648 AUX tokens (91% of all AUX tokens) have a non-empty value of Gender.
The most frequent other feature values with which AUX and Gender co-occurred: VerbForm=EMPTY (472; 73%), Number=Sing (451; 70%), Tense=EMPTY (352; 54%), Person=EMPTY (330; 51%), HebBinyan=PAAL (328; 51%).
AUX tokens may have the following values of Gender:
Fem(145; 22% of non-emptyGender): היתה, הייתה, צריכה, יכולה, תהיה, אינה, היו, אמורה, הייתי, יכולותFem,Masc(1; 0% of non-emptyGender): יוכלוMasc(502; 77% of non-emptyGender): היה, יכול, צריך, צריכים, יכולים, יהיה, היו, הייתי, היינו, חייביםEMPTY(65): להיות, הייתי, היינו, נוכל, יהיו, יכולנו, יכולתי
| Paradigm יכל | Fem,Masc | Masc | Fem |
|---|---|---|---|
| HebBinyan=PAAL|Number=Sing|Person=1|Tense=Fut|VerbType=Mod | אוכל | ||
| HebBinyan=PAAL|Number=Sing|Person=1|Tense=Past|VerbType=Mod | יכולתי | יכולתי | |
| HebBinyan=PAAL|Number=Sing|Person=3|Tense=Fut|VerbType=Mod | יוכל | תוכל | |
| HebBinyan=PAAL|Number=Sing|Person=3|Tense=Pres|VerbForm=Part | יכול | ||
| HebBinyan=PAAL|Number=Sing|Person=3|Tense=Pres|VerbForm=Part|VerbType=Mod | יכולה | ||
| HebBinyan=PAAL|Number=Sing|Person=3|VerbForm=Part | יכולה | ||
| HebBinyan=PAAL|Number=Sing|Person=3|VerbForm=Part|VerbType=Mod | יכול | יכולה | |
| HebBinyan=PAAL|Number=Sing|VerbForm=Part | יכולה | ||
| HebBinyan=PAAL|Number=Sing|VerbForm=Part|VerbType=Mod | יכול | יכולה | |
| HebBinyan=PAAL|Number=Plur|Person=1|Tense=Fut|VerbType=Mod | נוכל | ||
| HebBinyan=PAAL|Number=Plur|Person=3|Tense=Fut|VerbType=Mod | יוכלו | ||
| HebBinyan=PAAL|Number=Plur|Person=3|Tense=Pres|VerbForm=Part | יכולים | ||
| HebBinyan=PAAL|Number=Plur|Person=3|VerbForm=Part | יכולים | ||
| HebBinyan=PAAL|Number=Plur|Person=3|VerbForm=Part|VerbType=Mod | יכולים | ||
| HebBinyan=PAAL|Number=Plur|Tense=Pres|VerbForm=Part|VerbType=Mod | יכולים | ||
| HebBinyan=PAAL|Number=Plur|VerbForm=Part | יכולים | ||
| HebBinyan=PAAL|Number=Plur|VerbForm=Part|VerbType=Mod | יכולים | ||
| Number=Sing|Person=3|Tense=Fut|VerbType=Mod | יוכל | ||
| Number=Sing|Person=3|VerbForm=Part | יכולה | ||
| Number=Sing|VerbForm=Part | יכולה | ||
| Number=Sing|VerbForm=Part|VerbType=Mod | יכול | ||
| Number=Plur | יכולות | ||
| Number=Plur|Person=1|Tense=Fut|VerbType=Mod | נוכל | נוכל | |
| Number=Plur|Person=3|Tense=Fut|VerbType=Mod | יוכלו | יוכלו | |
| Number=Plur|VerbForm=Part | יכולים | ||
| Number=Plur|VerbForm=Part|VerbType=Mod | יכולים | יכולות |
NUM
439 NUM tokens (63% of all NUM tokens) have a non-empty value of Gender.
The most frequent other feature values with which NUM and Gender co-occurred: Definite=EMPTY (361; 82%), NumType=EMPTY (269; 61%).
NUM tokens may have the following values of Gender:
Fem(156; 36% of non-emptyGender): אחת, ארבע, שלוש, שתי, מאות, חמש, עשר, עשרות, שמונה, תשעMasc(283; 64% of non-emptyGender): אחד, שני, אלפי, מיליון, שלושה, ארבעה, חצי, מיליארד, עשרה, שבעהEMPTY(256): 20, 12, 10, 50, 100, 2, 200, 30, 1,600, 2014
| Paradigm אחת | Masc | Fem |
|---|---|---|
| _ | אחת | |
| Definite=Cons | אחת | |
| Definite=Cons|Number=Sing | אחד | |
| Definite=Cons|Number=Sing|NumType=Card | אחד | |
| Definite=Cons|NumType=Card | אחת | |
| Number=Sing | אחד | |
| Number=Sing|NumType=Card | אחד | אחת |
| NumType=Card | אחת |
PROPN
107 PROPN tokens (5% of all PROPN tokens) have a non-empty value of Gender.
The most frequent other feature values with which PROPN and Gender co-occurred: Definite=EMPTY (95; 89%).
PROPN tokens may have the following values of Gender:
Fem(33; 31% of non-emptyGender): קורונה, ועדת, כנסת, שבע, ארנונה, ארץ, באר, ברית, הגנה, הגנתMasc(74; 69% of non-emptyGender): לבן, קנאביס, כחול, בג”ץ, אוצר, בנק, בית, חוץ, חוק, ליכודEMPTY(2238): כנסת, ישראל, משרד, ירושלים, ברק, מדינת, חוק, צה”ל, ועדת, לבנון
Gender seems to be lexical feature of PROPN. 100% lemmas (69) occur only with one value of Gender.
DET
19 DET tokens (0% of all DET tokens) have a non-empty value of Gender.
The most frequent other feature values with which DET and Gender co-occurred: Definite=EMPTY (17; 89%), PronType=Ind (16; 84%).
DET tokens may have the following values of Gender:
Fem(8; 42% of non-emptyGender): איזו, איזושהי, כלשהיMasc(11; 58% of non-emptyGender): איזשהו, איזושהי, איזשהם, אלוEMPTY(6457): ה, כל, כול, כמה, הרבה, שום, עוד, אף, איזה, מיני
| Paradigm איזה | Masc | Fem |
|---|---|---|
| Definite=Cons|PronType=Ind | איזו | |
| Number=Sing|PronType=Ind | איזו | |
| Number=Sing|PronType=Int | איזו | |
| Number=Plur|PronType=Int|Typo=Yes | אלו |
SYM
18 SYM tokens (45% of all SYM tokens) have a non-empty value of Gender.
SYM tokens may have the following values of Gender:
Masc(18; 100% of non-emptyGender): %EMPTY(22): %, –, -, /, X
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender:
NOUN –[amod]–> ADJ (2180; 100%),
VERB –[nsubj]–> PRON (1425; 83%),
NOUN –[compound]–> NOUN (1070; 52%),
VERB –[nsubj]–> NOUN (887; 62%),
VERB –[conj]–> VERB (649; 70%),
NOUN –[acl:relcl]–> VERB (610; 71%),
NOUN –[conj]–> NOUN (610; 68%),
NOUN –[det]–> PRON (564; 96%),
NOUN –[nmod]–> NOUN (528; 52%),
NOUN –[nsubj]–> PRON (350; 80%).