Treebank Statistics: UD_Hebrew-IAHLTknesset: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc
.
27741 tokens (41%) have a non-empty value of Gender
.
5941 types (79%) occur at least once with a non-empty value of Gender
.
3529 lemmas (76%) occur at least once with a non-empty value of Gender
.
The feature is used with 9 part-of-speech tags: NOUN (12993; 19% instances), PRON (5548; 8% instances), VERB (4879; 7% instances), ADJ (3090; 5% instances), AUX (648; 1% instances), NUM (439; 1% instances), PROPN (107; 0% instances), DET (19; 0% instances), SYM (18; 0% instances).
NOUN
12993 NOUN tokens (100% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Definite=EMPTY (10285; 79%), Number=Sing (9629; 74%).
NOUN
tokens may have the following values of Gender
:
Fem
(4969; 38% of non-emptyGender
): ממשלה, מדינה, וועדה, מדינת, שנים, שנה, ידי, דרך, בעיה, פעםFem,Masc
(14; 0% of non-emptyGender
): פני, אוכלוסייה, אנוש, טבע, ישע, סופ, עצם, פנים, ציפוריMasc
(8010; 62% of non-emptyGender
): ראש, חוק, דבר, יושב, חברי, שר, חבר, נושא, אדונ, דברים
Paradigm פנים | Fem,Masc | Masc | Fem |
---|---|---|---|
Definite=Cons|Number=Plur | פני | פני | |
Number=Sing | פנים | ||
Number=Plur | פני, פנים | פנים, פני | פני |
Gender
seems to be lexical feature of NOUN
. 97% lemmas (2051) occur only with one value of Gender
.
PRON
5548 PRON tokens (87% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Poss=EMPTY (4906; 88%), Case=EMPTY (4896; 88%), Definite=EMPTY (4819; 87%), PronType=Prs (4087; 74%), Number=Sing (3965; 71%), Person=3 (3436; 62%).
PRON
tokens may have the following values of Gender
:
Fem
(1089; 20% of non-emptyGender
): ה, זאת, היא, אני, זו, הן, י, ן, אותה, אתFem,Masc
(181; 3% of non-emptyGender
): אני, י, נו, אנחנו, אלו, ך, עצמיMasc
(4278; 77% of non-emptyGender
): זה, אני, ו, הם, הוא, אנחנו, י, נו, אתה, םEMPTY
(814): מה, י, נו, מי, כך, אני, אנחנו, כן, ך, ני
Paradigm הוא | Fem,Masc | Masc | Fem |
---|---|---|---|
Case=Acc|Number=Sing|Person=1 | ני | ||
Case=Acc|Number=Sing|Person=2 | אתה | ||
Case=Acc|Number=Sing|Person=3 | ה | ||
Case=Acc|Number=Plur|Person=1 | נו | ||
Case=Acc|Number=Plur|Person=2 | כם | ||
Case=Acc|Number=Plur|Person=3 | ן | ||
Case=Gen|Definite=Def|Number=Sing|Person=1|Poss=Yes | י | י | י |
Case=Gen|Definite=Def|Number=Sing|Person=2|Poss=Yes | ך | ||
Case=Gen|Definite=Def|Number=Sing|Person=3|Poss=Yes | ו, הו | ה | |
Case=Gen|Definite=Def|Number=Plur|Person=1|Poss=Yes | נו | נו | נו |
Case=Gen|Definite=Def|Number=Plur|Person=2|Poss=Yes | כם | ||
Case=Gen|Definite=Def|Number=Plur|Person=3|Poss=Yes | ם, הם, נו | ן, הן | |
Definite=Def|Number=Sing|Person=3 | ו | ||
Number=Sing|Person=1 | אני, י | אני, י | אני, י |
Number=Sing|Person=2 | ך | אתה, ך | את, ך |
Number=Sing|Person=3 | הוא, ו, יו | היא, ה | |
Number=Plur|Person=1 | אנחנו, נו | אנחנו, נו, אנו | נו, אנחנו |
Number=Plur|Person=2 | אתם, כם | ||
Number=Plur|Person=3 | הם, ם, המה, נו | הן, ן | |
Number=Plur|Person=3|Typo=Yes | ה | ||
Person=2 | ך |
VERB
4879 VERB tokens (66% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Voice=Act (3937; 81%), Person=3 (3120; 64%), Number=Sing (3081; 63%), VerbForm=Part (2557; 52%), Tense=Pres (2497; 51%).
VERB
tokens may have the following values of Gender
:
Fem
(891; 18% of non-emptyGender
): אומרת, היתה, חושבת, הייתה, היו, תהיה, רוצה, יודעת, נמצאת, מבקשתFem,Masc
(67; 1% of non-emptyGender
): אמרתי, באו, קיבלתי, שמעתי, אמרת, אסביר, דיברו, הבנו, נצליח, עשיתיMasc
(3921; 80% of non-emptyGender
): צריך, רוצה, אומר, חושב, יודע, רוצים, מדברים, יודעים, היה, נמצאיםEMPTY
(2488): יש, אין, אפשר, לעשות, להיות, להגיד, לדבר, לומר, לתת, לראות
Paradigm אמר | Fem,Masc | Masc | Fem |
---|---|---|---|
Aspect=Prog|Number=Sing|Person=1|Tense=Past|VerbForm=Part | אומר | ||
Aspect=Prog|Number=Sing|Person=3|Tense=Past|VerbForm=Part | אומר | ||
Mood=Irr|Number=Sing|Person=3|VerbForm=Part | אומר | ||
Mood=Irr|Number=Plur|Person=3|Tense=Pres|VerbForm=Part | אומרים | ||
Number=Sing|Person=1|Tense=Fut|VerbForm=Part | אומר | ||
Number=Sing|Person=1|Tense=Fut | אומר | ||
Number=Sing|Person=1|Tense=Past | אמרתי | אמרתי | אמרתי |
Number=Sing|Person=1|Tense=Pres|VerbForm=Part | אומר | אומרת | |
Number=Sing|Person=2|Tense=Fut | תאמר | ||
Number=Sing|Person=2|Tense=Past | אמרת | אמרת | אמרת |
Number=Sing|Person=2|Tense=Pres|VerbForm=Part | אומר | אומרת | |
Number=Sing|Person=3|Tense=Fut | נאמר | ||
Number=Sing|Person=3|Tense=Past | אמר | אמרה | |
Number=Sing|Person=3|Tense=Pres|VerbForm=Part | אומר | אומרת | |
Number=Plur|Person=1|Tense=Past | אמרנו | אמרנו | |
Number=Plur|Person=1|Tense=Pres|VerbForm=Part | אומרים | ||
Number=Plur|Person=2|Tense=Past | אמרתם | ||
Number=Plur|Person=3|Tense=Past | אמרו | אמרו | |
Number=Plur|Person=3|Tense=Pres|VerbForm=Part | אומרים |
ADJ
3090 ADJ tokens (100% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (2339; 76%).
ADJ
tokens may have the following values of Gender
:
Fem
(1146; 37% of non-emptyGender
): ראשונה, רבה, קודמת, גדולה, אחרת, מקומיות, אחרונות, ערבית, ציבורית, טובהMasc
(1944; 63% of non-emptyGender
): חשוב, נכון, יהודי, גדול, טוב, שני, ראשון, אחרים, אחר, בר
Paradigm אחר | Masc | Fem |
---|---|---|
Number=Sing | אחר | אחרת |
Number=Plur | אחרים | אחרות |
AUX
648 AUX tokens (91% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: VerbForm=EMPTY (472; 73%), Number=Sing (451; 70%), Tense=EMPTY (352; 54%), Person=EMPTY (330; 51%), HebBinyan=PAAL (328; 51%).
AUX
tokens may have the following values of Gender
:
Fem
(145; 22% of non-emptyGender
): היתה, הייתה, צריכה, יכולה, תהיה, אינה, היו, אמורה, הייתי, יכולותFem,Masc
(1; 0% of non-emptyGender
): יוכלוMasc
(502; 77% of non-emptyGender
): היה, יכול, צריך, צריכים, יכולים, יהיה, היו, הייתי, היינו, חייביםEMPTY
(65): להיות, הייתי, היינו, נוכל, יהיו, יכולנו, יכולתי
Paradigm יכל | Fem,Masc | Masc | Fem |
---|---|---|---|
HebBinyan=PAAL|Number=Sing|Person=1|Tense=Fut|VerbType=Mod | אוכל | ||
HebBinyan=PAAL|Number=Sing|Person=1|Tense=Past|VerbType=Mod | יכולתי | יכולתי | |
HebBinyan=PAAL|Number=Sing|Person=3|Tense=Fut|VerbType=Mod | יוכל | תוכל | |
HebBinyan=PAAL|Number=Sing|Person=3|Tense=Pres|VerbForm=Part | יכול | ||
HebBinyan=PAAL|Number=Sing|Person=3|Tense=Pres|VerbForm=Part|VerbType=Mod | יכולה | ||
HebBinyan=PAAL|Number=Sing|Person=3|VerbForm=Part | יכולה | ||
HebBinyan=PAAL|Number=Sing|Person=3|VerbForm=Part|VerbType=Mod | יכול | יכולה | |
HebBinyan=PAAL|Number=Sing|VerbForm=Part | יכולה | ||
HebBinyan=PAAL|Number=Sing|VerbForm=Part|VerbType=Mod | יכול | יכולה | |
HebBinyan=PAAL|Number=Plur|Person=1|Tense=Fut|VerbType=Mod | נוכל | ||
HebBinyan=PAAL|Number=Plur|Person=3|Tense=Fut|VerbType=Mod | יוכלו | ||
HebBinyan=PAAL|Number=Plur|Person=3|Tense=Pres|VerbForm=Part | יכולים | ||
HebBinyan=PAAL|Number=Plur|Person=3|VerbForm=Part | יכולים | ||
HebBinyan=PAAL|Number=Plur|Person=3|VerbForm=Part|VerbType=Mod | יכולים | ||
HebBinyan=PAAL|Number=Plur|Tense=Pres|VerbForm=Part|VerbType=Mod | יכולים | ||
HebBinyan=PAAL|Number=Plur|VerbForm=Part | יכולים | ||
HebBinyan=PAAL|Number=Plur|VerbForm=Part|VerbType=Mod | יכולים | ||
Number=Sing|Person=3|Tense=Fut|VerbType=Mod | יוכל | ||
Number=Sing|Person=3|VerbForm=Part | יכולה | ||
Number=Sing|VerbForm=Part | יכולה | ||
Number=Sing|VerbForm=Part|VerbType=Mod | יכול | ||
Number=Plur | יכולות | ||
Number=Plur|Person=1|Tense=Fut|VerbType=Mod | נוכל | נוכל | |
Number=Plur|Person=3|Tense=Fut|VerbType=Mod | יוכלו | יוכלו | |
Number=Plur|VerbForm=Part | יכולים | ||
Number=Plur|VerbForm=Part|VerbType=Mod | יכולים | יכולות |
NUM
439 NUM tokens (63% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Definite=EMPTY (361; 82%), NumType=EMPTY (269; 61%).
NUM
tokens may have the following values of Gender
:
Fem
(156; 36% of non-emptyGender
): אחת, ארבע, שלוש, שתי, מאות, חמש, עשר, עשרות, שמונה, תשעMasc
(283; 64% of non-emptyGender
): אחד, שני, אלפי, מיליון, שלושה, ארבעה, חצי, מיליארד, עשרה, שבעהEMPTY
(256): 20, 12, 10, 50, 100, 2, 200, 30, 1,600, 2014
Paradigm אחת | Masc | Fem |
---|---|---|
_ | אחת | |
Definite=Cons | אחת | |
Definite=Cons|Number=Sing | אחד | |
Definite=Cons|Number=Sing|NumType=Card | אחד | |
Definite=Cons|NumType=Card | אחת | |
Number=Sing | אחד | |
Number=Sing|NumType=Card | אחד | אחת |
NumType=Card | אחת |
PROPN
107 PROPN tokens (5% of all PROPN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PROPN
and Gender
co-occurred: Definite=EMPTY (95; 89%).
PROPN
tokens may have the following values of Gender
:
Fem
(33; 31% of non-emptyGender
): קורונה, ועדת, כנסת, שבע, ארנונה, ארץ, באר, ברית, הגנה, הגנתMasc
(74; 69% of non-emptyGender
): לבן, קנאביס, כחול, בג”ץ, אוצר, בנק, בית, חוץ, חוק, ליכודEMPTY
(2238): כנסת, ישראל, משרד, ירושלים, ברק, מדינת, חוק, צה”ל, ועדת, לבנון
Gender
seems to be lexical feature of PROPN
. 100% lemmas (69) occur only with one value of Gender
.
DET
19 DET tokens (0% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Definite=EMPTY (17; 89%), PronType=Ind (16; 84%).
DET
tokens may have the following values of Gender
:
Fem
(8; 42% of non-emptyGender
): איזו, איזושהי, כלשהיMasc
(11; 58% of non-emptyGender
): איזשהו, איזושהי, איזשהם, אלוEMPTY
(6457): ה, כל, כול, כמה, הרבה, שום, עוד, אף, איזה, מיני
Paradigm איזה | Masc | Fem |
---|---|---|
Definite=Cons|PronType=Ind | איזו | |
Number=Sing|PronType=Ind | איזו | |
Number=Sing|PronType=Int | איזו | |
Number=Plur|PronType=Int|Typo=Yes | אלו |
SYM
18 SYM tokens (45% of all SYM
tokens) have a non-empty value of Gender
.
SYM
tokens may have the following values of Gender
:
Masc
(18; 100% of non-emptyGender
): %EMPTY
(22): %, –, -, /, X
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (2179; 100%),
VERB –[nsubj]–> PRON (1425; 83%),
NOUN –[compound]–> NOUN (1070; 52%),
VERB –[nsubj]–> NOUN (887; 62%),
VERB –[conj]–> VERB (649; 70%),
NOUN –[acl:relcl]–> VERB (610; 71%),
NOUN –[conj]–> NOUN (610; 68%),
NOUN –[det]–> PRON (564; 96%),
NOUN –[nmod]–> NOUN (528; 52%),
NOUN –[nsubj]–> PRON (350; 80%).