Treebank Statistics: UD_Hebrew-HTB: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc
.
67547 tokens (42%) have a non-empty value of Gender
.
13230 types (74%) occur at least once with a non-empty value of Gender
.
6693 lemmas (64%) occur at least once with a non-empty value of Gender
.
The feature is used with 7 part-of-speech tags: NOUN (37696; 23% instances), VERB (11272; 7% instances), ADJ (7901; 5% instances), PRON (7125; 4% instances), AUX (2151; 1% instances), NUM (1384; 1% instances), DET (18; 0% instances).
NOUN
37696 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (27851; 74%), Definite=EMPTY (25936; 69%).
NOUN
tokens may have the following values of Gender
:
Fem
(14155; 38% of non-emptyGender
): משטרה, ארץ, ממשלה, חברה, שנים, שנה, עבודה, ידי, מדינה, דרךFem,Masc
(96; 0% of non-emptyGender
): פנים_, פני, סכין, פנים, מטבע, סכינים, דופן, מטבעות, גיהנוםMasc
(23445; 62% of non-emptyGender
): בית, יום, משרד, %, שר, משפט, דבר, פועל, מקום, תלEMPTY
(550): הכל, נק, ד, רעולי, אחים, רב, רח, __, באי, בטון
Gender
seems to be lexical feature of NOUN
. 98% lemmas (3955) occur only with one value of Gender
.
VERB
11272 VERB tokens (79% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (7597; 67%), VerbForm=EMPTY (7030; 62%), Voice=Act (6805; 60%), Person=3 (6636; 59%), Tense=Past (5698; 51%).
VERB
tokens may have the following values of Gender
:
Fem
(2516; 22% of non-emptyGender
): אומרת, ניצחה, החליטה, היתה, אמרה, קיבלה, תהיה, הגיעה, עלתה, באהFem,Masc
(2255; 20% of non-emptyGender
): היו, הגיעו, אמרו, מסרו, יהיו, יצאו, נפצעו, עלו, עשו, באוMasc
(6501; 58% of non-emptyGender
): אמר, אומר, עבר, נראה, מדובר, חולים, היה, כולל, יודע, רביםEMPTY
(3004): יש, אין, לעשות, לתת, לשלם, למנוע, לבצע, לקבל, למצוא, להשיג
Paradigm אמר | Fem,Masc | Masc | Fem |
---|---|---|---|
HebBinyan=PAAL|Number=Sing|Person=1,2,3|VerbForm=Part|Voice=Act | אומר | אומרת | |
HebBinyan=PAAL|Number=Sing|Person=1|Tense=Past|Voice=Act | אמרתי | ||
HebBinyan=PAAL|Number=Sing|Person=2|Tense=Fut|Voice=Act | תאמר | ||
HebBinyan=PAAL|Number=Sing|Person=2|Tense=Past|Voice=Act | אמרת | ||
HebBinyan=PAAL|Number=Sing|Person=3|Tense=Fut|Voice=Act | תאמר | ||
HebBinyan=PAAL|Number=Sing|Person=3|Tense=Past|Voice=Act | אמר | אמרה | |
HebBinyan=PAAL|Number=Plur|Person=1,2,3|VerbForm=Part|Voice=Act | אומרים | אומרות | |
HebBinyan=PAAL|Number=Plur|Person=1|Tense=Past|Voice=Act | אמרנו | ||
HebBinyan=PAAL|Number=Plur|Person=3|Tense=Past|Voice=Act | אמרו | ||
Mood=Imp|Number=Sing|Person=2 | אמור | ||
Number=Sing|Person=1|Tense=Fut | אומר | ||
Number=Sing|Person=3|Tense=Fut | יאמר | ||
Number=Plur|Person=3|Tense=Fut | יאמרו |
ADJ
7901 ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (5619; 71%).
ADJ
tokens may have the following values of Gender
:
Fem
(3064; 39% of non-emptyGender
): ראשונה, חדשה, רבה, אחרת, ישראלית, לאומית, רבות, אחרות, כללית, גדולהMasc
(4837; 61% of non-emptyGender
): אחרים, ראשון, גדול, לאומי, חדש, אחר, רבים, רב, טוב, ישראליEMPTY
(131): יתר, הינדית, בלטית, דמוי, הבעתי, התאבדותית, טכסיים, טרוריסטי, מינסוטיים, סטליניסטית
PRON
7125 PRON tokens (97% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Person=3 (6448; 90%), PronType=Prs (5848; 82%), Number=Sing (5211; 73%), Case=EMPTY (4520; 63%).
PRON
tokens may have the following values of Gender
:
Fem
(1811; 25% of non-emptyGender
): _היא, זו, היא, _הן, זאת, הן, עצמה, אותה, אותן, כלשהיFem,Masc
(572; 8% of non-emptyGender
): _אני, _אנחנו, אני, אנו, אלו, אנחנו, עצמי, עצמנו, הננו, אילוMasc
(4742; 67% of non-emptyGender
): _הוא, _הם, הוא, זה, הם, אלה, עצמו, _אתה, אותו, עצמםEMPTY
(256): כך, כן
Paradigm הוא | Fem,Masc | Masc | Fem |
---|---|---|---|
Case=Acc|Number=Sing|Person=1 | _אני | ||
Case=Acc|Number=Sing|Person=2 | _אתה | ||
Case=Acc|Number=Sing|Person=3 | _הוא | _היא | |
Case=Acc|Number=Plur|Person=2 | _אתם | ||
Case=Acc|Number=Plur|Person=3 | _הם | _הן | |
Case=Gen|Number=Sing|Person=1 | _אני | ||
Case=Gen|Number=Sing|Person=2 | _אתה | _את | |
Case=Gen|Number=Sing|Person=3 | _הוא | _היא | |
Case=Gen|Number=Plur|Person=1 | _אנחנו | ||
Case=Gen|Number=Plur|Person=2 | _אתם | ||
Case=Gen|Number=Plur|Person=3 | _הם | _הן | |
Number=Sing|Person=1 | אני, _אני | ||
Number=Sing|Person=2 | _אתה, אתה | _את, את | |
Number=Sing|Person=3 | _הוא, הוא | _היא, היא | |
Number=Plur|Person=1 | _אנחנו, אנו, אנחנו | ||
Number=Plur|Person=2 | _אתם, אתם | ||
Number=Plur|Person=3 | _הם, הם | _הן, הן |
AUX
2151 AUX tokens (86% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: Number=Sing (1694; 79%), VerbType=Cop (1551; 72%), Person=3 (1513; 70%), VerbForm=EMPTY (1321; 61%), Polarity=Pos (1235; 57%), Tense=EMPTY (1213; 56%).
AUX
tokens may have the following values of Gender
:
Fem
(593; 28% of non-emptyGender
): היא, היתה, אינה, תהיה, יכולה, אינן, הן, איננה, עלולה, חייבתFem,Masc
(232; 11% of non-emptyGender
): היו, יהיו, הייתי, יוכלו, היינו, אינני, איננו, מאפשר, נוכל, איניMasc
(1326; 62% of non-emptyGender
): היה, הוא, אינו, יהיה, אינם, יכול, הם, צריך, קשה, ניתןEMPTY
(336): אפשר, להיות, יש, ייתכן, אין, אסור, כדאי, מוטב, מותר, תוכל
Paradigm היה | Fem,Masc | Masc | Fem |
---|---|---|---|
Mood=Imp|Number=Sing|Person=2 | הייה, היה | ||
Number=Sing|Person=1|Tense=Past | הייתי | ||
Number=Sing|Person=2|Tense=Fut | תהיה | ||
Number=Sing|Person=2|Tense=Past | היית | ||
Number=Sing|Person=3|Tense=Fut | יהיה | תהיה | |
Number=Sing|Person=3|Tense=Past | היה | היתה | |
Number=Plur|Person=1|Tense=Fut | נהיה | ||
Number=Plur|Person=1|Tense=Past | היינו | ||
Number=Plur|Person=2|Tense=Past | הייתם | ||
Number=Plur|Person=3|Tense=Fut | יהיו | ||
Number=Plur|Person=3|Tense=Past | היו |
NUM
1384 NUM tokens (42% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Number=Sing (1007; 73%), Definite=EMPTY (960; 69%).
NUM
tokens may have the following values of Gender
:
Fem
(472; 34% of non-emptyGender
): אחת, שתי, שלוש, מאות, עשרות, מאה, ארבע, שנייה, שניה, שבעFem,Masc
(27; 2% of non-emptyGender
): עשרים, ששים, שמונים, שבעים, שישים, שלושים, אלפיים, ארבעים, מאתייםMasc
(885; 64% of non-emptyGender
): אחד, שני, מיליון, אלף, שלושה, ארבעה, מיליארד, שניים, אלפי, שלישיEMPTY
(1925): 1, 0, 2, 3, 4, 02, 5, 01, 11, 21
Paradigm שמונה | Masc | Fem |
---|---|---|
Definite=Cons | שמונה | |
שמונה | שמונה |
Gender
seems to be lexical feature of NUM
. 99% lemmas (70) occur only with one value of Gender
.
DET
18 DET tokens (0% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: Definite=Cons (18; 100%), PronType=EMPTY (18; 100%).
DET
tokens may have the following values of Gender
:
Masc
(18; 100% of non-emptyGender
): שאר, המון, מספיקEMPTY
(17406): ה, ה_, כל, כמה, הרבה, רוב, שום, מספר, אף, מרבית
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (6169; 97%),
VERB –[nsubj]–> NOUN (3183; 67%),
NOUN –[nmod]–> NOUN (2715; 52%),
NOUN –[nmod:poss]–> PRON (1348; 50%),
NOUN –[acl:relcl]–> VERB (1309; 62%),
NOUN –[conj]–> NOUN (1213; 60%),
VERB –[conj]–> VERB (1024; 70%),
VERB –[nsubj]–> PRON (762; 76%),
NOUN –[det]–> PRON (619; 90%),
NOUN –[nmod:poss]–> NOUN (521; 52%).