Treebank Statistics: UD_Hebrew-HTB: Features: Gender
This feature is universal.
It occurs with 2 different values: Fem
, Masc
.
Some words have combined values of the feature; 1 combinations have been observed: Fem|Masc
.
67075 tokens (42%) have a non-empty value of Gender
.
13230 types (74%) occur at least once with a non-empty value of Gender
.
6692 lemmas (65%) occur at least once with a non-empty value of Gender
.
The feature is used with 7 part-of-speech tags: NOUN (37499; 23% instances), VERB (11302; 7% instances), ADJ (8289; 5% instances), PRON (7451; 5% instances), NUM (1369; 1% instances), AUX (1147; 1% instances), DET (18; 0% instances).
NOUN
37499 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NOUN
and Gender
co-occurred: Number=Sing (27680; 74%), Definite=EMPTY (25799; 69%).
NOUN
tokens may have the following values of Gender
:
Fem
(14071; 38% of non-emptyGender
): משטרה, ארץ, ממשלה, חברה, שנים, שנה, עבודה, ידי, מדינה, דרךFem,Masc
(96; 0% of non-emptyGender
): פנים_, פני, סכין, פנים, מטבע, סכינים, דופן, מטבעות, גיהנוםMasc
(23332; 62% of non-emptyGender
): בית, יום, משרד, %, שר, משפט, דבר, פועל, מקום, שבועEMPTY
(547): הכל, נק, ד, רעולי, אחים, רב, רח, __, באי, בטון
Gender
seems to be lexical feature of NOUN
. 98% lemmas (3955) occur only with one value of Gender
.
VERB
11302 VERB tokens (79% of all VERB
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which VERB
and Gender
co-occurred: Number=Sing (7671; 68%), VerbForm=EMPTY (7026; 62%), Voice=Act (6710; 59%), Person=3 (6611; 58%), Tense=Past (5664; 50%).
VERB
tokens may have the following values of Gender
:
Fem
(2540; 22% of non-emptyGender
): אומרת, יכולה, ניצחה, החליטה, היתה, אמרה, קיבלה, הגיעה, עלתה, תהיהFem,Masc
(2251; 20% of non-emptyGender
): היו, הגיעו, אמרו, מסרו, יהיו, יצאו, נפצעו, עלו, באו, ביקשוMasc
(6511; 58% of non-emptyGender
): אמר, יכול, אומר, עבר, נראה, מדובר, חולים, היה, כולל, עלהEMPTY
(2986): יש, אין, לעשות, לתת, לשלם, למנוע, לבצע, לקבל, למצוא, להשיג
Paradigm אמר | Fem,Masc | Masc | Fem |
---|---|---|---|
HebBinyan=PAAL|Number=Sing|Person=1,2,3|VerbForm=Part|Voice=Act | אומר | אומרת | |
HebBinyan=PAAL|Number=Sing|Person=1|Tense=Past|Voice=Act | אמרתי | ||
HebBinyan=PAAL|Number=Sing|Person=2|Tense=Fut|Voice=Act | תאמר | ||
HebBinyan=PAAL|Number=Sing|Person=2|Tense=Past|Voice=Act | אמרת | ||
HebBinyan=PAAL|Number=Sing|Person=3|Tense=Fut|Voice=Act | תאמר | ||
HebBinyan=PAAL|Number=Sing|Person=3|Tense=Past|Voice=Act | אמר | אמרה | |
HebBinyan=PAAL|Number=Plur|Person=1,2,3|VerbForm=Part|Voice=Act | אומרים | אומרות | |
HebBinyan=PAAL|Number=Plur|Person=1|Tense=Past|Voice=Act | אמרנו | ||
HebBinyan=PAAL|Number=Plur|Person=3|Tense=Past|Voice=Act | אמרו | ||
Mood=Imp|Number=Sing|Person=2 | אמור | ||
Number=Sing|Person=1|Tense=Fut | אומר | ||
Number=Sing|Person=3|Tense=Fut | יאמר | ||
Number=Plur|Person=3|Tense=Fut | יאמרו |
ADJ
8289 ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which ADJ
and Gender
co-occurred: Number=Sing (5932; 72%).
ADJ
tokens may have the following values of Gender
:
Fem
(3143; 38% of non-emptyGender
): ראשונה, חדשה, רבה, אחרת, ישראלית, לאומית, רבות, אחרות, כללית, גדולהMasc
(5146; 62% of non-emptyGender
): אחרים, ראשון, גדול, לאומי, חדש, אחר, צריך, רבים, רב, קשהEMPTY
(127): יתר, הינדית, בלטית, דמוי, הבעתי, התאבדותית, טכסיים, טרוריסטי, מינסוטיים, סטליניסטית
PRON
7451 PRON tokens (97% of all PRON
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which PRON
and Gender
co-occurred: Person=3 (6782; 91%), PronType=Prs (5796; 78%), Number=Sing (5499; 74%), Case=EMPTY (4866; 65%).
PRON
tokens may have the following values of Gender
:
Fem
(1975; 27% of non-emptyGender
): _היא, היא, זו, _הן, זאת, הן, עצמה, אותה, אותן, כלשהיFem,Masc
(565; 8% of non-emptyGender
): _אני, _אנחנו, אני, אנו, אלו, אנחנו, עצמי, עצמנו, הננו, אילוMasc
(4911; 66% of non-emptyGender
): _הוא, _הם, הוא, זה, הם, אלה, עצמו, _אתה, אותו, עצמםEMPTY
(255): כך, כן
Paradigm הוא | Fem,Masc | Masc | Fem |
---|---|---|---|
Case=Acc|Number=Sing|Person=1|PronType=Prs | _אני | ||
Case=Acc|Number=Sing|Person=2|PronType=Prs | _אתה | ||
Case=Acc|Number=Sing|Person=3|PronType=Prs | _הוא | _היא | |
Case=Acc|Number=Plur|Person=2|PronType=Prs | _אתם | ||
Case=Acc|Number=Plur|Person=3|PronType=Prs | _הם | _הן | |
Case=Gen|Number=Sing|Person=1|PronType=Prs | _אני | ||
Case=Gen|Number=Sing|Person=2|PronType=Prs | _אתה | _את | |
Case=Gen|Number=Sing|Person=3|PronType=Prs | _הוא | _היא | |
Case=Gen|Number=Plur|Person=1|PronType=Prs | _אנחנו | ||
Case=Gen|Number=Plur|Person=2|PronType=Prs | _אתם | ||
Case=Gen|Number=Plur|Person=3|PronType=Prs | _הם | _הן | |
Number=Sing|Person=1|PronType=Prs | אני, _אני | ||
Number=Sing|Person=2|PronType=Prs | _אתה, אתה | _את, את | |
Number=Sing|Person=3|Polarity=Pos | הוא | היא | |
Number=Sing|Person=3|PronType=Prs | _הוא, הוא | _היא, היא | |
Number=Plur|Person=1|PronType=Prs | _אנחנו, אנו, אנחנו | ||
Number=Plur|Person=2|PronType=Prs | _אתם, אתם | ||
Number=Plur|Person=3|Polarity=Pos | הם | הן | |
Number=Plur|Person=3|PronType=Prs | _הם, הם | _הן, הן |
NUM
1369 NUM tokens (42% of all NUM
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which NUM
and Gender
co-occurred: Number=Sing (994; 73%), Definite=EMPTY (949; 69%).
NUM
tokens may have the following values of Gender
:
Fem
(465; 34% of non-emptyGender
): אחת, שתי, שלוש, מאות, עשרות, מאה, ארבע, שנייה, שניה, שבעFem,Masc
(27; 2% of non-emptyGender
): עשרים, ששים, שמונים, שבעים, שישים, שלושים, אלפיים, ארבעים, מאתייםMasc
(877; 64% of non-emptyGender
): אחד, שני, מיליון, אלף, שלושה, ארבעה, מיליארד, שניים, אלפי, שלישיEMPTY
(1919): 1, 0, 2, 3, 20, 4, 10, 5, 11, 16
Paradigm שמונה | Masc | Fem |
---|---|---|
Definite=Cons | שמונה | |
שמונה | שמונה |
Gender
seems to be lexical feature of NUM
. 99% lemmas (69) occur only with one value of Gender
.
AUX
1147 AUX tokens (93% of all AUX
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which AUX
and Gender
co-occurred: VerbType=Cop (1147; 100%), Person=3 (1092; 95%), Number=Sing (881; 77%), Polarity=Pos (837; 73%), VerbForm=EMPTY (831; 72%), Tense=Past (681; 59%).
AUX
tokens may have the following values of Gender
:
Fem
(275; 24% of non-emptyGender
): היתה, אינה, תהיה, אינן, איננה, הינה, אינךFem,Masc
(207; 18% of non-emptyGender
): היו, יהיו, הייתי, היינו, אינני, איננו, איני, נהיהMasc
(665; 58% of non-emptyGender
): היה, אינו, יהיה, אינם, איננו, הינו, אינך, הייה, היית, תהיהEMPTY
(92): להיות, היו, יהיה, תהייה
Paradigm היה | Fem,Masc | Masc | Fem |
---|---|---|---|
Mood=Imp|Number=Sing|Person=2 | הייה, היה | ||
Number=Sing|Person=1|Tense=Past | הייתי | ||
Number=Sing|Person=2|Tense=Fut | תהיה | ||
Number=Sing|Person=2|Tense=Past | היית | ||
Number=Sing|Person=3|Tense=Fut | יהיה | תהיה | |
Number=Sing|Person=3|Tense=Past | היה | היתה | |
Number=Plur|Person=1|Tense=Fut | נהיה | ||
Number=Plur|Person=1|Tense=Past | היינו | ||
Number=Plur|Person=2|Tense=Past | הייתם | ||
Number=Plur|Person=3|Tense=Fut | יהיו | ||
Number=Plur|Person=3|Tense=Past | היו |
DET
18 DET tokens (0% of all DET
tokens) have a non-empty value of Gender
.
The most frequent other feature values with which DET
and Gender
co-occurred: PronType=EMPTY (18; 100%).
DET
tokens may have the following values of Gender
:
Masc
(18; 100% of non-emptyGender
): שאר, המון, מספיקEMPTY
(17263): ה, ה_, כל, כמה, רוב, הרבה, שום, מספר, אף, מרבית
Relations with Agreement in Gender
The 10 most frequent relations where parent and child node agree in Gender
:
NOUN –[amod]–> ADJ (6139; 97%),
VERB –[nsubj]–> NOUN (3221; 68%),
NOUN –[nmod]–> NOUN (2755; 52%),
NOUN –[nmod:poss]–> PRON (1338; 50%),
NOUN –[acl:relcl]–> VERB (1321; 65%),
NOUN –[conj]–> NOUN (1209; 60%),
VERB –[conj]–> VERB (1034; 72%),
VERB –[nsubj]–> PRON (763; 75%),
NOUN –[det]–> PRON (617; 90%),
NOUN –[nmod:poss]–> NOUN (513; 52%).