Treebank Statistics: UD_Hebrew-HTB: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
Some words have combined values of the feature; 2 combinations have been observed: Dual|Plur
, Plur|Sing
.
67539 tokens (42%) have a non-empty value of Number
.
13229 types (74%) occur at least once with a non-empty value of Number
.
6689 lemmas (64%) occur at least once with a non-empty value of Number
.
The feature is used with 6 part-of-speech tags: NOUN (37706; 23% instances), VERB (11272; 7% instances), ADJ (7901; 5% instances), PRON (7125; 4% instances), AUX (2151; 1% instances), NUM (1384; 1% instances).
NOUN
37706 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Definite=EMPTY (25940; 69%), Gender=Masc (23438; 62%).
NOUN
tokens may have the following values of Number
:
Dual
(85; 0% of non-emptyNumber
): שנתיים, חודשיים, שבועיים, יומיים, פעמיים, שעתיים, משקפיים, קרנייםDual,Plur
(6; 0% of non-emptyNumber
): שוליים, שפתייםPlur
(9605; 25% of non-emptyNumber
): שנים, ימים, ידי, בתי, בחירות, בני, עובדים, נקודות, אנשים, חברותPlur,Sing
(151; 0% of non-emptyNumber
): %, ס”ם, ברוטוSing
(27859; 74% of non-emptyNumber
): בית, יום, משרד, משטרה, ארץ, שר, משפט, ממשלה, חברה, דברEMPTY
(540): הכל, נק, ד, רעולי, רב, רח, באי, בטון, מאה, מלמין
Paradigm שנה | Sing | Dual | Plur |
---|---|---|---|
Definite=Cons | שנת | שנות | |
Definite=Def | שנה_ | ||
שנה | שנתיים | שנים |
VERB
11272 VERB tokens (79% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: VerbForm=EMPTY (7030; 62%), Voice=Act (6805; 60%), Person=3 (6636; 59%), Gender=Masc (6501; 58%), Tense=Past (5698; 51%).
VERB
tokens may have the following values of Number
:
Plur
(3675; 33% of non-emptyNumber
): חולים, היו, רבים, הגיעו, רוצים, אמרו, מסרו, יהיו, אומרים, יצאוSing
(7597; 67% of non-emptyNumber
): אמר, אומר, עבר, נראה, מדובר, היה, כולל, יודע, עלה, רוצהEMPTY
(3004): יש, אין, לעשות, לתת, לשלם, למנוע, לבצע, לקבל, למצוא, להשיג
Paradigm אמר | Sing | Plur |
---|---|---|
Gender=Masc|HebBinyan=PAAL|Person=1,2,3|VerbForm=Part|Voice=Act | אומר | אומרים |
Gender=Masc|HebBinyan=PAAL|Person=2|Tense=Fut|Voice=Act | תאמר | |
Gender=Masc|HebBinyan=PAAL|Person=2|Tense=Past|Voice=Act | אמרת | |
Gender=Masc|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמר | |
Gender=Masc|Mood=Imp|Person=2 | אמור | |
Gender=Masc|Person=3|Tense=Fut | יאמר | |
Gender=Fem,Masc|HebBinyan=PAAL|Person=1|Tense=Past|Voice=Act | אמרתי | אמרנו |
Gender=Fem,Masc|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמרו | |
Gender=Fem,Masc|Person=1|Tense=Fut | אומר | |
Gender=Fem,Masc|Person=3|Tense=Fut | יאמרו | |
Gender=Fem|HebBinyan=PAAL|Person=1,2,3|VerbForm=Part|Voice=Act | אומרת | אומרות |
Gender=Fem|HebBinyan=PAAL|Person=3|Tense=Fut|Voice=Act | תאמר | |
Gender=Fem|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמרה |
ADJ
7901 ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Gender=Masc (4837; 61%).
ADJ
tokens may have the following values of Number
:
Plur
(2282; 29% of non-emptyNumber
): אחרים, רבים, אחרונים, שונים, חדשים, רבות, אחרות, גדולים, שונות, אחרונותSing
(5619; 71% of non-emptyNumber
): ראשון, גדול, לאומי, חדש, אחר, ראשונה, רב, טוב, ישראלי, אמריקאיEMPTY
(131): יתר, הינדית, בלטית, דמוי, הבעתי, התאבדותית, טכסיים, טרוריסטי, מינסוטיים, סטליניסטית
PRON
7125 PRON tokens (97% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Person=3 (6448; 90%), PronType=Prs (5848; 82%), Gender=Masc (4742; 67%), Case=EMPTY (4520; 63%).
PRON
tokens may have the following values of Number
:
Plur
(1913; 27% of non-emptyNumber
): _הם, הם, אלה, _הן, _אנחנו, הן, אנו, אלו, עצמם, הללוPlur,Sing
(1; 0% of non-emptyNumber
): אילוSing
(5211; 73% of non-emptyNumber
): _הוא, _היא, הוא, זה, זו, היא, _אני, זאת, אני, עצמוEMPTY
(256): כך, כן
AUX
2151 AUX tokens (86% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: VerbType=Cop (1551; 72%), Person=3 (1513; 70%), Gender=Masc (1326; 62%), VerbForm=EMPTY (1321; 61%), Polarity=Pos (1235; 57%), Tense=EMPTY (1213; 56%).
AUX
tokens may have the following values of Number
:
Plur
(457; 21% of non-emptyNumber
): היו, אינם, הם, אינן, יהיו, הן, יוכלו, יכולים, מוכנים, עלוליםSing
(1694; 79% of non-emptyNumber
): היה, הוא, היא, היתה, אינו, יהיה, אינה, יכול, צריך, תהיהEMPTY
(336): אפשר, להיות, יש, ייתכן, אין, אסור, כדאי, מוטב, מותר, תוכל
Paradigm היה | Sing | Plur |
---|---|---|
Gender=Masc|Mood=Imp|Person=2 | הייה, היה | |
Gender=Masc|Person=2|Tense=Fut | תהיה | |
Gender=Masc|Person=2|Tense=Past | היית | הייתם |
Gender=Masc|Person=3|Tense=Fut | יהיה | |
Gender=Masc|Person=3|Tense=Past | היה | |
Gender=Fem,Masc|Person=1|Tense=Fut | נהיה | |
Gender=Fem,Masc|Person=1|Tense=Past | הייתי | היינו |
Gender=Fem,Masc|Person=3|Tense=Fut | יהיו | |
Gender=Fem,Masc|Person=3|Tense=Past | היו | |
Gender=Fem|Person=3|Tense=Fut | תהיה | |
Gender=Fem|Person=3|Tense=Past | היתה |
NUM
1384 NUM tokens (42% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: Definite=EMPTY (960; 69%), Gender=Masc (885; 64%).
NUM
tokens may have the following values of Number
:
Dual
(1; 0% of non-emptyNumber
): אלפייםPlur
(376; 27% of non-emptyNumber
): שני, שתי, מאות, שניים, אלפי, עשרות, מיליוני, אלפים, מיליארדי, מיליארדיםSing
(1007; 73% of non-emptyNumber
): אחד, אחת, מיליון, אלף, שלושה, שלוש, שני, ארבעה, מיליארד, מאהEMPTY
(1925): 1, 0, 2, 3, 4, 02, 5, 01, 11, 21
Paradigm שני | Sing | Plur |
---|---|---|
Definite=Cons | שני | |
שני |
Number
seems to be lexical feature of NUM
. 99% lemmas (70) occur only with one value of Number
.
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (6174; 97%),
NOUN –[compound:smixut]–> NOUN (4291; 59%),
VERB –[nsubj]–> NOUN (4099; 87%),
NOUN –[nmod]–> NOUN (3282; 63%),
NOUN –[nmod:poss]–> PRON (1706; 64%),
NOUN –[acl:relcl]–> VERB (1670; 79%),
NOUN –[conj]–> NOUN (1528; 76%),
VERB –[conj]–> VERB (1124; 76%),
VERB –[nsubj]–> PRON (973; 96%),
NOUN –[det]–> PRON (673; 98%).