Treebank Statistics: UD_Hebrew-HTB: Features: Number
This feature is universal.
It occurs with 3 different values: Dual
, Plur
, Sing
.
Some words have combined values of the feature; 2 combinations have been observed: Dual|Plur
, Plur|Sing
.
67067 tokens (42%) have a non-empty value of Number
.
13229 types (74%) occur at least once with a non-empty value of Number
.
6688 lemmas (65%) occur at least once with a non-empty value of Number
.
The feature is used with 6 part-of-speech tags: NOUN (37509; 23% instances), VERB (11302; 7% instances), ADJ (8289; 5% instances), PRON (7451; 5% instances), NUM (1369; 1% instances), AUX (1147; 1% instances).
NOUN
37509 NOUN tokens (99% of all NOUN
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NOUN
and Number
co-occurred: Definite=EMPTY (25803; 69%), Gender=Masc (23325; 62%).
NOUN
tokens may have the following values of Number
:
Dual
(83; 0% of non-emptyNumber
): שנתיים, חודשיים, שבועיים, יומיים, פעמיים, שעתיים, משקפיים, קרנייםDual,Plur
(6; 0% of non-emptyNumber
): שוליים, שפתייםPlur
(9581; 26% of non-emptyNumber
): שנים, ימים, ידי, בתי, בחירות, עובדים, בני, נקודות, אנשים, חברותPlur,Sing
(151; 0% of non-emptyNumber
): %, ס”ם, ברוטוSing
(27688; 74% of non-emptyNumber
): בית, יום, משרד, משטרה, שר, משפט, ארץ, ממשלה, חברה, דברEMPTY
(537): הכל, נק, ד, רעולי, רב, רח, באי, בטון, מאה, מלמין
Paradigm שנה | Sing | Dual | Plur |
---|---|---|---|
Definite=Cons | שנת | שנות | |
Definite=Def | שנה_ | ||
שנה | שנתיים | שנים |
VERB
11302 VERB tokens (79% of all VERB
tokens) have a non-empty value of Number
.
The most frequent other feature values with which VERB
and Number
co-occurred: VerbForm=EMPTY (7026; 62%), Voice=Act (6710; 59%), Person=3 (6611; 58%), Gender=Masc (6511; 58%), Tense=Past (5664; 50%).
VERB
tokens may have the following values of Number
:
Plur
(3631; 32% of non-emptyNumber
): היו, חולים, הגיעו, רוצים, אמרו, מסרו, יהיו, אומרים, יצאו, נפצעוSing
(7671; 68% of non-emptyNumber
): אמר, יכול, אומר, עבר, נראה, מדובר, היה, כולל, עלה, רוצהEMPTY
(2986): יש, אין, לעשות, לתת, לשלם, למנוע, לבצע, לקבל, למצוא, להשיג
Paradigm אמר | Sing | Plur |
---|---|---|
Gender=Masc|HebBinyan=PAAL|Person=1,2,3|VerbForm=Part|Voice=Act | אומר | אומרים |
Gender=Masc|HebBinyan=PAAL|Person=2|Tense=Fut|Voice=Act | תאמר | |
Gender=Masc|HebBinyan=PAAL|Person=2|Tense=Past|Voice=Act | אמרת | |
Gender=Masc|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמר | |
Gender=Masc|Mood=Imp|Person=2 | אמור | |
Gender=Masc|Person=3|Tense=Fut | יאמר | |
Gender=Fem,Masc|HebBinyan=PAAL|Person=1|Tense=Past|Voice=Act | אמרתי | אמרנו |
Gender=Fem,Masc|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמרו | |
Gender=Fem,Masc|Person=1|Tense=Fut | אומר | |
Gender=Fem,Masc|Person=3|Tense=Fut | יאמרו | |
Gender=Fem|HebBinyan=PAAL|Person=1,2,3|VerbForm=Part|Voice=Act | אומרת | אומרות |
Gender=Fem|HebBinyan=PAAL|Person=3|Tense=Fut|Voice=Act | תאמר | |
Gender=Fem|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמרה |
ADJ
8289 ADJ tokens (98% of all ADJ
tokens) have a non-empty value of Number
.
The most frequent other feature values with which ADJ
and Number
co-occurred: Gender=Masc (5146; 62%).
ADJ
tokens may have the following values of Number
:
Plur
(2357; 28% of non-emptyNumber
): אחרים, רבים, אחרונים, חדשים, שונים, רבות, אחרות, גדולים, שונות, אחרונותSing
(5932; 72% of non-emptyNumber
): ראשון, גדול, לאומי, חדש, אחר, קשה, ראשונה, צריך, רב, טובEMPTY
(127): יתר, הינדית, בלטית, דמוי, הבעתי, התאבדותית, טכסיים, טרוריסטי, מינסוטיים, סטליניסטית
PRON
7451 PRON tokens (97% of all PRON
tokens) have a non-empty value of Number
.
The most frequent other feature values with which PRON
and Number
co-occurred: Person=3 (6782; 91%), PronType=Prs (5796; 78%), Gender=Masc (4911; 66%), Case=EMPTY (4866; 65%).
PRON
tokens may have the following values of Number
:
Plur
(1951; 26% of non-emptyNumber
): _הם, הם, אלה, _הן, _אנחנו, הן, אנו, אלו, עצמם, הללוPlur,Sing
(1; 0% of non-emptyNumber
): אילוSing
(5499; 74% of non-emptyNumber
): _הוא, _היא, הוא, זה, היא, זו, _אני, זאת, אני, עצמוEMPTY
(255): כך, כן
NUM
1369 NUM tokens (42% of all NUM
tokens) have a non-empty value of Number
.
The most frequent other feature values with which NUM
and Number
co-occurred: Definite=EMPTY (949; 69%), Gender=Masc (877; 64%).
NUM
tokens may have the following values of Number
:
Dual
(1; 0% of non-emptyNumber
): אלפייםPlur
(374; 27% of non-emptyNumber
): שני, שתי, מאות, שניים, אלפי, עשרות, מיליוני, אלפים, מיליארדי, מיליארדיםSing
(994; 73% of non-emptyNumber
): אחד, אחת, מיליון, אלף, שלושה, שלוש, שני, ארבעה, מיליארד, מאהEMPTY
(1919): 1, 0, 2, 3, 20, 4, 10, 5, 11, 16
Paradigm שני | Sing | Plur |
---|---|---|
Definite=Cons | שני | |
שני |
Number
seems to be lexical feature of NUM
. 99% lemmas (69) occur only with one value of Number
.
AUX
1147 AUX tokens (93% of all AUX
tokens) have a non-empty value of Number
.
The most frequent other feature values with which AUX
and Number
co-occurred: VerbType=Cop (1147; 100%), Person=3 (1092; 95%), Polarity=Pos (837; 73%), VerbForm=EMPTY (831; 72%), Tense=Past (681; 59%), Gender=Masc (665; 58%).
AUX
tokens may have the following values of Number
:
Plur
(266; 23% of non-emptyNumber
): היו, אינם, אינן, יהיו, היינו, איננו, נהיה, אינכם, הייתם, הנםSing
(881; 77% of non-emptyNumber
): היה, היתה, אינו, יהיה, אינה, תהיה, הייתי, איננה, איננו, אינניEMPTY
(92): להיות, היו, יהיה, תהייה
Paradigm היה | Sing | Plur |
---|---|---|
Gender=Masc|Mood=Imp|Person=2 | הייה, היה | |
Gender=Masc|Person=2|Tense=Fut | תהיה | |
Gender=Masc|Person=2|Tense=Past | היית | הייתם |
Gender=Masc|Person=3|Tense=Fut | יהיה | |
Gender=Masc|Person=3|Tense=Past | היה | |
Gender=Fem,Masc|Person=1|Tense=Fut | נהיה | |
Gender=Fem,Masc|Person=1|Tense=Past | הייתי | היינו |
Gender=Fem,Masc|Person=3|Tense=Fut | יהיו | |
Gender=Fem,Masc|Person=3|Tense=Past | היו | |
Gender=Fem|Person=3|Tense=Fut | תהיה | |
Gender=Fem|Person=3|Tense=Past | היתה |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number
:
NOUN –[amod]–> ADJ (6144; 97%),
NOUN –[compound:smixut]–> NOUN (4273; 59%),
VERB –[nsubj]–> NOUN (4148; 87%),
NOUN –[nmod]–> NOUN (3318; 63%),
NOUN –[nmod:poss]–> PRON (1694; 64%),
NOUN –[acl:relcl]–> VERB (1689; 83%),
NOUN –[conj]–> NOUN (1524; 76%),
VERB –[conj]–> VERB (1133; 79%),
VERB –[nsubj]–> PRON (983; 97%),
NOUN –[det]–> PRON (670; 98%).