Treebank Statistics: UD_Hebrew-HTB: Features: Number
This feature is universal.
It occurs with 3 different values: Dual, Plur, Sing.
Some words have combined values of the feature; 2 combinations have been observed: Dual|Plur, Plur|Sing.
67067 tokens (42%) have a non-empty value of Number.
13229 types (74%) occur at least once with a non-empty value of Number.
6688 lemmas (65%) occur at least once with a non-empty value of Number.
The feature is used with 6 part-of-speech tags: NOUN (37509; 23% instances), VERB (11302; 7% instances), ADJ (8289; 5% instances), PRON (7451; 5% instances), NUM (1369; 1% instances), AUX (1147; 1% instances).
NOUN
37509 NOUN tokens (99% of all NOUN tokens) have a non-empty value of Number.
The most frequent other feature values with which NOUN and Number co-occurred: Definite=EMPTY (25803; 69%), Gender=Masc (23325; 62%).
NOUN tokens may have the following values of Number:
Dual(83; 0% of non-emptyNumber): שנתיים, חודשיים, שבועיים, יומיים, פעמיים, שעתיים, משקפיים, קרנייםDual,Plur(6; 0% of non-emptyNumber): שוליים, שפתייםPlur(9581; 26% of non-emptyNumber): שנים, ימים, ידי, בתי, בחירות, עובדים, בני, נקודות, אנשים, חברותPlur,Sing(151; 0% of non-emptyNumber): %, ס”ם, ברוטוSing(27688; 74% of non-emptyNumber): בית, יום, משרד, משטרה, שר, משפט, ארץ, ממשלה, חברה, דברEMPTY(537): הכל, נק, ד, רעולי, רב, רח, באי, בטון, מאה, מלמין
| Paradigm שנה | Sing | Dual | Plur |
|---|---|---|---|
| Definite=Cons | שנת | שנות | |
| Definite=Def | שנה_ | ||
| שנה | שנתיים | שנים |
VERB
11302 VERB tokens (79% of all VERB tokens) have a non-empty value of Number.
The most frequent other feature values with which VERB and Number co-occurred: VerbForm=EMPTY (7026; 62%), Voice=Act (6710; 59%), Person=3 (6611; 58%), Gender=Masc (6511; 58%), Tense=Past (5664; 50%).
VERB tokens may have the following values of Number:
Plur(3631; 32% of non-emptyNumber): היו, חולים, הגיעו, רוצים, אמרו, מסרו, יהיו, אומרים, יצאו, נפצעוSing(7671; 68% of non-emptyNumber): אמר, יכול, אומר, עבר, נראה, מדובר, היה, כולל, עלה, רוצהEMPTY(2986): יש, אין, לעשות, לתת, לשלם, למנוע, לבצע, לקבל, למצוא, להשיג
| Paradigm אמר | Sing | Plur |
|---|---|---|
| Gender=Masc|HebBinyan=PAAL|Person=1,2,3|VerbForm=Part|Voice=Act | אומר | אומרים |
| Gender=Masc|HebBinyan=PAAL|Person=2|Tense=Fut|Voice=Act | תאמר | |
| Gender=Masc|HebBinyan=PAAL|Person=2|Tense=Past|Voice=Act | אמרת | |
| Gender=Masc|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמר | |
| Gender=Masc|Mood=Imp|Person=2 | אמור | |
| Gender=Masc|Person=3|Tense=Fut | יאמר | |
| Gender=Fem,Masc|HebBinyan=PAAL|Person=1|Tense=Past|Voice=Act | אמרתי | אמרנו |
| Gender=Fem,Masc|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמרו | |
| Gender=Fem,Masc|Person=1|Tense=Fut | אומר | |
| Gender=Fem,Masc|Person=3|Tense=Fut | יאמרו | |
| Gender=Fem|HebBinyan=PAAL|Person=1,2,3|VerbForm=Part|Voice=Act | אומרת | אומרות |
| Gender=Fem|HebBinyan=PAAL|Person=3|Tense=Fut|Voice=Act | תאמר | |
| Gender=Fem|HebBinyan=PAAL|Person=3|Tense=Past|Voice=Act | אמרה |
ADJ
8289 ADJ tokens (98% of all ADJ tokens) have a non-empty value of Number.
The most frequent other feature values with which ADJ and Number co-occurred: Gender=Masc (5146; 62%).
ADJ tokens may have the following values of Number:
Plur(2357; 28% of non-emptyNumber): אחרים, רבים, אחרונים, חדשים, שונים, רבות, אחרות, גדולים, שונות, אחרונותSing(5932; 72% of non-emptyNumber): ראשון, גדול, לאומי, חדש, אחר, קשה, ראשונה, צריך, רב, טובEMPTY(127): יתר, הינדית, בלטית, דמוי, הבעתי, התאבדותית, טכסיים, טרוריסטי, מינסוטיים, סטליניסטית
PRON
7451 PRON tokens (97% of all PRON tokens) have a non-empty value of Number.
The most frequent other feature values with which PRON and Number co-occurred: Person=3 (6782; 91%), PronType=Prs (5796; 78%), Gender=Masc (4911; 66%), Case=EMPTY (4866; 65%).
PRON tokens may have the following values of Number:
Plur(1951; 26% of non-emptyNumber): _הם, הם, אלה, _הן, _אנחנו, הן, אנו, אלו, עצמם, הללוPlur,Sing(1; 0% of non-emptyNumber): אילוSing(5499; 74% of non-emptyNumber): _הוא, _היא, הוא, זה, היא, זו, _אני, זאת, אני, עצמוEMPTY(255): כך, כן
NUM
1369 NUM tokens (42% of all NUM tokens) have a non-empty value of Number.
The most frequent other feature values with which NUM and Number co-occurred: Definite=EMPTY (949; 69%), Gender=Masc (877; 64%).
NUM tokens may have the following values of Number:
Dual(1; 0% of non-emptyNumber): אלפייםPlur(374; 27% of non-emptyNumber): שני, שתי, מאות, שניים, אלפי, עשרות, מיליוני, אלפים, מיליארדי, מיליארדיםSing(994; 73% of non-emptyNumber): אחד, אחת, מיליון, אלף, שלושה, שלוש, שני, ארבעה, מיליארד, מאהEMPTY(1919): 1, 0, 2, 3, 20, 4, 10, 5, 11, 16
| Paradigm שני | Sing | Plur |
|---|---|---|
| Definite=Cons | שני | |
| שני |
Number seems to be lexical feature of NUM. 99% lemmas (69) occur only with one value of Number.
AUX
1147 AUX tokens (93% of all AUX tokens) have a non-empty value of Number.
The most frequent other feature values with which AUX and Number co-occurred: VerbType=Cop (1147; 100%), Person=3 (1092; 95%), Polarity=Pos (837; 73%), VerbForm=EMPTY (831; 72%), Tense=Past (681; 59%), Gender=Masc (665; 58%).
AUX tokens may have the following values of Number:
Plur(266; 23% of non-emptyNumber): היו, אינם, אינן, יהיו, היינו, איננו, נהיה, אינכם, הייתם, הנםSing(881; 77% of non-emptyNumber): היה, היתה, אינו, יהיה, אינה, תהיה, הייתי, איננה, איננו, אינניEMPTY(92): להיות, היו, יהיה, תהייה
| Paradigm היה | Sing | Plur |
|---|---|---|
| Gender=Masc|Mood=Imp|Person=2 | הייה, היה | |
| Gender=Masc|Person=2|Tense=Fut | תהיה | |
| Gender=Masc|Person=2|Tense=Past | היית | הייתם |
| Gender=Masc|Person=3|Tense=Fut | יהיה | |
| Gender=Masc|Person=3|Tense=Past | היה | |
| Gender=Fem,Masc|Person=1|Tense=Fut | נהיה | |
| Gender=Fem,Masc|Person=1|Tense=Past | הייתי | היינו |
| Gender=Fem,Masc|Person=3|Tense=Fut | יהיו | |
| Gender=Fem,Masc|Person=3|Tense=Past | היו | |
| Gender=Fem|Person=3|Tense=Fut | תהיה | |
| Gender=Fem|Person=3|Tense=Past | היתה |
Relations with Agreement in Number
The 10 most frequent relations where parent and child node agree in Number:
NOUN –[amod]–> ADJ (6144; 97%),
NOUN –[compound:smixut]–> NOUN (4273; 59%),
VERB –[nsubj]–> NOUN (4148; 87%),
NOUN –[nmod]–> NOUN (3318; 63%),
NOUN –[nmod:poss]–> PRON (1694; 64%),
NOUN –[acl:relcl]–> VERB (1689; 83%),
NOUN –[conj]–> NOUN (1527; 76%),
VERB –[conj]–> VERB (1133; 79%),
VERB –[nsubj]–> PRON (983; 97%),
NOUN –[det]–> PRON (670; 98%).