UD Hebrew IAHLTwiki
Language: Hebrew (code: he
)
Family: Afro-Asiatic
This treebank has been part of Universal Dependencies since the UD v2.10 release.
The following people have contributed to making this treebank part of UD: Amir Zeldes, Avner Algom, Noam Ordan, Yifat Ben Moshe, Shira Wigderson.
Repository: UD_Hebrew-IAHLTwiki
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: wiki
Questions, comments? General annotation questions (either Hebrew-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [amir • zeldes (æt) georgetown • edu]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | not available |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
Publicly available subset of the IAHLT UD Hebrew Treebank’s Wikipedia section (https://www.iahlt.org/)
The UD Hebrew-IAHLTWiki treebank consists of 5,000 contemporary Hebrew sentences representing a variety of texts originating from Wikipedia entries, compiled by the Israeli Association of Human Language Technology. It includes various text domains, such as: biography, law, finance, health, places, events and miscellaneous. The schema for the UD Hebrew-IAHLT treebank, from which the publicly available UD Hebrew-IAHLTWiki subset is derived, is based on the conversion of the Hebrew Treebank (HTB) into the latest UD V2 and is checked against the Universal Dependencies validator as of UD release V2.10, in addition to a range of additional validations using the grewv tool.
Compatible datasets
The HTB version used in the project was initially converted automatically, then a subset of the converted data was manually validated and adopted as a gold standard for training the model for UD parsing used in Hebrew-IAHLT. The entire parsed data has been manually edited to correct parsing errors, and was automatically QA’ed to apply corrections following updates in the schema. For a fork of UD_Hebrew-HTB (Ha’aretz newswire data) using the same annotation scheme, see:
https://github.com/IAHLT/UD_Hebrew
For an additional UD_Hebrew corpus with the same annotation scheme (spoken parliament proceedings), see:
https://github.com/UniversalDependencies/UD_Hebrew-IAHLTknesset
NER annotations
The data additionally contains nested Named Entity annotations in the IAHLT scheme in the MISC annotation Entity=
, illustrated in the following excerpt:
## Acknowledgments
We would like to thank all the people who contributed to this corpus: Amir Zeldes, Hilla Merhav, Israel Landau, Netanel Dahan, Nick Howell, Noam Ordan, Omer Strass, Shira Wigderson, Yael Minerbi, Yifat Ben Moshe
## References
To cite this dataset please refer to the following paper:
Zeldes, Amir, Nick Howell, Noam Ordan and Yifat Ben Moshe (2022) [A Second Wave of UD Hebrew Treebanking and Cross-Domain Parsing](https://arxiv.org/abs/2210.07873). In: *Proceedings of EMNLP 2022*. Abu Dhabi, UAE, 4331-4344.
```bibtex
@InProceedings{ZeldesHowellOrdanBenMoshe2022,
author = {Amir Zeldes and Nick Howell and Noam Ordan and Yifat Ben Moshe},
booktitle = {Proceedings of {EMNLP} 2022},
title = {A Second Wave of {UD} {H}ebrew Treebanking and Cross-Domain Parsing},
year = {2022},
pages = {4331--4344},
address = {Abu Dhabi, UAE},
url = {https://aclanthology.org/2022.emnlp-main.292/},
}
Statistics of UD Hebrew IAHLTwiki
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Abbr – Aspect – Case – Definite – Foreign – Gender – HebBinyan – Mood – Number – NumType – Person – Polarity – Poss – Prefix – PronType – Reflex – Tense – Typo – VerbForm – VerbType – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – ccomp – compound – compound:affix – conj – cop – csubj – csubj:outer – csubj:pass – dep – det – discourse – dislocated – expl – fixed – flat – goeswith – list – mark – nmod – nmod:poss – nmod:unmarked – nsubj – nsubj:outer – nsubj:pass – nummod – obj – obl – obl:unmarked – orphan – parataxis – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 5039 sentences, 103395 tokens and 140961 syntactic words.
- This corpus contains 17851 tokens (17%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 320 types of words that contain both letters and punctuation. Examples: אונר"א, או"ם, מק"ם, צה"ל, בג"ץ, דו"ח, מעו"ף, ש"ח, ד"ר, מז'ור, פרופ', ג'ון, נ"ט, צ'רצ'ילים, ק"מ, א"י, חו"ל, mg/dl, אצ"ל, יו"ר, ע"פ, צ'יין, ג'ודו, ג'ודוקא, ח"כ, מנכ"ל, עות'מאנית, ק"ג, יענקל'ה, מח"ט, מפ"ם, עו"ד, פק"ם, תנ"ך, 236ב1(ב, אברג'יל, ב', ד', ה', חר"ג, יש"ע, עות'מאני, ABA', ABABA', אברמוביץ', אולארצ'יק, ג', ג'וחדר, ג'יימס, דו"חות
- This corpus contains 34692 multi-word tokens. On average, one multi-word token consists of 2.08 syntactic words.
- There are 13068 types of multi-word tokens. Examples: המשפט, בשנת, העליון, הראשון, בו, בישראל, בבית, הוועדה, הבנקים, הכנסת, באופן, המדינה, באותה, בשם, המנדט, במהלך, הכנסייה, האלבום, מסוג, היהודי, וכן, השיר, בדם, הברית, בארץ, הקבר, הממשלה, החוק, העולם, שלא, באזור, בה, ושומרון, הבריטי, המאה, שבו, ולא, הארץ, שלו, אותו, הבנק, הבריטים, החולים, הראשונה, השופט, לכך, באלבום, בסוף, ועל, לו.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus does not use the following tags: PART
- This corpus contains 33 lemmas tagged as pronouns (PRON): You, Your, ַזֶּה, אותה, אותו, איזה, אילו, אלה, אנוכי, דם, דנן, ה, הוא, הלה, הללו, ו, זה, זהו, כולו, כך, כלשהו, כמה, כן, לה, מה, מי, מישהו, משהו, נאום, ספר, עלי, עצמו, ערך
- This corpus contains 37 lemmas tagged as determiners (DET): a, the, ְהַ, א, איזה, אילו, אל, אף, ב, ה, הַ, הָ, הוא, הרבה, יותר, יתר, כול, כולו, כל, כלל, כמה, כמות, לא, לה, מדי, מחצית, מיטב, מירב, מספיק, מספר, מעט, מרבית, עוד, רוב, שאר, שום, שורה
- Out of the above, 7 lemmas occurred sometimes as PRON and sometimes as DET: איזה, אילו, ה, הוא, כולו, כמה, לה
- This corpus contains 16 lemmas tagged as auxiliaries (AUX): אינו, אמור, היה, זכאי, חייב, יכל, מוכן, מוכרח, מועד, מסוגל, עלול, עשוי, עתיד, צפוי, צריך, רשאי
- Out of the above, 8 lemmas occurred sometimes as AUX and sometimes as VERB: אמור, היה, זכאי, חייב, יכל, מוכן, עשוי, צריך
- There are 2 (de)verbal forms:
- Inf
- AUX: להיות
- VERB: לקבל, לגרום, למנוע, לבצע, ליצור, להופיע, לתת, למצוא, לאפשר, לדון
- Part
- AUX: יכול, אינה, אינו, יכולה, אינם, יכולים, אינן, איננו, איננה, יכולות
- VERB: ניתן, כולל, מדובר, מהווה, מכונה, נמצא, נראה, עולה, גורם, נמצאים
Nominal Features
- Fem
- ADJ: ראשונה, ישראלית, שונות, רבות, שנייה, מערבית, יהודית, חדשה, אחרות, פלסטינית
- AUX: הייתה, אינה, היו, יכולה, תהיה, אינן, איננה, עלולה, עשויה, תוכל
- AUX-Part: אינה, יכולה, אינן, איננה, יכול, יכולות, צפויה, תוכל
- DET: כמות, מחצית
- NOUN: שנת, ידי, סוכרת, שנים, כנסייה, שנה, ארץ, שנות, מדינה, וועדה
- NUM: שתי, אחת, שלוש, מאה, ארבע, מאות, עשרות, חמש, שלושים, אחדות
- PRON: ה, היא, זו, הן, זאת, אותה, ן, אלו, עצמה, ך
- PROPN: מכפלה, מערת, חירות, כנסיית, ועדת, חטיבה, קפלת, בורסה, ברית, חקיקה
- VERB: החלה, הוקמה, נערכה, הגיעה, הייתה, כללה, החליטה, מהווה, ביצעה, קיבלה
- VERB-Part: מהווה, נמצאת, משמשת, גורמת, גורמות, מכילה, עולה, עומדת, כוללת, מיועדת
- Fem,Masc
- AUX: היו, יהיו
- NOUN: פני
- NUM: שלושים, ארבעים
- PRON: אלו, אני, י, נו, עצמי
- VERB: החלו, נערכו, עמדו, הגיעו, טענו, החזיקו, הפכו, הראו, השתתפו, יצטרכו
- Masc
- ADJ: עליון, ראשון, נוסף, רבים, יהודי, שונים, אחרים, גרעיני, בריטי, ישראלי
- AUX: היה, היו, אינו, אינם, יכול, יהיה, יכולים, עלול, איננו, צריך
- AUX-Part: אינו, יכול, אינם, יכולים, איננו, מוכנה, רשאי
- DET: שאר, מספר, כולם
- NOUN: בית, משפט, חוק, אלבום, חלק, שימוש, שיר, פי, דם, שירים
- NUM: אחד, שני, מיליון, שלושה, ארבעה, חמישה, שניים, ששת, חצי, אלף
- PRON: ו, הם, ם, הוא, זה, אלה, אלו, אותו, עצמו, נו
- PROPN: בנק, אמפטמין, אדם, אוצר, מעו"ף, כבוד, קבר, ילדי, ניירות, ערך
- SYM: %, =
- VERB: ניתן, כתב, הלחין, יצא, זכה, החל, כולל, היו, כלל, נמצא
- VERB-Inf: נוגע
- VERB-Part: ניתן, כולל, מדובר, נמצא, נראה, מכונה, גורם, נמצאים, כוללים, משמש
- Dual
- NOUN: שנתיים, יומיים, שעתיים, פעמיים, שניים, דלתיים, חודשיים, טעמי, שבועיים
- NUM: שני
- Plur
- ADJ: רבים, שונים, אחרים, נוספים, שונות, רבות, אחרות, חדשים, גדולים, חדשות
- AUX: היו, אינם, יכולים, אינן, עלולים, יהיו, יכלו, צריכים, יכולות, עלולות
- AUX-Part: אינם, יכולים, אינן, יכולות
- DET: כולם
- NOUN: ידי, שנים, שירים, ילדים, בנקים, שנות, חולים, תרופות, יהודים, חברי
- NUM: מאות, עשרות, שתי, אלפי, שני, מאה, שלוש, שלושה, שניים, עשרה
- PRON: הם, ם, הן, אלו, אלה, ן, נו, עצמם, הללו, אותם
- PROPN: ילדי, ניירות, ארצות, פועלים, ימי, יהודים, ימים, כלניות, מריות, נגידי
- SYM: %
- VERB: היו, החלו, הגיעו, קיבלו, טענו, פעלו, השתתפו, נכללו, נמצאו, המשיכו
- VERB-Part: נמצאים, כוללים, סובלים, טוענים, גורמות, גורמים, מצביעים, כוללות, מייצרים, משפיעים
- Plur,Sing
- NOUN: %
- SYM: %
- Sing
- ADJ: עליון, ראשון, נוסף, יהודי, גרעיני, ראשונה, ישראלית, בריטי, ישראלי, קצר
- AUX: היה, הייתה, אינו, אינה, יכול, יכולה, יהיה, תהיה, עלול, צריך
- AUX-Part: יכול, אינה, אינו, יכולה, איננו, איננה, מוכנה, צפויה, רשאי, תוכל
- DET: מספר, כמות, מחצית
- NOUN: בית, שנת, משפט, חוק, אלבום, חלק, שימוש, סוכרת, שיר, דם
- NUM: אחד, אחת, מיליון, אלף, חצי, מאה, מיליארד, ארבעה, עשר, עשרת
- PRON: ו, ה, הוא, זה, היא, זו, זאת, אותה, י, אותו
- PROPN: בנק, אמפטמין, מכפלה, מערת, אדם, אוצר, מעו"ף, חירות, כבוד, קבר
- SYM: %, =
- VERB: ניתן, כתב, הלחין, יצא, זכה, החל, כולל, כלל, נמצא, החלה
- VERB-Inf: נוגע
- VERB-Part: ניתן, כולל, מדובר, מהווה, מכונה, נמצא, נראה, עולה, גורם, משמש
- Acc
- ADP: את, אות, אֶת, אֹת, של
- PRON: ו, אותה, ם, אותו, ה, ני, הו, וֹ
- Gen
- ADP: של
- PRON: ו, ה, ם, הם, ן, הן, י, נו, ך, הּ
- Cons
- ADJ: חסר, בן, בעלי, בני, בעלת, דלת, בעל, חסרי, קצר, ארוכי
- DET: כל, רוב, מספר, כמה, מרבית, כלל, שאר, אף, הרבה, יתר
- NOUN: בית, שנת, ידי, פי, שנות, סוג, חוק, בתי, חברי, ראש
- NUM: שני, שתי, ששת, אלפי, שלוש, שלושת, אחד, עשרות, מאות, אחת
- PROPN: ארץ, מלחמת, כנסיית, בנק, ארצות, מערת, קפלת, תל, בית, ועדת
- Def
- ADP: ב, ל, כ
- DET: ה, אל, הַ, ְהַ, א, ב, הָ, כולם, לה
- PRON: ו, ה, ם, אותה, הם, ן, אותו, הן, י, נו
Degree and Polarity
- Neg
- ADV: לא, אי, בלתי, אין
- AUX: אינו, אינה, אינם, אינן, איננו, איננה, אינך
- AUX-Part: אינה, אינו, אינם, אינן, איננו, איננה
- VERB: אין
- Pos
- AUX: היה, היו, הייתה, להיות, תהיה, יהיה, הייתי, יהיו, היינו, תהיינה
- AUX-Inf: להיות
- PRON: הוא, היא, הם, הן, י, ם
- VERB: יש, היו, היה, הייתה, ישנם, ישנה, ישנו, ישנן, יהיו, להיות
- VERB-Inf: להיות
Verbal Features
- Prog
- VERB: ניתן, פוגעת, גורם, גורמים, דורכת, הולכת, הסעירה, ידוע, כותבים, כרוכה
- VERB-Part: ניתן, פוגעת, גורם, גורמים, דורכת, הולכת, ידוע, כותבים, כרוכה, מאפשרת
- Imp
- VERB: סע, ראו, צא, הכניסי, עוף, קח, שמור, בואו, בואי, האר
- Fut
- AUX: יהיה, תהיה, יהיו, תוכל, יוכל, יוכלו, תהא, אהיה, יָוכְלוּ, יהא
- AUX-Part: תוכל
- VERB: יהיה, תשלם, יאפשר, יהיו, ייתכן, יקבלו, ישלמו, תוביל, תכניס, יפעיל
- VERB-Part: תלויה
- Past
- AUX: היה, היו, הייתה, הייתי, יכלו, היינו, יָכְלוּ, יכול, יכלה
- VERB: כתב, הלחין, יצא, זכה, החל, היו, החלו, כלל, החלה, הוציא
- VERB-Part: אוהב, גונח, גורמים, ידוע, כותבים, כרוכה, מהווה, מוכר, מופקדת, מותש
- Pres
- AUX: אינו, אינם, יכולים, יכול, יכולה, אינה, אינן, איננו, איננה, מוכנה
- AUX-Part: יכולה, יכולים, מוכנה, צפויה
- VERB: ניתן, כולל, מדובר, מהווה, מכונה, נמצא, נראה, עולה, גורם, נמצאים
- VERB-Inf: נוגע
- VERB-Part: ניתן, כולל, מדובר, מהווה, מכונה, נמצא, נראה, עולה, גורם, נמצאים
- Act
- VERB: כתב, הלחין, יצא, זכה, החל, כולל, החלו, כלל, החלה, הוציא
- VERB-Inf: לקבל, לגרום, למנוע, לבצע, ליצור, לתת, למצוא, לאפשר, לדון, להביא
- VERB-Part: כולל, מהווה, עולה, גורם, כוללים, סובלים, משמש, משמשת, מתאר, פוגע
- Mid
- VERB: נמצא, נקרא, נראה, נערכה, נעשה, נחשב, נכללו, נמצאים, נוצר, להימנע
- VERB-Inf: להימנע, להיות, להתגבר, להתפתח, להופיע, להיוועץ, להיכנס, להימשך, להיעשות, להשתתף
- VERB-Part: נמצא, נראה, נמצאים, נמצאת, נחשב, נוסף, נחשבת, נקרא, נקראת, מתגוררים
- Pass
- VERB: ניתן, מדובר, הוקמה, מכונה, נקבע, נעשה, הוקם, בוצעו, בוצע, נערך
- VERB-Inf: להיעשות, להילקח, להינתן, להחשב, להיבחר, להידחות, להידרש, להילמד, להימכר, להיעבר
- VERB-Part: ניתן, מדובר, מכונה, דרוש, מוטל, מוקדשת, מזוהה, מיועדת, מתוארים, אמור
Pronouns, Determiners, Quantifiers
- Art
- ADP: ב, ל, כ
- DET: ה, אל, הַ, ְהַ, א, ב, הָ, לה
- Dem
- PRON: כך, זה, זו, זאת, אלו, כן, אלה, הללו, זהו, זוהי
- Emp
- PRON: עצמו, עצמה, עצמם, כולה, עצמך, עצמן, עצמי
- Ind
- PRON: כלשהו, כלשהי, כלשהם, כלשהן, כמה, מה, מישהו, משהו
- Int
- ADV: כיצד, כמה, האם, למה, מדוע
- PRON: מה, מי, אילו, מהו, מהם
- Neg
- DET: אף
- Prs
- PRON: ו, ה, הם, ם, הוא, היא, הן, אותה, ן, י
- Tot
- DET: כל
- Card
- NUM: שני, אחד, שתי, אחת, שלושה, שלוש, מיליון, ארבע, ארבעה, חמישה
- Ord
- ADJ: ראשון, ראשונה, שני, שנייה, 20, חמישית, שלישי, 19, רביעי, ראשונות
- Yes
- PRON: ו, ה, ם, הם, ן, הן, י, נו, ך, הּ
- Yes
- PRON: עצמו, עצמה, עצמם, עצמך, עצמן, אותה, עצמי, עצמנו
- 1
- AUX: הייתי, איננו, אהיה, היינו, נהיה
- PRON: י, נו, אני, אנחנו, ני, אנו, אנוכי, עצמי, עצמנו
- VERB: טענו, אוהב, מרגיש, נתנו, רואה, אהבנו, אמרתי, הלכתי, יצאנו, כיהנו
- VERB-Part: אוהב, מרגיש, רואה, מתגעגע, עומדת, רוצים, אוכלים, זוכרים, מאירה, מבין
- 2
- AUX: אינך
- PRON: ך, אתה, את, ה, ךָ, כם, עצמך
- VERB: סע, ראו, נחתם, באת, צא, בוכה, הכניסי, ירשת, נתן, עוף
- VERB-Part: בוכה, דורכת, הולכת, יודעת, יכולה, מופקדת, מורכבת, עושה, קם
- 3
- AUX: היה, היו, הייתה, אינו, אינם, אינה, יהיה, יכול, תהיה, יהיו
- AUX-Part: יכול, יכולה, אינה, אינו, אינם, יכולים, מוכנה, צפויה, תוכל
- PRON: ו, ה, הם, ם, הוא, זה, היא, זו, הן, זאת
- VERB: ניתן, כתב, הלחין, יצא, זכה, החל, היו, החלו, כולל, כלל
- VERB-Inf: נוגע
- VERB-Part: ניתן, כולל, מדובר, מהווה, מכונה, נמצא, נראה, עולה, גורם, נמצאים
Other Features
- Abbr
- Yes
- ADJ: א"י, נ"ל, אי"ת, להט"בים, להט"בית, לפנה"ס, צה"לי, תנ"כי
- ADP: נ', ע"פ, ע"ש
- ADV: לפנה"ס
- NOUN: מק"ם, דו"ח, ש"ח, בג"ץ, נ"ט, ק"מ, חו"ל, ד"ר, יו"ר, מנכ"ל
- PROPN: אונר"א, או"ם, צה"ל, אצ"ל, מעו"ף, א"י, חר"ג, יש"ע, לח"י, בג"ץ
- Yes
- Foreign
- Yes
- X: the, District, Pottery, אלגרו, Allegro, Bank, Commissioner, Palestine, Penicillium, Studio
- Yes
- HebBinyan
- HIFIL
- VERB: הלחין, החל, החלו, החלה, הוציא, הגיעו, הגיע, הקליט, הגיעה, הביא
- VERB-Inf: להופיע, להביא, להגיע, להמשיך, להעביר, להעניק, להוסיף, להחזיר, להרחיב, להשקיע
- VERB-Part: מגיע, מופיע, מציג, מכילה, מצביעים, מביא, מוביל, מכיל, משפיעים, מביאה
- HITPAEL
- VERB: השתתף, השתתפו, להשתמש, התנגדו, התברר, התקבלה, הצטרף, הצטרפו, התבטא, התפרסם
- VERB-Inf: להשתמש, להתגבר, להשתתף, להתמודד, להתפלל, להתרחש, להשתלט, להתפתח, להתקדם, להתקיים
- VERB-Part: מתבצע, משתנה, מתחייב, מתייחסת, משתמש, מתגוררים, מתקיימות, מתרחש, מסתיימת, מצטבר
- HUFAL
- VERB: הוקמה, הוקם, הוצגו, הושגו, הוחלט, הועברו, הוגשו, הועלה, הוקמו, מוטל
- VERB-Part: מוטל, מוקדשת, מורכב, מופרש, מורכבת, מוצגת, מוקדש, מוגדר, מוזכר, מוזרם
- NIFAL
- VERB: ניתן, נמצא, נקבע, נעשה, נערכה, נקרא, נערך, נראה, נחשב, נאמר
- VERB-Inf: להימנע, להיוועץ, להיכנס, להיעשות, לגשת, להחשב, להילחם, להילקח, להימשך, להינתן
- VERB-Part: ניתן, נמצא, נראה, נמצאים, נחשב, נמצאת, נקראת, נוסף, נחשבת, ניתנים
- NITPAEL
- VERB: נתגלו, נתגלתה, נתקבלה, להתעניין, משתמע, נשתמר, נתברר, נתקבלו
- VERB-Inf: להתעניין
- VERB-Part: משתמע
- PAAL
- AUX: היה, היו, הייתה, להיות, יהיה, תהיה, הייתי, יהיו, היות, תהא
- AUX-Inf: להיות
- VERB: כתב, יצא, זכה, היו, כולל, כלל, היה, שר, אמר, טען
- VERB-Inf: לגרום, למנוע, ליצור, לתת, למצוא, לדון, לעמוד, לעשות, לכתוב, לפגוע
- VERB-Part: כולל, עולה, גורם, כוללים, סובלים, פוגע, גורמת, טוענים, קובע, חוזר
- PIEL
- VERB: ניצח, לקבל, מהווה, קיבל, פרסם, קיבלו, שימש, לבצע, תיאר, ביצעה
- VERB-Inf: לקבל, לבצע, לאפשר, לשלם, לקיים, לסייע, לשמש, לחוקק, לטפל, לנהל
- VERB-Part: מהווה, משמש, משמשת, מתאר, מסמל, מאפשר, מייצרים, מכהנים, מציין, מציינת
- PUAL
- VERB: מדובר, מכונה, בוצעו, בוצע, כונה, מונתה, פורסם, מונה, מיועדת, בוצעה
- VERB-Inf: לחוקק
- VERB-Part: מדובר, מכונה, מיועדת, מזוהה, מתוארים, מבוסס, מתוארכת, מתואר, מבוססת, מחולקת
- HIFIL
- Prefix
- Yes
- ADV: אי, בלתי, בטא, גראם, פוסט, תת, דו, בינ, דה, קדם
- NUM: 6, ה
- Yes
- Typo
- Yes
- ADJ: אורינטליסטית, אמריקני, מונומטאלי, מזרחית, מינהלית, מקומית, עולמי, קשה, ששית
- ADP: אחר, לפני, עמ
- ADV: מיד, מינהלית, מספיקות
- AUX: הייתה, היה, אמור
- CCONJ: אלה
- DET: ב
- NOUN: כל, לדה, מסים, מעין, נייטרון, נייטרליות, צד, אב, אמר, דוחו"ת
- NUM: ארבע
- PRON: הם, זה, אותם, ה, ו, ם, ן
- PROPN: דפטריה, קרית
- PUNCT: '
- VERB: איפשר, איפשרה, איפשרו, אירע, בוצע, הגיע, הובהר, הופרדה, היקנו, יאלצו
- VERB-Part: מעידה, מקנה, נתמך
- X: א
- Yes
- VerbType
- Cop
- AUX: היה, הייתה, היו, תהיה, יהיה, להיות, יהיו, אינה, אינו, הייתי
- AUX-Inf: להיות
- Mod
- AUX: יכולים, יכולה, יכול, תוכל, עלול, עלולים, צריך, מוכן, מסוגלת, עשויה
- AUX-Part: יכולה, יכולים, יכול, צפויה, רשאי
- VERB: ניתן, אפשר, יש, ייתכן, אין, אסור, זכאים, יכול, ניתנות, צריך
- VERB-Part: ניתן, יכול, ניתנות
- Cop
Syntax
Auxiliary Verbs and Copula
- This corpus uses 4 lemmas as copulas (cop). Examples: היה, הוא, אינו, זה.
- This corpus uses 16 lemmas as auxiliaries (aux). Examples: אינו, יכל, היה, עלול, צריך, עשוי, אמור, רשאי, מסוגל, מוכן, צפוי, חייב, זכאי, מוכרח, מועד, עתיד.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (2264)
- VERB--NOUN-ADP(את) (3)
- VERB--NOUN-ADP(מ) (1)
- VERB--NOUN-ADP(משום) (1)
- VERB--PRON (217)
- VERB-Inf--NOUN (115)
- VERB-Inf--PRON (19)
- VERB-Part--NOUN (820)
- VERB-Part--PRON (159)
- obj
- VERB--NOUN (758)
- VERB--NOUN-ADP(אֶת) (1)
- VERB--NOUN-ADP(את) (571)
- VERB--NOUN-ADP(ב) (1)
- VERB--NOUN-ADP(יותר) (1)
- VERB--NOUN-ADP(כמו)-ADP(את) (1)
- VERB--NOUN-ADP(ל) (1)
- VERB--NOUN-ADP(מ) (2)
- VERB--PRON (13)
- VERB--PRON-ADP(את) (70)
- VERB--PRON-Acc (7)
- VERB--PRON-Acc-ADP(יד) (1)
- VERB--PRON-Gen-ADP(את) (2)
- VERB-Inf--NOUN (354)
- VERB-Inf--NOUN-ADP(את) (349)
- VERB-Inf--NOUN-ADP(את)-ADP(כ) (1)
- VERB-Inf--PRON (21)
- VERB-Inf--PRON-ADP(את) (31)
- VERB-Inf--PRON-Acc (29)
- VERB-Part--NOUN (304)
- VERB-Part--NOUN-ADP(את) (238)
- VERB-Part--NOUN-ADP(ל) (1)
- VERB-Part--NOUN-ADP(מ) (1)
- VERB-Part--PRON (13)
- VERB-Part--PRON-ADP(את) (33)
Verbs with Reflexive Core Objects
- This corpus contains 11 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: העמיד עצמו, הציג עצמו, הקריב עצמה, הקריב עצמו, חש עצמם, טמן עצמו, כיבד עצמה, מצא עצמו, מצא עצמם, שכפל עצמה, תפש עצמו
Relations Overview
- This corpus uses 9 relation subtypes: acl:relcl, compound:affix, csubj:outer, csubj:pass, nmod:poss, nmod:unmarked, nsubj:outer, nsubj:pass, obl:unmarked
- The following 2 relation types are not used in this corpus at all: iobj, clf