UD Nepali BK
Language: Nepali (code: ne)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.18 release.
The following people have contributed to making this treebank part of UD: Samuel BK, Luigi Talamo, Annemarie Verkerk.
Repository: UD_Nepali-BK
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.18
License: CC BY-SA 4.0
Genre: fiction, nonfiction
Questions, comments? General annotation questions (either Nepali-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [luigi • talamo (æt) uni-saarland • de]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually |
| UPOS | annotated manually, natively in UD style |
| XPOS | not available |
| Features | annotated manually, natively in UD style |
| Relations | annotated manually, natively in UD style |
Description
UD_Nepali-BK is a manually annotated Universal Dependencies treebank for Nepali, an Indo-Aryan language written in Devanagari. The treebank contains sentences from a fictional narrative story and an argumentative discourse text, and follows the Universal Dependencies v2 guidelines.
The UD_Nepali-BK treebank consists of Nepali sentences annotated according to the Universal Dependencies guidelines. The data comes from two text types: a fictional narrative story, Bhoot ko Katha, and an argumentative/discussion text titled Adhikar Thulo Ki Kartabya? (अधिकार ठूलो कि कर्तव्य?) from a Grade 10 Nepali school textbook.
The treebank covers constructions such as head-final SOV clause structure, case and postpositional marking, copular clauses, participial modifiers, converbs, coordination, discourse particles, and reported/evidential forms.
The annotation was carried out manually and includes lemmas, universal part-of-speech tags, morphological features, and dependency relations.
Acknowledgments
We would like to thank Jun.-Prof. Dr. Annemarie Verkerk for leading and supervising the project and Luigi Talamo for coordinating the treebank submission, providing guidance during the annotation process, answering queries, and helping with the tests. We also thank Saarland University, Saarland, Germany, for supporting the work on this treebank.
References
- Universal Dependencies contributors. Universal Dependencies documentation. https://universaldependencies.org/
Statistics of UD Nepali BK
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – VERB – X
Features
Aspect – Case – Evident – Foreign – Gender – Mood – Number – NumType – Person – Polarity – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – ccomp – compound – compound:redup – conj – cop – dep – det – discourse – dislocated – flat:name – iobj – nmod – nmod:poss – nsubj – nummod – obj – obl – parataxis – punct – reparandum – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 69 sentences and 801 tokens.
- All tokens in this corpus are followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 1 types of words that contain both letters and punctuation. Examples: ह्वार-ह्वार
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, VERB, X
- This corpus does not use the following tags: SCONJ, SYM
- This corpus contains 11 word types tagged as particles (PART): कि, केरे, चाहिँ, त, नै, पनि, र, रे, ल, है, हो
- This corpus contains 18 lemmas tagged as pronouns (PRON): आफु, आफ्नो, उ, ऊ, एउटा, कसै, के, जुन, तँ, त्यस, त्यो, म, यस, यस्ता, यस्तो, यही, यी, हाम्रो
- This corpus contains 8 lemmas tagged as determiners (DET): आआफ्नो, एउटा, कति, त्यही, त्यो, यत्रो, यस, यो
- Out of the above, 3 lemmas occurred sometimes as PRON and sometimes as DET: एउटा, त्यो, यस
- This corpus contains 2 lemmas tagged as auxiliaries (AUX): छ, हुनु
- Out of the above, 2 lemmas occurred sometimes as AUX and sometimes as VERB: छ, हुनु
- There are 4 (de)verbal forms:
- Conv
- VERB: भनेर, गर्दा, आएर, कराउँदै, पारेर, फर्केर, लागेर, लिएर, खर्चेर, गएर
- Fin
- AUX: छ, हो, छन्, रहेछ
- VERB: भागेछ, गर्नुपर्छ, घस्दे, भनेछ, रहेछ, हाम्फाल, हुन्छ, आउँछ, कराएछ, गर्छ
- Inf
- VERB: सुत्न, गर्न, चराउन, जाने
- Part
- AUX: भएका
- VERB: आर्जन, गर्ने, भन्ने, गरिएको, कुर्ने, नहुने, भनिएको, आउने, आएको, आएछ
Nominal Features
- Fem
- NOUN: गाईको
- Masc
- PROPN: इलियटका, जर्ज, विवेकान्नंद
- Neut
- NOUN: घ्यू, कर्तव्य, मान्छे, भुत, खोटो, थकाई, आगो, कर्तव्यको, कुरा, गोठालो
- PROPN: काली, खड्केरिरहाको, गन्डकीमा, खड्केरिरहा, खड्केरिरहामा, धारा, पानी
- Plur
- AUX-Fin: हो
- AUX-Part: भएका
- NOUN: उपनिषद्हरूको, भुतहरू, भुतहरूले, विचारले
- PRON: हाम्रो
- VERB-Fin: गर्छन्, भन्थे, हुन्
- VERB-Part: गरेका
- Sing
- AUX-Fin: छ, छन्, रहेछ, हो
- DET: त्यो, त्यही, यो, त्यस, यत्रो
- NOUN: घ्यू, कर्तव्य, मान्छे, भुत, खोटो, थकाई, आगो, कर्तव्यको, कुरा, गोठालो
- PRON: त्यो, उ, मलाई, आफु, उलाइ, उले, उसको, कसैलाई, तँ, यस्तो
- PROPN: काली, खड्केरिरहाको, गन्डकीमा, इलियटका, खड्केरिरहा, खड्केरिरहामा, जर्ज, धारा, पानी, विवेकान्नंद
- VERB-Conv: भनेर, गर्दा, आएर, कराउँदै, पारेर, फर्केर, लागेर, लिएर, खर्चेर, गएर
- VERB-Fin: भागेछ, गर्नुपर्छ, घस्दे, भनेछ, रहेछ, हाम्फाल, हुन्छ, आउँछ, कराएछ, गर्छ
- VERB-Inf: सुत्न, गर्न, चराउन, जाने
- VERB-Part: आर्जन, गर्ने, भन्ने, आउने, आएको, आएछ, उदघाटित, घसेको, चराउने, जाने
- Abl
- NOUN: अधिकारभन्दा, क्रियाकलापबाट, धनबाट, भोलिपल्ट
- Acc
- NOUN: घ्यू, कर्तव्य, खोटो, आगो, थकाई, महीसही, अनुभव, कर्म, काम, कुरा
- Dat
- NOUN: कर्तव्यलाई, मानिसलाई, कर्तव्यको, पूजा
- PRON: कसैलाई
- Erg
- NOUN: भुतहरूले
- Gen
- NOUN: पानीको, कर्तव्यको, आगनाको, उपनिषद्हरूको, उपासनाको, कर्तव्यका, कर्तव्यप्रतीको, कर्तव्यबारे, गाईको, गीतामा
- PRON: उसको
- PROPN: खड्केरिरहाको, इलियटका
- Ins
- NOUN: आगोले, तरिकाले, ऊर्जाले, कथनअनुसार, चिन्तकले, दूध, धनले, विचारले
- Loc
- NOUN: गोठमा, जंगलमा, ठाउँमा, आगोमा, कथनभित्र, कथनमा, क्रममा, खोटोमा, ग्रन्थमा, जिउ
- PROPN: गन्डकीमा, खड्केरिरहामा
- Nom
- NOUN: मान्छे, भुत, कर्तव्य, गोठालो, दिन, धारा, कुरा, ठाउँ, भुत्ला, भुत्लै
- PROPN: काली, खड्केरिरहा, जर्ज, धारा, पानी, विवेकान्नंद
Degree and Polarity
- Neg
- VERB-Fin: लाग्दैन, थिएन, हुदैन, होइन
Verbal Features
- Imp
- AUX-Fin: छ, हो
- VERB-Conv: गर्दा
- VERB-Fin: गर्नुपर्छ, घस्दे, हाम्फाल, हुन्छ, आउँछ, छ, रहेछ, लाग्दैन, हो, गर्छ
- VERB-Inf: सुत्न, गर्न, चराउन, जाने
- VERB-Part: गर्ने, आउने, चराउने, जाने, झिक्ने, दल्द्या, पार्ने, बनाउने, भन्ने, राख्ने
- Perf
- AUX-Fin: छन्, रहेछ
- AUX-Part: भएका
- VERB-Conv: भनेर, आएर, पारेर, फर्केर, लागेर, लिएर, खर्चेर, गएर, घस्दिपछि, जिकेर
- VERB-Fin: भागेछ, भनेछ, कराएछ, लाग्यो, हाम्फालेछ, आएछ, उठेछ, गएछ, गरेका, गर्छ
- VERB-Part: आर्जन, गरिएको, आएको, आएछ, उदघाटित, गरेका, गरेको, घसेको, भएको, भनिएको
- Prog
- VERB-Conv: कराउँदै, गर्दा, गर्दै, जाँदा, बसी, भन्दै, रुदै
- VERB-Fin: भन्ने
- VERB-Part: दुखि, रहेको, लागी, लागेको
- Imp
- VERB-Conv: भनेर
- VERB-Fin: घस्दे, हाम्फाल, सुत, हेर्नुहोस्
- VERB-Part: ला
- Ind
- AUX-Fin: छ, हो, छन्, रहेछ
- AUX-Part: भएका
- VERB-Conv: भनेर, गर्दा, आएर, कराउँदै, पारेर, फर्केर, लागेर, लिएर, खर्चेर, गएर
- VERB-Fin: भागेछ, गर्नुपर्छ, भनेछ, रहेछ, हुन्छ, आउँछ, कराएछ, गर्छ, छ, लाग्दैन
- VERB-Inf: सुत्न, गर्न, चराउन, जाने
- VERB-Part: आर्जन, गर्ने, भनिएको, भन्ने, आउने, आएको, आएछ, उदघाटित, गरेका, घसेको
- Nec
- VERB-Fin: गर्नुपर्छ, पर्ने
- Fut
- VERB-Fin: होला
- Past
- AUX-Part: भएका
- VERB-Conv: भनेर, आएर, पारेर, फर्केर, गर्दा, लागेर, लिएर, खर्चेर, गएर, घस्दिपछि
- VERB-Fin: भागेछ, भनेछ, कराएछ, लाग्यो, हाम्फालेछ, आएछ, उठेछ, गएछ, गरेका, गर्थ्यो
- VERB-Part: आर्जन, भनिएको, आएको, आएछ, उदघाटित, गरेका, घसेको, दल्द्या, भएको, भनेको
- Pres
- AUX-Fin: छ, हो, छन्, रहेछ
- VERB-Conv: कराउँदै, गर्दा, गर्दै, जाँदा, भनेर, भन्दै, रुदै, लागेर
- VERB-Fin: गर्नुपर्छ, घस्दे, हाम्फाल, हुन्छ, आउँछ, गर्छ, छ, रहेछ, लाग्दैन, हो
- VERB-Inf: सुत्न, गर्न, चराउन, जाने
- VERB-Part: गर्ने, आउने, चराउने, जाने, झिक्ने, दुखि, पार्ने, बनाउने, भन्ने, राख्ने
- Pass
- VERB-Fin: भइन्छ
- VERB-Part: गरिएको, भनिएको
- Nfh
- VERB-Fin: भागेछ, कराएछ, भनेछ, सेलाएछ
Pronouns, Determiners, Quantifiers
- Dem
- DET: त्यो, एउटा, त्यही, यस, यो, त्यस, यत्रो
- PRON: त्यो, एउटा, त्यसलाई, यस, यसबाट, यस्ता, यी, यस्तो, यही
- Int
- DET: कति
- PRON: के
- Prs
- DET: आआफ्नो
- PRON: उ, मलाई, आफु, आफ्ना, उलाइ, उले, उसको, कसैलाई, तँ, हाम्रो
- Rel
- PRON: जुन
- Card
- NUM: एक, एउटा
- Yes
- PRON: आफ्ना
- 1
- PRON: मलाई, हाम्रो
- 2
- PRON: उ, तँ
- VERB-Fin: हाम्फाल, घस्दे, सुत, हेर्नुहोस्
- VERB-Part: ला
- 3
- AUX-Fin: छ, हो, छन्, रहेछ
- AUX-Part: भएका
- PRON: उ, आफु, उलाइ, उले, उसको
- VERB-Conv: भनेर, गर्दा, आएर, कराउँदै, पारेर, फर्केर, लागेर, लिएर, खर्चेर, गएर
- VERB-Fin: भागेछ, गर्नुपर्छ, घस्दे, भनेछ, रहेछ, हुन्छ, आउँछ, कराएछ, गर्छ, छ
- VERB-Inf: सुत्न, गर्न, चराउन, जाने
- VERB-Part: आर्जन, गर्ने, भनिएको, भन्ने, आउने, आएको, आएछ, उदघाटित, गरेका, घसेको
Other Features
- Foreign
- Yes
- X: कर्तव्यम्, कर्मण्येवाधिकारस्ते
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: हुनु.
- This corpus uses 2 lemmas as auxiliaries (aux). Examples: हुनु, छ.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--PRON (1)
- VERB-Conv--NOUN-Acc (1)
- VERB-Conv--NOUN-Nom (1)
- VERB-Conv--PRON (1)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Erg (1)
- VERB-Fin--NOUN-Gen (1)
- VERB-Fin--NOUN-Ins (4)
- VERB-Fin--NOUN-Nom (15)
- VERB-Fin--PRON (7)
- VERB-Part--NOUN-Nom (3)
- VERB-Part--PRON (2)
- obj
- VERB-Conv--NOUN-Acc (7)
- VERB-Conv--NOUN-Nom (1)
- VERB-Fin--NOUN-Acc (18)
- VERB-Fin--NOUN-Dat (2)
- VERB-Fin--NOUN-Nom (3)
- VERB-Fin--PRON (1)
- VERB-Inf--NOUN-Acc (1)
- VERB-Inf--PRON (1)
- VERB-Part--NOUN-Acc (8)
- VERB-Part--NOUN-Nom (1)
- iobj
- VERB-Conv--NOUN-Dat (1)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--NOUN-Dat (2)
- VERB-Fin--PRON (4)
- VERB-Fin--PRON-ADP(लाइ) (1)
- VERB-Fin--PRON-Dat (1)
- VERB-Part--PRON-ADP(लाई) (1)