UD Georgian GLC
Language: Georgian (code: ka
)
Family: Kartvelian
This treebank has been part of Universal Dependencies since the UD v2.13 release.
The following people have contributed to making this treebank part of UD: Irina Lobzhanidze.
Repository: UD_Georgian-GLC
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.14
License: CC BY-SA 4.0
Genre: fiction, nonfiction
Questions, comments? General annotation questions (either Georgian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [irina_lobzhanidze (æt) iliauni • edu • ge]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | assigned by a program, not checked manually |
UPOS | assigned by a program, with some manual corrections, but not a full manual verification |
XPOS | assigned by a program, not checked manually |
Features | assigned by a program, with some manual corrections, but not a full manual verification |
Relations | assigned by a program, with some manual corrections, but not a full manual verification |
Description
The Georgian UD Treebank (UD_Georgian-GLC) is the first syntactically annotated corpus of Georgian, based on a collection of annotated sentences selected from the Georgian Language Corpus (GLC) available at http://corpora.iliauni.edu.ge/ and sentences selected from Wiki in accordance with the 132 scientific fields.
The Georgian UD Treebank (UD_Georgian-GLC) serves as the first syntactically annotated corpus of the Georgian language. It includes 151 utterances randomly selected from the GLC (Doborjginidze et al. 2013), providing detailed annotations encompassing the grammatical structure and dependencies within the sentences.
The treebank’s annotations align with the Universal Dependencies (UD) specifications, allowing for greater consistency and compatibility with other UD treebanks. Although the tokenization and segmentation principles of the GLC differ slightly from those of the UD, the UD_Georgian-GLC follows the UD approach, particularly regarding multiword tokens, to minimize differences.
Morpho-syntactic annotations, as discussed in Lobzhanidze (2022), have been automatically adapted to UD requirements. This includes annotations for lemmas (LEMMA), part-of-speech categories (UPOS; XPOS), morphological features (FEATS), transliteration, and tokenization issues (MISC). Furthermore, heads of words (HEADS), dependency relations (DEPREL), and enhanced dependency graphs (DEPS) were automatically converted and then reviewed and manually corrected.
The current version of the UD_Georgian-GLC treebank includes 151 utterances (sentences) or 2123 tokens. By the end of August, the UD_Georgian-GLC will expand to include 3,000 additional sentences selected from geo_wikipedia data. These sentences will serve as a training set, enriching the treebank and offering a more comprehensive representation of the Georgian language. The primary objective is to provide a more comprehensive and representative dataset for training and analysis purposes.
Acknowledgments
The UD_Georgian-GLC release is based on the data from the Georgian Language Corpus (GLC) developed with the financial support of the Shota Rustaveli National Science Foundation (Project Nos. DP2016_23, LE/17/1-30/13, AR/320/4-105/11, Y-04-10).
Special gratitudes goes to Prof. Dr. Stavros Skopeteas from the University of Göttingen for his support and valuable comments on the initial data of the UD_Georgian-GLC treebank, Prof. Dr. Benjamin Roth from the University of Vienna for his feedback concerning the training dataset of the UD_Georgian-GLC treebank and to Prof. Dr. Dan Zeman for his invaluable contributions in making the dataset available on GitHub and offering valuable suggestions.
References
Doborjginidze, N., Lobzhanidze, I., Gunia, I. (2012). Georgian language corpus. See, http://corpora.iliauni.edu.ge/. Accessed 15 July 2023.
Doborjginidze, N., Lobzhanidze, I., Mirianashvili, G. (2014). Corpus of Georgian Chronicles. See, http://corpora.iliauni.edu.ge/. Accessed 15 July 2023.
Lobzhanidze, I. (2022). Finite-State Computational Morphology: An Analyzer and Generator for Georgian. Cham: Springer.
Statistics of UD Georgian GLC
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB
Features
Abbr – AdpType – AdvType – Animacy – Aspect – Case – Degree – Evident – Mood – NameType – Number – Number[io] – Number[obj] – Number[subj] – NumForm – NumType – PartType – Person – Person[io] – Person[obj] – Person[subj] – Poss – PronType – PunctType – Subcat – Tense – VerbForm – Voice
Relations
acl – advcl – advmod – advmod:lmod – amod – aux – case – cc – ccomp – conj – cop – csubj – det:poss – flat:name – iobj – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – parataxis – punct – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 151 sentences, 2152 tokens and 2335 syntactic words.
- This corpus contains 336 tokens (16%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 20 types of words that contain both letters and punctuation. Examples: ა., ბაქო-ბათუმის, დატვირთვა-გადმოტვირთვის, ერთ-ერთი, ეროვნულ-გამათავისუფლებელ, ეროვნულ-გამათავისუფლებელი, ვ., თ., კვლევა-ძიებას, კმ-ი, კორუმპირებულ-კრიმინალური, მატერიალურ-ტექნიკური, მეზობელ-ნათესავები, მეტ-ნაკლებად, ნება-სურვილის, სამეცნიერო-კვლევითი, სახეობრივ-მეტაფორული, სიცილ-კისკისით, შეკავება-გაწონასწორების, ჩასატვირთ-გადმოსატვირთი
- This corpus contains 183 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 169 types of multi-word tokens. Examples: აღსანიშნავია, ჩემში, საქართველოში, არაა, გვერდზე, იმაზე, მხრიდან, ტერიტორიაზე, შემთხვევაში, ადამიანისთვის, ადვოკატებისგან, ავადმყოფთან, ავადმყოფთანაც, ავტორთან, აკადემიაში, ამასთან, ამბავში, ამისათვის, არისო, აღჭურვილია, ბეჭზე, ბოლომდე, ბრალდებებზე, ბუნებრივია, გადარჩენაზე, გამოა, გამოცემებში, გამოცვლაზე, განმავლობაში, გაქვსო, გზაზე, გზაში, გულთან, დაბადებაო, დაგეგმვისათვის, დამკვიდრებისათვის, დამოკიდებულებებზე, დაყენებაში, დღიდან, ევროპაში, ეზოში, ენებთან, ვინმეა, ზდოროვიეში, ზედაპირზე, ზონებში, თავდადებულია, თავზე, თავიდან, თავისუფლებაზე.
Morphology
Tags
- This corpus uses 13 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB
- This corpus does not use the following tags: DET, INTJ, SYM, X
- This corpus contains 9 word types tagged as particles (PART): ალბათ, არ, არა, ვერც, თურმე, კი, მაინც, ო, ხომ
- This corpus contains 38 lemmas tagged as pronouns (PRON): ამდენი, არა, არავინ, არაფერი, ერთ-ერთი, ერთერთი, ერთმანეთი, ეს, ეს(ე), ვინ, ზოგიერთი, თავი, თავისი, თქვენ, იგი, იგინი, იმათი, ის, ის(ი), ისინი, მე, მისი, რა, რამაც, რამდენი, რამდენიმე, რამოდენიმე, რაღაც, როგორ, რომელი, სხვა, ყველა, ყველაფერი, ყოველი, შენ, ჩემი, ჩვენ, ჩვენი
- This corpus contains 0 lemmas tagged as determiners (DET):
- This corpus contains 4 lemmas tagged as auxiliaries (AUX): არის, აქვს, უნდა, შეუძლია
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: აქვს
- There are 2 (de)verbal forms:
- Part
- VERB: ამღერებულ, გადასაწყვეტი, გამთბარ, დაუზუსტებელი, მონათლული, შესანიშნავი
- Vnoun
- VERB: გადაქაჩვა, დახარჯვის
Nominal Features
- Anim
- NOUN: ადამიანის, ხელისუფლების, მასწავლებელი, ავადმყოფ, კაცი, მინისტრი, წარმომადგენლები, ადამიანი, ავტორ, ავტორთა
- Inan
- NOUN: საქმიანობის, საუბარი, სექტორის, უნივერსიტეტის, შეფასება, შეფასების, გზა, ენის, კისერი, სიტყვები
- Plur
- ADJ: ახალგაზრდებით, ზემოთ, ლამაზთა, სრულებითაც
- NOUN: სიტყვები, უფლებათა, კომენტარები, მალების, ორგანიზაციები, პრინციპების, სამუშაოები, წარმომადგენლები, ადამიანთა, ადვოკატების
- PRON: ისინი, ჩვენ, ჩვენი, მათ, ჩვენს, თქვენ, იმათი, რომელნიც, სხვათა, ჩვენა
- Sing
- ADJ: ქართული, აღსანიშნავი, ახალი, განსაკუთრებული, დაინტერესებული, დემოგრაფიული, დიდი, მრავალმხრივი, საერთაშორისო, ძველი
- NOUN: ადამიანის, საქმიანობის, საუბარი, სექტორის, უნივერსიტეტის, შეფასება, შეფასების, ხელისუფლების, გზა, ენის
- NUM: ერთი, მეორე, ცოტა, ერთ, მეშვიდე, ორ, ორი, პირველივე, სამი
- PRON: ამ, მე, ეს, სხვა, მის, იგი, იმ, მისი, ყველა, ჩემ
- PROPN: საქართველოს, საქართველო, აბაშიძე, ალექსანდრე, ახვლედიანის, ბათუმი, ბათუმის, ბაქო-ბათუმის, ბექიშვილს, გრიგოლ
- VERB-Part: ამღერებულ, გადასაწყვეტი, გამთბარ, დაუზუსტებელი, მონათლული, შესანიშნავი
- VERB-Vnoun: გადაქაჩვა, დახარჯვის
- Dat
- ADJ: ქართველ, ქართულ, ყოფილ, ამბულატორულ, არადამაკმაყოფილებელ, არსებულ, ახალ, გადაუმოწმებელ, განსხვავებულ, განცდილსა
- ADP: ში, ზე, თან, შორის, ზეც, თანაც
- NOUN: შესწავლას, ავადმყოფ, გვერდ, გზა, დღეს, სიცოცხლეს, ტერიტორია, ქვეყანას, ღვინოს, შემთხვევა
- NUM: ერთ, მეორე, მეშვიდე, ორ
- PRON: ამ, მე, მის, ჩემ, მათ, მას, ჩემს, ამას, არაფერს, თავის
- PROPN: საქართველო, საქართველოს, ბექიშვილს, ევროპა, კავკასია, ოდისეა
- VERB-Part: ამღერებულ, გამთბარ
- Erg
- ADJ: დაკავშირებულმა, საინტერესო, უწყინარმა
- NOUN: დამამკვიდრებლებმა, ინფორმაციამ, მოსწავლეებმა, მძღოლმა, სულმა, სწრაფვამ, ქალმა, ჩიჩინმა
- PRON: მან, მე, რამ, ამდენმა, არავინ, რამაც, სხვა, ჩვენ, ჩვენმა, ჩვენც
- PROPN: ჩიტაიამ
- Ess
- ADJ: არასასურველ, ასაშენებლად, ახლად, ბოლო, კლასიკურ, მეცნიერულად, ნამდვილ, საზღვაო, საუკეთესო, საშინლად
- ADP: მდე
- NOUN: დაავადებად, კურორტად, მაგალითად, მიზნად, პერიოდა, რევოლუცია, სამშობლოდ, სულიერებადა, ქვეყნად, შედეგად
- PRON: ჩემა, ჩვენა
- Gen
- ADJ: ქართული, ახალი, განსაკუთრებული, დაინტერესებული, დემოგრაფიული, კავკასიური, რევოლუციური, სამართალდამცავი, ადამიანური, ანკარა
- ADP: თვის, გან, გამო, კენ, შესახებ, გამოც, გარდა
- NOUN: ადამიანის, საქმიანობის, სექტორის, უნივერსიტეტის, შეფასების, ხელისუფლების, ენის, უსაფრთხოების, უფლებათა, ბრძოლის
- NUM: ერთი
- PRON: ამ, მისი, იმ, რის, ჩვენი, ამისა, ვის, ზოგიერთი, თავისი, იმათი
- PROPN: ალექსანდრე, ახვლედიანის, ბათუმის, ბაქო-ბათუმის, ვეხის, მცხეთის, რუსეთის, საქართველოს, წინანდლისა, ჭავჭავაძის
- VERB-Part: დაუზუსტებელი
- VERB-Vnoun: დახარჯვის
- Ins
- ADJ: ახალგაზრდებით, განსაკუთრებული, დამცავი, დიდი, თანამედროვე, კლიმატური, მეგობრული, მექანიზებული, მძლავრი, პატარა
- ADP: დან
- NOUN: ენით, მხრი, არგუმენტებით, აღტაცებით, ბარგით, გზებით, დახმარებით, დღი, თავი, თანამებრძოლებით
- NUM: ერთი, ორი
- PRON: იმ, იმით, თავისი, რომლითაც, სხვა
- VERB-Part: შესანიშნავი
- Nom
- ADJ: აღსანიშნავი, დადებითი, დამოკიდებული, დამფრთხალი, დიდი, მაღალკვალიფიციური, მრავალმხრივი, საერთაშორისო, საჭირო, ავთვისებიანი
- ADP: ვით
- NOUN: საუბარი, შეფასება, კისერი, მასწავლებელი, სიტყვები, ბრძოლა, თოვლი, კაცი, კომენტარები, მინისტრი
- NUM: ერთი, ცოტა, მეორე, პირველივე, სამი
- PRON: ეს, იგი, ისინი, ჩემი, ის, რამდენი, თავისი, მეც, მისი, სხვა
- PROPN: აბაშიძე, ბათუმი, გრიგოლ, დავითი, ვაჟა, თომა, ილია, ლევანი, ფშაველა, შანიძე
- VERB-Part: გადასაწყვეტი, მონათლული
- VERB-Vnoun: გადაქაჩვა
Degree and Polarity
- Pos
- ADJ: ახალი, დიდი, ძველი, საჭირო, ანკარა, აშკარა, ახალ, ახლად, დიდ, თანამედროვე
- Sup
- ADJ: საუკეთესო, უდიდესი, უმაღლეს, უმაღლესი, უმთავრესად, უშორესი, უძველეს
Verbal Features
- Imp
- AUX: შეიძლება
- VERB: ჩანს, ხდებოდა, აღნიშნავდნენ, იდგა, ითვლება, წარმოებს, ხდება, ავიწყდება, ანიჭებენ, ანიჭებს
- Perf
- VERB: აღმოაჩენ, მოიცავს, წარმოადგენს, ავივსო, აირჩიეს, ამაღლდა, ამოეგდო, აფართხალდა, აღასრულებს, აღემატება
- VERB-Vnoun: გადაქაჩვა, დახარჯვის
- Ind
- AUX: ა, იყო, უნდა, არის, იქნება, შეიძლება, ვარ, მინდა, მინდოდა, შეიძლებოდა
- VERB: ჩანს, ხდებოდა, აქვს, აღმოაჩენ, აღნიშნავდნენ, გადის, იდგა, ითვლება, მაქვს, მოდიან
- VERB-Part: ამღერებულ, გადასაწყვეტი, გამთბარ, მონათლული, შესანიშნავი
- Sub
- VERB: მიჰფენოდნენ, მოეღრიცოს
- Fut
- AUX: იქნება
- VERB: აღმოაჩენ, მოიცავს, წარმოადგენს, ასიამოვნებს, აღასრულებს, აღემატება, აღინიშნება, აღწერს, გააერთიანებს, გამოარჩევდა
- VERB-Part: შესანიშნავი
- Imp
- AUX: მინდოდა, ჰქონდა
- VERB: ხდებოდა, აღნიშნავდნენ, აპრიალებდნენ, აძლევდა, ახსოვდა, გაურბოდნენ, გვქონდა, გვწყუროდა, ეალერსებოდა, ეყრდნობოდნენ
- Past
- AUX: იყო, შეიძლებოდა
- VERB: იდგა, ავივსო, აირჩიეს, ამაღლდა, ამღერებულ, აფართხალდა, აღინიშნა, გააფერმკრთალა, გააჩნდა, გააძნელა
- VERB-Part: ამღერებულ, მონათლული
- PastPerf
- VERB: მითხოვია, მიჰფენოდნენ, მოეღრიცოს, მოსულა
- Pqp
- VERB: ამოეგდო, გამხდარიყო, გაჩენილიყო, დაეწყო, დამტკიცებულიყო, მიეყვანა, მიეცათ, მიმეთითებინა, მოეცვა, წაადგებოდა
- Pres
- AUX: ა, უნდა, არის, შეიძლება, ვარ, მინდა, ხარ
- VERB: ჩანს, აქვს, გადის, ითვლება, მაქვს, მოდიან, წარმოებს, ხდება, ავიწყდება, ამბობენ
- VERB-Part: გადასაწყვეტი, გამთბარ
- Act
- AUX: შეიძლება
- VERB: ჩანს, ხდებოდა, აღმოაჩენ, აღნიშნავდნენ, იდგა, მოიცავს, წარმოადგენს, წარმოებს, ხდება, აირჩიეს
- Mid
- VERB: ავიწყდება, ახსოვდა, გვწყუროდა, დამავიწყდა, მიეჩქარებოდათ, მქვია, მჯერა, სცხელოდა, წაადგებოდა
- Pass
- VERB: ითვლება, ავივსო, აღინიშნა, აღინიშნება, გამოედო, გაჩენილიყო, დაიბადა, ეტანება, იბადება, იკვეთებოდა
- Nfh
- PART: ო
Pronouns, Determiners, Quantifiers
- Dem
- PRON: ამ, ეს, იმ, იმით, ის, ამდენმა, ამდენს, იმავე, იმის, იმისა
- Ind
- PRON: რაღაც, ერთ-ერთი, ერთერთი, ზოგიერთი, რამდენიმე, რამოდენიმე
- Int
- PRON: რამდენი, რა, რამ, რის, ვინც, ვის, რამაც, რას, რომელნიც, რომელსაც
- Neg
- PRON: არავინ, არაფერს, არა
- Prs
- PRON: მე, იგი, ისინი, ჩვენ, მათ, მას, მეც, ამას, თავს, იმა
- Rcp
- PRON: ერთმანეთს
- Rel
- PRON: რა, როგორც, ვინმე, როგორ
- Tot
- PRON: სხვა, ყველა, სხვათა, ყველას, ყველაფერი, ყოველ, ყოველი, ყოველივე, ყოვლისა
- Card
- NUM: ერთი, ცოტა, 100.000, 1907, 2003, 2004-2005, 30, 363, ერთ, ორ
- Ord
- NUM: მეორე, მეშვიდე, პირველივე
- Yes
- PRON: მის, მისი, ჩემი, თავისი, ჩემ, ჩვენი, ჩემს, თავის, იმათი, ჩემა
- 1
- PRON: მე, ჩემ, ჩემი, ჩვენ, ჩვენი, მეც, ჩემს, ჩვენს, ჩემა, ჩვენა
- 2
- PRON: შენს, თქვენ, შენ
- 3
- PRON: ამ, ეს, მის, იგი, იმ, ისინი, მისი, ის, მათ, მას
Other Features
- Abbr
- Yes
- NOUN: პროფ, ა., ვ., თ., კმ-ი
- Yes
- AdpType
- Post
- ADP: ში, ზე, თვის, თან, დან, მდე, გან, შორის, გამო, კენ
- Post
- AdvType
- Deg
- ADV: ხშირად, პირიქით, ამდენად, სავსებით, საკმაოდ
- Int
- ADV: სად
- Loc
- ADV: აქ, ახლოს, აქედან, გარეთ, გარშემო, ზევით, იქ, სადღაც, საზღვარგარეთ, ფეხქვეშ
- Man
- ADV: სულ, ერთად, კიდევ, მხოლოდ, ასე, ასევე, ისე, სრულიად, სულაც, სწორედ
- Rel
- ADV: სადაც, რატომღაც
- Tim
- ADV: ამჟამად, შემდეგ, დღეს, მუდამ, ძირითადად, ჯერ, ახლა, ბოლოს, დილას, დღეიდან
- Deg
- NameType
- Geo
- PROPN: საქართველო, საქართველოს, ბათუმი, ბათუმის, ბაქო-ბათუმის, ევროპა, კავკასია, მცხეთის, რუსეთის, წინანდალი
- Prs
- PROPN: ალექსანდრე, გრიგოლ, დავითი, ვაჟა, თომა, ილია, ლევანი, ოდისეა, საქართველოს
- Sur
- PROPN: აბაშიძე, ახვლედიანის, ბექიშვილს, ვეხის, ფშაველა, შანიძე, ჩიტაიამ, ჭავჭავაძე, ჭავჭავაძის
- Geo
- NumForm
- Digit
- NUM: 100.000, 1907, 2003, 2004-2005, 30, 363
- Digit
- Number[io]
- Plur
- VERB: გაგვანდო, გვაფიქრებინებს, გვხვდებოდა, მიგვიყვანოს, შემოგვაგებეს
- Sing
- VERB: დამჭირდება, მეკითხება, მეძახიან, მიჰყვება, სწამებენ
- Plur
- Number[obj]
- Plur
- VERB: მიეჩქარებოდათ
- Sing
- VERB: მაინტერესებს, მითხოვია, მჭრის
- Plur
- Number[subj]
- Plur
- VERB: აღნიშნავდნენ, მოდიან, აირჩიეს, ამბობენ, ანიჭებენ, აპრიალებდნენ, აყვედრიან, გავემგზავრეთ, გაზიდეს, გამოვიყენოთ
- Sing
- AUX: ა, იყო, უნდა, არის, იქნება, შეიძლება, ვარ, მინდა, მინდოდა, შეიძლებოდა
- VERB: ჩანს, ხდებოდა, აქვს, აღმოაჩენ, გადის, იდგა, ითვლება, მაქვს, მოიცავს, წარმოადგენს
- Plur
- PartType
- Emp
- ADJ: სრულებითაც
- ADP: გამოც
- ADV: რატომღაც, დღესაც, იქვე, მაშინაც
- NOUN: ავადმყოფ, გავრცელებაც, დროსაც, მთარგმნელსაც, ნადირიც, ნაშრომებსაც, ჟესტიც, საფუძველ, შეფასებასაც, ცვლილებაცა
- NUM: პირველივე
- PART: კი, მაინც, ვერც
- PRON: მეც, როგორც, ვინმე, ვინც, იგივე, იმავე, მასაც, რომელნიც, რომელსაც, რომლითაც
- Int
- PART: ხომ, ალბათ, თურმე
- Neg
- PART: არ, არა
- Emp
- Person[io]
- 1
- VERB: გაგვანდო, გვაფიქრებინებს, გვხვდებოდა, დამჭირდება, მეკითხება, მეძახიან, მიგვიყვანოს, მიჰყვება, შემოგვაგებეს
- 2
- VERB: გაინტერესებთ
- 3
- VERB: ანიჭებენ, ანიჭებს, ასრულებს, ასწორებს, აფარებს, აფასებს, აღემატება, აღწერს, გავემგზავრეთ, გავუფრთხილდე
- 1
- Person[obj]
- 1
- VERB: მაინტერესებს, მჭრის
- 3
- AUX: უნდა, მინდა, მინდოდა, ჰქონდა
- VERB: აქვს, აღმოაჩენ, აღნიშნავდნენ, მაქვს, მოიცავს, ჩანს, წარმოადგენს, ავიწყდება, აირჩიეს, ამბობენ
- 1
- Person[subj]
- 1
- AUX: ვარ, მინდა, მინდოდა
- VERB: მაქვს, ავივსო, გავემგზავრეთ, გავუფრთხილდე, გაინტერესებთ, გამოვიყენოთ, გვქონდა, გვწყუროდა, დავინახე, დამავიწყდა
- 2
- AUX: ა, იყო, ხარ
- VERB: აღმოაჩენ, გამოედო, გაქვს, დაინახა, დაიწყო, მოავლო, მოსულა
- 3
- AUX: იყო, უნდა, არის, იქნება, შეიძლება, შეიძლებოდა, ჰქონდა
- VERB: ჩანს, ხდებოდა, აქვს, აღნიშნავდნენ, გადის, იდგა, ითვლება, მოდიან, მოიცავს, წარმოადგენს
- 1
- PunctType
- Brck
- PUNCT: (, )
- Comm
- PUNCT: ,
- Dash
- PUNCT: –
- Elip
- PUNCT: ...
- Excl
- PUNCT: !
- Peri
- PUNCT: .
- Qest
- PUNCT: ?
- Quot
- PUNCT: “, „
- Brck
- Subcat
- Indir
- VERB: ხდებოდა, ხდება, ავიწყდება, ახსოვდა, გადაწყდეს, გამხდარიყო, გახდა, გვწყუროდა, გვხვდებოდა, დამავიწყდა
- Intr
- AUX: ა, იყო, არის, იქნება, შეიძლება, ვარ, შეიძლებოდა, ხარ, ჰქონდა
- VERB: აქვს, გადის, იდგა, ითვლება, მაქვს, მოდიან, წარმოებს, ავივსო, ამაღლდა, აფართხალდა
- Tran
- AUX: უნდა, მინდა, მინდოდა
- VERB: ჩანს, აღმოაჩენ, აღნიშნავდნენ, მოიცავს, წარმოადგენს, აირჩიეს, ამბობენ, ამოეგდო, ანიჭებენ, ანიჭებს
- Indir
Syntax
Auxiliary Verbs and Copula
- This corpus uses 2 lemmas as copulas (cop). Examples: არის, აქვს.
- This corpus uses 2 lemmas as auxiliaries (aux). Examples: უნდა, შეუძლია.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Dat (7)
- VERB--NOUN-Erg (8)
- VERB--NOUN-Nom (85)
- VERB--PRON-Dat (7)
- VERB--PRON-Erg (8)
- VERB--PRON-Nom (16)
- VERB-Part--PRON-Dat (1)
- obj
- VERB--NOUN-Dat (64)
- VERB--NOUN-Dat-ADP(შესახებ) (1)
- VERB--NOUN-Nom (38)
- VERB--PRON-Dat (9)
- VERB--PRON-Nom (2)
- VERB-Part--NOUN-Nom (1)
- iobj
- VERB--NOUN (1)
- VERB--NOUN-Dat (15)
- VERB--PRON-Dat (6)
Relations Overview
- This corpus uses 4 relation subtypes: advmod:lmod, det:poss, flat:name, nsubj:pass
- The following 2 main types are not used alone, they are always subtyped: det, flat
- The following 13 relation types are not used in this corpus at all: vocative, expl, dislocated, discourse, appos, clf, fixed, compound, list, orphan, goeswith, reparandum, dep