UD Greek Lesbian
Language: Greek (code: el)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.16 release.
The following people have contributed to making this treebank part of UD: Stavros Bompolas, Stella Markantonatou, Antonios Anastasopoulos, Vivian Stamou.
Repository: UD_Greek-Lesbian
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.17
License: CC BY-SA 4.0
Genre: grammar-examples, spoken, fiction
Questions, comments? General annotation questions (either Greek-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [s • bompolas (æt) athenarc • gr]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually |
| UPOS | annotated manually, natively in UD style |
| XPOS | not available |
| Features | annotated manually, natively in UD style |
| Relations | annotated manually, natively in UD style |
Description
A Universal Dependencies (UD) treebank for the dialect of Lesbos, a low-resource living Northern variety of Modern Greek. The treebank currently contains 540 sentences with manual annotations following the Universal Dependencies framework, representing the first UD treebank for a Northern Modern Greek dialect.
The Lesbos dialect belongs to the Northern Modern Greek dialect group, characterized by distinctive phonological features collectively known as “Northern vocalism.” These features include:
-
Raising of unstressed mid vowels /e/ and /o/ into [i] and [u], respectively (e.g., πιδί [piˈði] instead of SMG παιδί [peˈði] ‘child’, κάτου [ˈkatu] instead of SMG κάτω [ˈkato] ‘down’)
-
Deletion of unstressed high vowels /i/, /u/ (e.g., φίδ [ˈfið] instead of SMG φίδι [ˈfiði] ‘snake’, βνό [ˈvno] instead of SMG βουνό [vuˈno] ‘mountain’)
These features significantly distinguish the dialect of Lesbos from Southern dialects, including Standard Modern Greek (SMG). The dialect has been historically shaped by extensive contact with Italo-Romance (particularly Venetian) during 1355-1462 and Turkish during the Ottoman period (1462-1912), resulting in numerous loanwords and morphological elements. Unlike most Modern Greek dialects, Lesbian remains vital today, serving as the primary means of communication throughout the island.
This treebank represents the first Universal Dependencies resource for a Northern Modern Greek dialect.
Annotation Process
The treebank follows the UD annotation guidelines established for UD_Greek-GUD, complemented by grammatical descriptions and dialect dictionaries. Key annotation features include:
Tokenization
-
Unlike GUD’s approach of pre-tokenizing contracted forms, the Lesbian treebank maintains merged word sequences as written in the original sources and treats them as multi-word tokens. In this line, adposition-determiner contractions are segmented as multi-word tokens (e.g., στο [sto] ‘in/to the’ is tokenized as two syntactic words, σ [s] ‘in/to’ and το [to] ‘the’)
-
Clitics frequently attached to verbs in written dialectal texts are handled as multi-word tokens (e.g., τάμπλιξις [ˈtabliksis] ‘(you) mixed them up’ → τά + μπλιξις)
-
Possessive pronouns frequently attached to nouns are similarly treated as multi-word tokens (e.g., πατέρασιτς [paˈterasits] ‘her father’ → πατέρας + ιτς)
-
Erroneously split tokens in the original sources are not merged, but instead linked using the “goeswith” relation following UD guidelines
Lemmatization
-
Words diverging from SMG counterparts are assigned lemma forms that preserve dialectal characteristics
-
Apostrophes are eliminated from lemmas to standardize representation across inconsistent source texts
-
For inconsistently spelled dialectal features, the dialectologically expected form (with vowel raising and deletion) is consistently used as the lemma
-
SMG orthography is applied to lemmas regardless of orthographic errors in source materials
Special Annotations
- Voicing and euphonic annotations appear in the
MISCcolumn using theMSeg|MGlossformat to explicitly document these phenomena. - Orthographic standardization is integrated with annotations, preserving original dialectal forms in the
FORMcolumn while providing standardized forms inMISC. - Parallel translations of each sentence in SMG facilitate comparative research.
- Metadata fields such as
sent_idandsourceidentify whether a sentence originates from written or oral data.
Data Sources
The corpus draws from six main sources representing different text types and dialectal variants from across Lesbos. The treebank consists of randomly shuffled sentences coming from these sources:
Dialectal Dictionaries (example sentences)
-
Papanis, D. and Papanis, G. D. (2004). Lexiko tou Agiasotikou Glosikou Idiomatos [Dictionary of the Agiasos Dialect], 3rd improved and expanded edition. Private edition, Mytilene.
-
Ralli, A. (2017). Lexiko dialektikis poikilias. Kydonion-Moschonision kai Voreioanatolikis Lesvou [Dictionary of dialectal variety. Kydonies-Moschonisia and Northeastern Lesbos]. Hellenic Foundation for Historical Studies, Athens.
-
Anagnostopoulou, M. A. (2021). Thematiko Lexiko tis Lesviakis Dialektou [Thematic Dictionary of the Lesbos Dialect]. Mythos BOOKS, Mytilene.
Contemporary Lesbian Literature
-
Tsokarou-Mitsioni, E. (1998). Palies Istories ap tn Agiasiou [Old Stories from Agiaso], 2nd edition. Private Edition, Mytilene.
-
Anagnostou, V. T. (2014). Tsi sta th’ka mas: Komodia sta k’stariot’ka [Tsi sta th’ka mas: Comedy in the K’stariot’ka Dialect], first edition. Estia Technon Skoutarou “T’Apono to Scholio”.
-
Tsokarou-Mitsioni, E. (2019). Prosfygiá [Refugeehood], first edition. D. Doukas & Sia O.V.E.E.
Oral Corpus (Field Research 2023–2024)
In addition to written sources, the dataset includes oral sentences transcribed from recordings collected during fieldwork conducted across multiple villages of Lesbos between 2023 and 2024. These recordings capture speakers of different ages and local varieties, reflecting the living use and intra-island variation of the dialect.
Acknowledgments
This work has been carried out within the Archimedes Research Unit of the Athena Research Center, Greece. It has been partially supported by project MIS 5154714 of the National Recovery and Resilience Plan Greece 2.0, funded by the European Union under the NextGenerationEU Program. It also received support from the CA21167 COST action UniDive, funded by COST (European Cooperation in Science and Technology).
Statistics of UD Greek Lesbian
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Aspect – Case – Definite – Degree – ExtPos – Gender – Mood – Number – NumType – Person – Polarity – Poss – PronType – Style – Tense – Typo – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advcl:relcl – advmod – amod – appos – aux – case – cc – ccomp – compound – compound:redup – conj – cop – csubj – det – discourse – dislocated – expl – fixed – flat – goeswith – iobj – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – obl:agent – orphan – parataxis – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 540 sentences, 5733 tokens and 5926 syntactic words.
- All tokens in this corpus are followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 379 types of words that contain both letters and punctuation. Examples: τ’, απ’, μ’, τσ’, σ’, τ’ς, έχ’, όχ’, ντ’, π’, τ’ν, σπίτ’, κάν’, γ’, γι’, είν’, ν’, χέρ’, ότ’, ‘γού, ‘μείς, ’γώ, έτσ’, ανθρώπ’, λάδ’, λέγ’ς, ξέρ’ς, πάρ’, σπίκ’, ‘δώ, έπρεπ’, είχ’, κουμμάτ’, κόρ’, μέσ’, ξέρ’, ούλ’, ό,τ’, Σίγρ’, αθρώπ’, βλέπ’, γυρίσ’, γ’ναίκα, δ’λειά, θέλ’, κουμάτ’, μέχρ’, μεγάλ’, ν-του, ν-τουν
- This corpus contains 193 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 86 types of multi-word tokens. Examples: στου, στο, στα, στ’, στη, στς, γιεμ, κουρούδαμ, κόρημ, μπάτσι, πας, στον, στουν, στους, στ’ν, τνώρα, τόχιτι, Πατέρασιτς, ήξιρειντα, ίσιαμ, ίσιαμι, αμί, απόξου, βρακουζώνς, γιομ, είπντα, εμπουρεί, εμπουρώ, ηφτσήμ, θκάς, θκος, ιφστήμ, κοντάμ, κόρηντ, λέγαντα, μάναμ, μάτιασ’, μήπι, μουρέλιμ, μουρφιάτσ, μουρόμ, νάβγει, νάν’, νάρτ, νέρτ, νήνταν, νανάψουν, νανοίξειν, ναπουμείνουμι, να’ρθείς.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 17 word types tagged as particles (PART): Ένι, Δηλαδή, Μπα, Οχ, ένη, δα, δε, δεν, δ’, ε, εν, μη, μην, μπά, να, όχ’, ’εν
- This corpus contains 7 lemmas tagged as pronouns (PRON): ιγώ, μ, μι, ποιος, που, τι, τις
- This corpus contains 31 lemmas tagged as determiners (DET): άλλους, έγιουτους, έγιτσεινους, ένας, αυτός, εύτους, η, κάθα, κάθι, κάτ, καθένας, κανένας, μ, μιρκός, ου, ούλους, πάν, πουλύς, πόθα, πόσους, τέτοιους, τίπουτα, τι, τις, του, τούτους, τόσους, ό,τ, όλους, όποιους, όσους
- Out of the above, 3 lemmas occurred sometimes as PRON and sometimes as DET: μ, τι, τις
- This corpus contains 5 lemmas tagged as auxiliaries (AUX): έχου, ας, είμι, θα, να
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: έχου
- There are 4 (de)verbal forms:
- Conv
- VERB: γιλώντας, κλέγουντας, τραγδώντας
- Fin
- AUX: ήνταν, ήταν, είνι, είναι, είν’, είμαι, ένι, είμι, είνη, είχε
- VERB: είχε, έχ’, λέει, κάν’, έχουν, έλα, έπρεπε, είχαν, κάνου, λέγ’ς
- Inf
- VERB: ακούσ’, διαβάσ’, μείν’, πάει, πάρ’, πέρνη, φύγ’
- Part
- VERB: Ευχαριστημέν’, Παντρεμένος, αγαπμέν, αγισμένους, γεννμέν’, καμωμένα, καμωμένο, λαδουμένου, λοιμ’τσιασμένους, μιτσ’μένους
Nominal Features
- Fem
- ADJ: καλή, μεγάλ’, αγιά, κυρά, φτουχές, Αγ’, Μικρά, Μικράς, Ρήνιω, έγκυος
- DET: η, τ’, γη, μια, τ’ς, τς, τη, τ’ν, τν, ντ’
- INTJ: μουρή, βουρή, Καληνύχτα, μουρ
- NOUN: μάνα, μέρα, ώρα, γναίκα, κόρη, κόρ’, νύχτα, βαλανιδιά, γιαγιά, γναίτσις
- NUM: μια, δυο, 2, 3, μιαν, τρεις
- PRON: που, τ’ς, τς, τ’, ντουν, πού, τν, τσ’, Ποια, ιτζ
- PROPN: Ανθή, Αντρόνα, Γκαλλονή, Ερσσό, Μυτιλήν, Μυτιλήν’, Παναγιά, Ρουζαλία, Άγρας, Αμερική
- VERB-Part: Ευχαριστημέν’, αγαπμέν, γεννμέν’, στιναχουρημέν, συκλινσμέν
- Masc
- ADJ: καημένους, Τούρκους, κακός, καλός, μεγάλου, Άγιο, Αγιού, Ελληνις, Ζουντανοί, Κύριοι
- DET: του, η, οι, τουν, γιου, ένας, ο, τ’, γη, τον
- INTJ: Βούρ’, μουρ, μουρέ
- NOUN: άθριπους, άντρα, ανθρώπ’, γιε, κόσμους, άντρας, αθρώπ’, γιατρός, γιο, πατέρα
- NUM: ένα, δυο
- PRON: τ’, τουν, ντ, ιμ, που, ιτ, μ, ν-τουν, ντον, ντουν
- PROPN: Β’ναριώτις, Γιάνν’, Γιάνν’ς, Γιώργ’, Δησέφ, Χατζικουμής, γι-Απουστόλ’ς, 15, Απουστόλς, Βαγγέλ’
- VERB: Παντρεμένος, αγισμένους, κουλουξυρ’σμένους, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος, παντρεμέν’, τσ’στάμινους, ψουφμένοι
- VERB-Part: Παντρεμένος, αγισμένους, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος, παντρεμέν’, τσ’στάμινους
- Neut
- ADJ: καλό, μαύρα, θκα, θκο, κακό, λίγα, μσό, ξύλου, Αγροτικό, Β’ναριώτ’κου
- DET: του, τα, το, τ’, αυτό, ούλα, ένα, πουλλά, άλλου, έγιουτα
- INTJ: μουρά
- NOUN: σπίτ’, μουρό, χουριό, χρόνια, πράμα, χωριό, μουρά, πράματα, χέρ’, λάδ’
- NUM: ένα, δυο, τρία, 100, 200, δέκα, τριγιά
- PRON: τα, του, τι, το, που, ντα, π’, τ’, ντου, τό
- PROPN: Μπουτέλ, Σίγρ’, Ατζιλικό, Χίδερα, Ακλιδιού, Ασπασέλ’, Ατζιλικο, Αϊβαλί, Γιουργή, Γληγουρέλ’
- SCONJ: τι
- VERB-Part: καμωμένα, καμωμένο, λαδουμένου, μπαντρεμένα, ξετσλιασμένου, σπασμένα, στρμωγμένα
- Plur
- ADJ: μαύρα, θκα, λίγα, φτουχές, Ελληνις, Ζουντανοί, Κύριοι, Τούρτσ’, απανουγυρισ’κά, αρχαία
- AUX-Fin: ήνταν, ήταν, είναι, Έχουν, έχουμ’, είμαι, είμαστε, είνι, ν’, ’μαστι
- DET: τα, οι, ούλα, τ’ς, τς, πουλλά, έγιουτα, γη, τσ’, τ’
- INTJ: μουρά
- NOUN: χρόνια, πράματα, ανθρώπ’, μουρά, χωριά, αδέρφια, αθρώπ’, γναίτσις, χουράφια, αυγές
- NUM: δυο, τρία, 100, 2, 200, 3, δέκα, τρεις, τριγιά
- PRON: τα, μας, που, ‘μείς, ντα, ντουν, σας, τά, μεις, πού
- PROPN: Β’ναριώτις, Χίδερα, Ατζιλικο, Μαλάματα, Παράκοιλα, Χάνια, Χουχλιά
- VERB: έχουν, είχαν, έχουμι, κάναν, πήραν, φύγαν, ήβραν, ήρταν, βάλουμε, είπαν
- VERB-Fin: έχουν, είχαν, έχουμι, κάναν, πήραν, φύγαν, ήβραν, ήρταν, βάλουμε, είπαν
- VERB-Part: καμωμένα, μπαντρεμένα, παντρεμέν’, σπασμένα, στρμωγμένα
- Sing
- ADJ: καλή, καημένους, καλό, Τούρκους, μεγάλ’, αγιά, θκο, κακό, κακός, καλός
- AUX-Fin: ήνταν, ήταν, είνι, είναι, είν’, είμαι, ένι, είμι, είνη, είχε
- DET: του, η, το, τ’, γη, αυτό, μια, τουν, γιου, τη
- INTJ: μουρή, βουρή, μουρ, Βούρ’, Καληνύχτα, μουρέ
- NOUN: μάνα, μέρα, σπίτ’, μουρό, χουριό, πράμα, χωριό, ώρα, χέρ’, άθριπους
- NUM: ένα, μια, μιαν
- PRON: μ’, τ’, του, τουν, σ’, τι, μι, το, μ, που
- PROPN: Ανθή, Μπουτέλ, Σίγρ’, Αντρόνα, Ατζιλικό, Γιάνν’, Γιάνν’ς, Γιώργ’, Γκαλλονή, Δησέφ
- SCONJ: τι
- VERB-Fin: είχε, έχ’, λέει, κάν’, έλα, έπρεπε, κάνου, λέγ’ς, ξέρ’ς, πα
- VERB-Part: Ευχαριστημέν’, Παντρεμένος, αγαπμέν, αγισμένους, γεννμέν’, καμωμένο, λαδουμένου, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος
- Acc
- ADJ: μαύρα, θκα, κακό, καλό, λίγα, μεγάλου, μεγάλ’, ξύλου, φτουχές, Άγιο
- DET: του, τα, τ’, το, τουν, μια, αυτό, τη, ούλα, τ’ν
- INTJ: Καληνύχτα
- NOUN: μέρα, σπίτ’, χρόνια, χουριό, χέρ’, ώρα, λάδ’, πράματα, σπίκ’, χωριό
- NUM: ένα, δυο, μια, τρία, 100, 2, 200, 3, δέκα, μιαν
- PRON: τα, του, τι, τουν, μι, το, μας, μ’, που, σι
- PROPN: Γκαλλονή, Δησέφ, Μυτιλήν, Μυτιλήν’, Σίγρ’, Χίδερα, Ακλιδιού, Ατζιλικό, Βαγγέλ’, Βασίλ’
- SCONJ: τι
- VERB: καμωμένο, κουλουξυρ’σμένους, λαδουμένου, μπαντρεμένα, ξετσλιασμένου, σπασμένα
- VERB-Part: καμωμένο, λαδουμένου, μπαντρεμένα, ξετσλιασμένου, σπασμένα
- Gen
- ADJ: Αγιού, Μικράς
- DET: τ’, τ’ς, τς, του, αλλουνού, τ, της, τσ’
- NOUN: σπιτιού, χρονών, ακκλησάς, αντρού, θειά, ιγτουνιάσ’, καβγά, μάνα, μάνας, μηχανής
- PRON: μ’, τ’, μας, σ’, μ, ντ, τ’ς, ιμ, ς, ντουν
- PROPN: Άγρας, Ασίας, Βασ’λειού, Γιάνν’, Γώγου, Θιού, Ιουλίου, Καλλονής, Κουλουμαρίγιας, Μιλπουμέν’ς
- Nom
- ADJ: καημένους, καλή, Τούρκους, Καλό, κακός, καλός, μσό, Ζουντανοί, Μικρά, Πιδέξους
- DET: η, του, τα, γη, οι, γιου, το, ένας, ο, αυτό
- INTJ: μουρή
- NOUN: μάνα, άθριπους, ανθρώπ’, κόσμους, μουρό, πράμα, άντρας, αθρώπ’, γιαγιά, γιατρός
- NUM: δυο, μια
- PRON: που, γω, συ, ‘γού, ‘μείς, ’γώ, π’, εσύ, μεις, πού
- PROPN: Μπουτέλ, Ανθή, Αντρόνα, Β’ναριώτις, Γιάνν’ς, Ερσσό, Χατζικουμής, γι-Απουστόλ’ς, 15, Αμερική
- SCONJ: τι
- VERB: Ευχαριστημέν’, Παντρεμένος, αγαπμέν, αγισμένους, γεννμέν’, καμωμένα, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος, παντρεμέν’
- VERB-Part: Ευχαριστημέν’, Παντρεμένος, αγαπμέν, αγισμένους, γεννμέν’, καμωμένα, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος, παντρεμέν’
- Voc
- ADJ: κυρά, Αγιά, Κύριοι, Ρήνιω, απρόκουφτι, αχριγιάννα, κυρ, κ’μπάρι
- INTJ: μουρή, βουρή, μουρ, Βούρ’, μουρά, μουρέ
- NOUN: γιε, μάνα, θρώπ’, άθρουπι, άντρα, γναίκα, γ’ναίκα, θειά, θεια, κόρη
- PROPN: Ρουζαλία, Ανθή, Ατζιλικο, Βαρβάρα, Γιώργ’, Δημητρό, Θιέ, Θιμιστουκλή, Κόπ’, Μαριγώ
- Def
- DET: του, τα, η, τ’, το, γη, οι, τουν, γιου, τ’ς
- Ind
- DET: μια, ένα, ένας, έναν, έν’, καμιά
Degree and Polarity
- Aug
- ADJ: λίγα
- ADV: ταχτέρ, ίσια, γύρου
- NOUN: πουρνό, άνια, μπέλι, μπούτσια, παλιουπουτανάρα, χειρούκλις
- Cmp
- ADV: πιο
- Dim
- ADV: λιγάκ’
- NOUN: κουρούδα, ακκλησιούδα, γαβανέλ, εκκλησέλ, καμαρούδα, καφιδέλ, κουπηλούδια, κουπιλούδια, κουπιλούδ’, λιμανέλ
- PROPN: Μπουτέλ, Ατζιλικό, Ασπασέλ’, Ατζιλικο, Γληγουρέλ’, Κατιρίνη, Μαριγώ, Ν’κουλέλ’, Ξινέλ’, Πιρσιφόν
- Neg
- INTJ: όχ’, Όχι, Όχ
- PART: δεν, δε, εν, ε, μη, όχ’, μην, Ένι, δ’, ’εν
- Pos
- INTJ: ναι
Verbal Features
- Imp
- AUX-Fin: ήνταν, ήταν, είνι, είν’, είμαι, είναι, είχε, ένι, ήμν-ταν, είμαστε
- VERB-Conv: γιλώντας, κλέγουντας, τραγδώντας
- VERB-Fin: είχε, έχ’, λέει, έχουν, έπρεπε, είχαν, λέγ’ς, ξέρ’ς, έπρεπ’, είχι
- Perf
- VERB-Fin: έλα, πω, ήρτι, είπε, είπι, κάνου, κάν’, κάτσι, πάρ’, πήγι
- VERB-Inf: ακούσ’, διαβάσ’, μείν’, πάει, πάρ’, πέρνη, φύγ’
- Imp
- VERB-Fin: έλα, κάτσι, Σώπα, άγι, βάλι, πάνι, στρώσε, Άκου, Έχε, Ακ’σι
- Ind
- AUX-Fin: ήνταν, ήταν, είνι, είναι, είν’, είμαι, ένι, είμι, είνη, είχε
- VERB-Fin: είχε, έχ’, λέει, κάν’, έχουν, έπρεπε, είχαν, κάνου, λέγ’ς, ξέρ’ς
- Fut
- AUX: θα, α
- Past
- AUX-Fin: ήνταν, ήταν, είχε, ένι, ήμν-ταν, ταν
- VERB-Fin: είχε, έπρεπε, είχαν, έπρεπ’, ήρτι, είπε, είπι, είχι, πήγι, έκανε
- Pres
- AUX-Fin: είνι, είναι, είν’, είμαι, είμι, είνη, Έχεις, Έχουν, Έχς, ένι
- VERB-Fin: έχ’, λέει, έχουν, λέγ’ς, ξέρ’ς, θέλου, κάν’, λέγου, ξέρ’, έχου
- Act
- AUX-Fin: είχε, Έχεις, Έχουν, Έχς, έχουμ’, ‘χω
- VERB-Conv: γιλώντας, κλέγουντας, τραγδώντας
- VERB-Fin: είχε, έχ’, λέει, κάν’, έχουν, έπρεπε, είχαν, κάνου, λέγ’ς, ξέρ’ς
- VERB-Inf: ακούσ’, διαβάσ’, μείν’, πάει, πάρ’, πέρνη, φύγ’
- Pass
- AUX-Fin: ήνταν, ήταν, είνι, είναι, είν’, είμαι, ένι, είμι, είνη, ήμν-ταν
- VERB-Fin: έλα, ήρτι, κάτσι, ήρτα, ήρταν, γίνται, γίνταν, γίν’, γεννήθκα, θμάσαι
- VERB-Part: Ευχαριστημέν’, Παντρεμένος, αγαπμέν, αγισμένους, γεννμέν’, καμωμένα, καμωμένο, λαδουμένου, λοιμ’τσιασμένους, μιτσ’μένους
Pronouns, Determiners, Quantifiers
- Art
- DET: του, τα, η, τ’, το, γη, οι, μια, τουν, γιου
- Dem
- ADV: τόσου
- DET: αυτό, αυτός, φτος, έγιουτα, έφτου, έφτα, αυτή, τούτους, φκοι, Φτη
- Ind
- ADV: πουλύ, που, άλλου, λίγου
- DET: πουλλά, άλλου, κάκ’, κάτ’, άλλους, κανέ, άλλα, άλλο, άλλοι, άλλος
- Int
- ADV: πού, πότι, γιατί, πώς, τίλιγια, τι, Τίλια
- DET: τι, αλλουνού, πόθα, πόσα, τη
- PRON: τι, τί, Ποια, Τις, κι, ποιον, ποιος
- SCONJ: τι
- Neg
- ADV: πουτέ
- DET: κανείς, καμιά, κανέναν, τίπουτα, κάνα, κίποτα, καμιάν, κανέ, κανένας, ντου
- Prs
- PRON: μ’, τ’, τα, μας, του, τουν, σ’, μι, το, μ
- Rel
- ADV: που, όπως, Όσου
- DET: ό,τ’, όποιους, Όσις, όποιος, όσα
- PRON: που, π’, πού
- SCONJ: που, π’
- Tot
- ADV: ούλου, πάντα
- DET: ούλα, ούλ’, ούλ, ούλου, πάντα, κάθι, ουλ’, κάθα, κάθε, καθένας
- Card
- NUM: δυο, ένα, μια, 100, 1912, 9, τρία, 12, 120, 13
- Yes
- PRON: μ’, τ’, μας, μ, σ’, ντ, ιμ, ς, τ’ς, ντουν
- 1
- AUX-Fin: είμαι, είμι, έχουμ’, είμαστε, είμη, ‘χω, ’μαστι
- PRON: μ’, μας, μι, μ, γω, ιμ, ‘γού, ‘μείς, ’γώ, μένα
- VERB-Fin: κάνου, πω, θέλου, λέγου, έχου, έχουμι, δω, μπουρώ, ξέρου, Έφαγα
- 2
- AUX-Fin: Έχεις, Έχς
- PRON: σ’, συ, σι, ς, σ, σας, σε, εσύ, μ’, ση
- VERB-Fin: έλα, λέγ’ς, ξέρ’ς, κάτσι, θες, λες, ξέρς, πεις, Σώπα, άγι
- 3
- AUX-Fin: ήνταν, ήταν, είνι, είναι, είν’, ένι, είνη, είχε, Έχουν, έχ’
- DET: αυτός, φτος, έφτοι, έφτου, αυτοί
- PRON: τ’, τα, του, τουν, το, ντ, τ’ς, τς, ντα, ντουν
- VERB-Fin: είχε, έχ’, λέει, κάν’, έχουν, έπρεπε, είχαν, πα, έπρεπ’, ήρτι
Other Features
- ExtPos
- ADP
- ADP: απ, μες, χωρίς
- ADV: ίσια, μέσα, μες, πάν’, πα, πριν, Ύστιρα, Απάνου, ανάμισα, ιδώ
- VERB: πάν’
- ADV
- ADJ: καλού
- ADV: Λίγου, Σαν, Σιγά, άλλου, μες, μο
- NUM: 100
- PART: μπά, Μπα
- SCONJ: π’
- CCONJ
- ADV: ακόμα
- INTJ
- X: Εις
- SCONJ
- ADP: για
- SCONJ: παρόλο, που
- ADP
- Style
- Arch
- X: αναδράμου
- Arch
- Typo
- Yes
- ADJ: Ελληνις, Ρήνιω, αχριγιάννα, καταμισ’νος
- ADP: μέσ’, μη
- ADV: κουμάτ, κουμάτ’, πού, άναβλα, πλ-ια, πως, πά
- AUX-Fin: είνη, ήμν-ταν, είμη
- CCONJ: τσί, τσι’
- DET: τσ’, γη, γι, ι, κατ’, Φτη, έγτσιν, γή, πουλι, τα
- INTJ: άγντη
- NOUN: Αφουρμί, γ-κόσμου, δλεια, δυουλιά, δ’λιά, ηφτσή, καφαλτή, κουπηλούδια, μ-προυκουπή, μάννα
- PART: Οχ, ένη
- PRON: ’γώ, τό, ν-τουν, πού, τά, ση, τί, τσ, Γω, ήμ
- PROPN: 15, Ατζιλικο, Γνάτσ, Θρασίβουλου, Κατιρίνη, Ξυνόφς, Σμυρν’, Φρουσήν, τσιριατσή
- SCONJ: μι, νά
- VERB-Conv: κλέγουντας
- VERB-Fin: έφγει, λόγιαζει, ξερς, πήγει, πιάσει, φαίνητι, φώναζει, Ανέβτσει, Κοίτιτι, έδξει
- VERB-Inf: πέρνη
- VERB-Part: συκλινσμέν
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: είμι.
- This corpus uses 4 lemmas as auxiliaries (aux). Examples: θα, να, έχου, ας.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Acc (14)
- VERB-Fin--NOUN-Nom (116)
- VERB-Fin--NOUN-Nom-ADP(σι) (1)
- VERB-Fin--PRON-Nom (56)
- VERB-Inf--NOUN-Nom (1)
- VERB-Part--NOUN-Nom (2)
- obj
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Acc (210)
- VERB-Fin--NOUN-Nom (8)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (143)
- VERB-Fin--PRON-Gen (1)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--PRON-Acc (2)
- VERB-Part--NOUN-Acc (1)
- iobj
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--PRON-Acc (16)
- VERB-Fin--PRON-Gen (12)
Relations Overview
- This corpus uses 5 relation subtypes: acl:relcl, advcl:relcl, compound:redup, nsubj:pass, obl:agent
- The following 3 relation types are not used in this corpus at all: clf, list, dep