UD Greek Lesbian
Language: Greek (code: el)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.16 release.
The following people have contributed to making this treebank part of UD: Stavros Bompolas, Stella Markantonatou, Antonios Anastasopoulos, Vivian Stamou.
Repository: UD_Greek-Lesbian
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.18
License: CC BY-SA 4.0
Genre: grammar-examples, spoken, fiction
Questions, comments? General annotation questions (either Greek-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [s • bompolas (æt) athenarc • gr]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually |
| UPOS | annotated manually, natively in UD style |
| XPOS | not available |
| Features | annotated manually, natively in UD style |
| Relations | annotated manually, natively in UD style |
Description
A Universal Dependencies (UD) treebank for the dialect of Lesbos, a low-resource living Northern variety of Modern Greek. The treebank currently contains 625 sentences with manual annotations following the Universal Dependencies framework, representing the first UD treebank for a Northern Modern Greek dialect.
The Lesbos dialect belongs to the Northern Modern Greek dialect group, characterized by distinctive phonological features collectively known as “Northern vocalism.” These features include:
-
Raising of unstressed mid vowels /e/ and /o/ into [i] and [u], respectively (e.g., πιδί [piˈði] instead of SMG παιδί [peˈði] ‘child’, κάτου [ˈkatu] instead of SMG κάτω [ˈkato] ‘down’)
-
Deletion of unstressed high vowels /i/, /u/ (e.g., φίδ [ˈfið] instead of SMG φίδι [ˈfiði] ‘snake’, βνό [ˈvno] instead of SMG βουνό [vuˈno] ‘mountain’)
These features significantly distinguish the dialect of Lesbos from Southern dialects, including Standard Modern Greek (SMG). The dialect has been historically shaped by extensive contact with Italo-Romance (particularly Venetian) during 1355-1462 and Turkish during the Ottoman period (1462-1912), resulting in numerous loanwords and morphological elements. Unlike most Modern Greek dialects, Lesbian remains vital today, serving as the primary means of communication throughout the island.
This treebank represents the first Universal Dependencies resource for a Northern Modern Greek dialect.
Annotation Process
The treebank follows the UD annotation guidelines established for UD_Greek-GUD, complemented by grammatical descriptions and dialect dictionaries. Key annotation features include:
Tokenization
-
Unlike GUD’s approach of pre-tokenizing contracted forms, the Lesbian treebank maintains merged word sequences as written in the original sources and treats them as multi-word tokens. In this line, adposition-determiner contractions are segmented as multi-word tokens (e.g., στο [sto] ‘in/to the’ is tokenized as two syntactic words, σ [s] ‘in/to’ and το [to] ‘the’)
-
Clitics frequently attached to verbs in written dialectal texts are handled as multi-word tokens (e.g., τάμπλιξις [ˈtabliksis] ‘(you) mixed them up’ → τά + μπλιξις)
-
Possessive pronouns frequently attached to nouns are similarly treated as multi-word tokens (e.g., πατέρασιτς [paˈterasits] ‘her father’ → πατέρας + ιτς)
-
Erroneously split tokens in the original sources are not merged, but instead linked using the “goeswith” relation following UD guidelines
Lemmatization
-
Words diverging from SMG counterparts are assigned lemma forms that preserve dialectal characteristics
-
When multiple intra-dialectal phonological variants correspond to the same lexical item, a single common lemma is used and the surface phonological difference is recorded in the MISC column using
PhonVariant(e.g.,PhonVariant=Deaffricated). -
Apostrophes are eliminated from lemmas to standardize representation across inconsistent source texts
-
For inconsistently spelled dialectal features, the dialectologically expected form (with vowel raising and deletion) is consistently used as the lemma
-
SMG orthography is applied to lemmas regardless of orthographic errors in source materials
Special Annotations
- Voicing and euphonic annotations appear in the
MISCcolumn using theMSeg|MGlossformat to explicitly document these phenomena. - Orthographic standardization is integrated with annotations, preserving original dialectal forms in the
FORMcolumn while providing standardized forms inMISC. - Parallel translations of each sentence in SMG facilitate comparative research.
- Metadata fields such as
sent_idandsourceidentify whether a sentence originates from written or oral data.
Data Sources
The corpus draws from six main sources representing different text types and dialectal variants from across Lesbos. The treebank consists of randomly shuffled sentences coming from these sources:
Dialectal Dictionaries (example sentences)
-
Papanis, D. and Papanis, G. D. (2004). Lexiko tou Agiasotikou Glosikou Idiomatos [Dictionary of the Agiasos Dialect], 3rd improved and expanded edition. Private edition, Mytilene.
-
Ralli, A. (2017). Lexiko dialektikis poikilias. Kydonion-Moschonision kai Voreioanatolikis Lesvou [Dictionary of dialectal variety. Kydonies-Moschonisia and Northeastern Lesbos]. Hellenic Foundation for Historical Studies, Athens.
-
Anagnostopoulou, M. A. (2021). Thematiko Lexiko tis Lesviakis Dialektou [Thematic Dictionary of the Lesbos Dialect]. Mythos BOOKS, Mytilene.
Contemporary Lesbian Literature
-
Tsokarou-Mitsioni, E. (1998). Palies Istories ap tn Agiasiou [Old Stories from Agiaso], 2nd edition. Private Edition, Mytilene.
-
Anagnostou, V. T. (2014). Tsi sta th’ka mas: Komodia sta k’stariot’ka [Tsi sta th’ka mas: Comedy in the K’stariot’ka Dialect], first edition. Estia Technon Skoutarou “T’Apono to Scholio”.
-
Tsokarou-Mitsioni, E. (2019). Prosfygiá [Refugeehood], first edition. D. Doukas & Sia O.V.E.E.
Oral Corpus (Field Research 2023–2024)
In addition to written sources, the dataset includes oral sentences transcribed from recordings collected during fieldwork conducted across multiple villages of Lesbos between 2023 and 2024. These recordings capture speakers of different ages and local varieties, reflecting the living use and intra-island variation of the dialect.
Acknowledgments
This work has been carried out within the Archimedes Research Unit of the Athena Research Center, Greece. It has been partially supported by project MIS 5154714 of the National Recovery and Resilience Plan Greece 2.0, funded by the European Union under the NextGenerationEU Program. It also received support from the CA21167 COST action UniDive, funded by COST (European Cooperation in Science and Technology).
Statistics of UD Greek Lesbian
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Aspect – Case – Definite – Degree – ExtPos – Gender – Mood – Number – NumType – Person – Polarity – Poss – PronType – PunctType – Tense – Typo – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advcl:relcl – advmod – amod – appos – aux – case – cc – ccomp – compound – compound:redup – conj – cop – csubj – det – discourse – dislocated – expl – fixed – flat – goeswith – iobj – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – obl:agent – orphan – parataxis – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 625 sentences, 6624 tokens and 6840 syntactic words.
- This corpus contains 991 tokens (15%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 447 types of words that contain both letters and punctuation. Examples: τ’, απ’, μ’, τσ’, σ’, τ’ς, έχ’, όχ’, ντ’, π’, τ’ν, σπίτ’, κάν’, γ’, γι’, είν’, ν’, χέρ’, ότ’, ‘γού, ‘μείς, ’γώ, έτσ’, ανθρώπ’, θέλ’, λάδ’, λέγ’ς, ξέρ’ς, ούλ’, πάρ’, σπίκ’, ‘δώ, έπρεπ’, είχ’, κουμμάτ’, κόρ’, μέσ’, ξέρ’, πάγ’, τσιφάλ’, ό,τ’, Σίγρ’, αθρώπ’, βλέπ’, γίν’, γυρίσ’, γ’ναίκα, δ’λειά, κάν’ς, κουμάτ’
- This corpus contains 216 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 90 types of multi-word tokens. Examples: στου, στα, στο, στ’, σν, στς, στη, γιεμ, κουρούδαμ, κόρημ, μπάτσι, πας, στον, στουν, στους, στ’ν, τνώρα, τόχιτι, Πατέρασιτς, ήξιρειντα, ίσιαμ, ίσιαμι, αμί, απόξου, βάλτου, βρακουζώνς, γέμστου, γιομ, είπντα, εμπουρεί, εμπουρώ, ηφτσήμ, θκάς, θκος, ιφστήμ, κοντάμ, κόρηντ, λέγαντα, μάναμ, μάτιασ’, μήπι, μουρέλιμ, μουρφιάτσ, μουρόμ, νάβγει, νάν’, νάρτ, νέρτ, νήνταν, νακλσησιά.
Morphology
Tags
- This corpus uses 16 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: SYM
- This corpus contains 22 word types tagged as particles (PART): Ένι, Δηλαδή, Μπα, Οχ, έ, έν, έν-ι, ένη, δα, δε, δεν, δ’, ε, εν, μή, μη, μην, μπά, νά, να, όχ’, ’εν
- This corpus contains 9 lemmas tagged as pronouns (PRON): η, ιγώ, μι, π, ποιος, που, σι, τι, τις
- This corpus contains 37 lemmas tagged as determiners (DET): άλλους, έγιουτους, έγιτσεινους, ένας, αυτός, εύτους, η, ιγώ, κάθα, κάθι, κάμπουσους, κάτ, καθένας, κανένας, κανείς, μ, μιρκός, ου, ούλους, πάν, πουλύς, πόθα, πόσους, τέτοιους, τίπουτα, τα, τι, τις, του, τούτους, τσείνους, τόσουνας, τόσους, ό,τ, όλους, όποιους, όσους
- Out of the above, 4 lemmas occurred sometimes as PRON and sometimes as DET: η, ιγώ, τι, τις
- This corpus contains 5 lemmas tagged as auxiliaries (AUX): έχου, ας, είμι, θα, να
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: έχου
- There are 4 (de)verbal forms:
- Conv
- VERB: γιλώντας, κλέγουντας, τραγδώντας
- Fin
- AUX: ήνταν, είνι, ήταν, είναι, είν’, είμαι, ένι, είμι, είν, είνη
- VERB: είχε, έχ’, κάν’, λέει, έλα, έχουν, κάνου, πάμι, πω, έπρεπε
- Inf
- VERB: ακούσ’, διαβάσ’, μείν’, πάει, πάρ’, πέρνη, φύγ’
- Part
- VERB: Ευχαριστημέν’, Παντρεμένος, αβανουκαμένος, αγαπμέν, αγισμένους, γεννμέν’, ιρουτιβμένους, καμωμένα, καμωμένο, λαδουμένου
Nominal Features
- Fem
- ADJ: καλή, αγιά, μεγάλ’, κυρά, φτουχές, Αγ’, Μικρά, Μικράς, Ρήνιω, έγκυος
- DET: η, μια, τ’, γη, τς, τ’ς, τν, τη, τ’ν, ντ’
- INTJ: μουρή, βουρή, Καληνύχτα, Μούρ, μουρ
- NOUN: μάνα, μέρα, ώρα, γναίκα, κόρη, κόρ’, νύχτα, φουτιά, βαλανιδιά, γιαγιά
- NUM: μια, δυο, τρεις, 2, 3, μιαν
- PRON: που, τς, τ’ς, τ’, ντουν, πού, τν, τσ’, Ποια, ιτζ
- PROPN: Ανθή, Αντρόνα, Βαρβάρα, Γκαλλονή, Ερσσό, Μυτιλήν, Μυτιλήν’, Παναγιά, Παναγιούδα, Ρουζαλία
- VERB: Ευχαριστημέν’, αγαπμέν, ασπρουγάνιασις, γεννμέν’, στιναχουρημέν, συκλινσμέν
- VERB-Part: Ευχαριστημέν’, αγαπμέν, γεννμέν’, στιναχουρημέν, συκλινσμέν
- Masc
- ADJ: καημένους, Τούρκους, κακός, καλός, μεγάλου, Άγαρμπους, Άγιο, Άν’φτους, Αγιού, Ελληνις
- DET: του, οι, τουν, η, γιου, ι, ένας, ο, τ’, γη
- INTJ: Βούρ’, μουρ, μουρέ
- NOUN: άθριπους, άντρα, ανθρώπ’, γιατρός, γιε, κόσμους, άντρας, αθρώπ’, γιο, γιος
- NUM: ένα, δυο
- PRON: τ’, τουν, ιτ, τ, ντ, που, του, ν-τουν, ντον, ντουν
- PROPN: Β’ναριώτις, Γιάνν’, Γιάνν’ς, Γιώργ’, Δησέφ, Χατζικουμής, γι-Απουστόλ’ς, 15, Αλέκου, Απουστόλς
- VERB: Παντρεμένος, αβανουκαμένος, αγισμένους, ιρουτιβμένους, κουλουξυρ’σμένους, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος, παντρεμέν’, τσ’στάμινους
- VERB-Part: Παντρεμένος, αβανουκαμένος, αγισμένους, ιρουτιβμένους, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος, παντρεμέν’, τσ’στάμινους
- Neut
- ADJ: καλό, μαύρα, θκα, θκο, κακό, λίγα, μσό, ξύλου, Αγροτικό, Β’ναριώτ’κου
- DET: του, τα, το, τ’, αυτό, ούλα, ένα, τ, άλλου, πουλλά
- INTJ: μουρά
- NOUN: μουρό, σπίτ’, χρόνια, χουριό, πράμα, χωριό, μουρά, πράματα, χέρ’, λάδ’
- NUM: δυο, ένα, τρία, 100, 200, δέκα, τριγιά
- PRON: τα, του, τι, το, που, ντα, ντου, π’, τ’, τί
- PROPN: Μπουτέλ, Σίγρ’, Ατζιλικό, Μουσχουν’ήσ, Χίδερα, Ακλιδιού, Ασπασέλ’, Ατζιλικο, Αϊβαλί, Γιουργή
- SCONJ: τι
- VERB-Part: καμωμένα, καμωμένο, λαδουμένου, μπαντρεμένα, ξετσλιασμένου, σπασμένα, στρμωγμένα, χτισμένου
- Plur
- ADJ: μαύρα, θκα, λίγα, φτουχές, Ελληνις, Ζουντανοί, Κύριοι, Τούρτσ’, απανουγυρισ’κά, αρχαία
- AUX-Fin: ήνταν, ήταν, είναι, είνι, Έχουν, έχουμ’, είμαι, είμαστε, ν’, ’μαστι
- DET: τα, οι, ούλα, τς, τ’ς, πουλλά, έγιουτα, γη, τσ’, τ’
- INTJ: μουρά
- NOUN: χρόνια, πράματα, ανθρώπ’, μουρά, χουράφια, χωριά, αδέρφια, αθρώπ’, γναίτσις, μάτια
- NUM: δυο, τρία, τρεις, 100, 2, 200, 3, δέκα, τριγιά
- PRON: τα, μας, που, ‘μείς, ντα, ντουν, σας, πό, τά, μεις
- PROPN: Β’ναριώτις, Χίδερα, Ατζιλικο, Μαλάματα, Παράκοιλα, Χάνια, Χουχλιά
- VERB: έχουν, πάμι, είχαν, έχουμι, κάναν, πήραν, φύγαν, ήβραν, ήρταν, βάλουμε
- VERB-Fin: έχουν, πάμι, είχαν, έχουμι, κάναν, πήραν, φύγαν, ήβραν, ήρταν, βάλουμε
- VERB-Part: καμωμένα, μπαντρεμένα, παντρεμέν’, σπασμένα, στρμωγμένα
- Sing
- ADJ: καλή, καλό, καημένους, Τούρκους, αγιά, μεγάλ’, θκο, κακό, κακός, καλός
- AUX-Fin: ήνταν, είνι, ήταν, είναι, είν’, είμαι, ένι, είμι, είν, είνη
- DET: του, η, το, τ’, μια, αυτό, γη, τουν, γιου, ένα
- INTJ: μουρή, βουρή, μουρ, Βούρ’, Καληνύχτα, Μούρ, μουρέ
- NOUN: μάνα, μέρα, μουρό, σπίτ’, χουριό, ώρα, πράμα, χωριό, άθριπους, χέρ’
- NUM: ένα, μια, μιαν
- PRON: μ’, τ’, του, τουν, μ, μι, που, σ’, τι, ιμ
- PROPN: Ανθή, Μπουτέλ, Σίγρ’, Αντρόνα, Ατζιλικό, Βαρβάρα, Γιάνν’, Γιάνν’ς, Γιώργ’, Γκαλλονή
- SCONJ: τι
- VERB: είχε, έχ’, κάν’, λέει, έλα, κάνου, πω, έπρεπε, έχου, ήρτι
- VERB-Fin: είχε, έχ’, κάν’, λέει, έλα, κάνου, πω, έπρεπε, έχου, ήρτι
- VERB-Part: Ευχαριστημέν’, Παντρεμένος, αβανουκαμένος, αγαπμέν, αγισμένους, γεννμέν’, ιρουτιβμένους, καμωμένο, λαδουμένου, λοιμ’τσιασμένους
- Acc
- ADJ: καλό, μαύρα, αγιά, θκα, κακό, λίγα, μεγάλου, μεγάλ’, ξύλου, φτουχές
- DET: του, τα, τ’, το, τουν, μια, αυτό, ούλα, τη, τν
- INTJ: Καληνύχτα
- NOUN: μέρα, σπίτ’, χρόνια, χουριό, ώρα, χέρ’, πράματα, χωριό, άντρα, λάδ’
- NUM: ένα, δυο, μια, τρία, τρεις, 100, 2, 200, 3, δέκα
- PRON: τα, του, τουν, μι, τι, το, που, σι, μας, μ’
- PROPN: Γκαλλονή, Μουσχουν’ήσ, Μυτιλήν, Μυτιλήν’, Σίγρ’, Χίδερα, Ακλιδιού, Αλέκου, Αμερική, Βαγγέλ’
- SCONJ: τι
- VERB: καμωμένο, κουλουξυρ’σμένους, λαδουμένου, μπαντρεμένα, ξετσλιασμένου, σπασμένα
- VERB-Part: καμωμένο, λαδουμένου, μπαντρεμένα, ξετσλιασμένου, σπασμένα
- Gen
- ADJ: Αγιού, Μικράς, αναγκαίου
- DET: τ’, τς, τ’ς, του, τ, αλλουνού, της, τσ’
- NOUN: σπιτιού, χρονών, ακκλησάς, αντρού, γειτουνιάς, θειά, ιγτουνιάσ’, καβγά, μάνα, μάνας
- PRON: μ’, τ’, μας, μ, ιμ, σ’, ιτ, ντ, τ, τ’ς
- PROPN: Άγρας, Ασίας, Βασ’λειού, Γιάνν’, Γώγου, Θιού, Θιρμής, Ιουλίου, Καλλονής, Κουλουμαρίγιας
- VERB: ασπρουγάνιασις
- Nom
- ADJ: καημένους, καλή, Τούρκους, Καλό, κακός, καλός, μσό, Άγαρμπους, Άν’φτους, Ζουντανοί
- DET: η, του, τα, γη, οι, γιου, το, ι, ένας, ο
- INTJ: μουρή
- NOUN: μάνα, μουρό, άθριπους, ανθρώπ’, γιατρός, κόσμους, πράμα, άντρας, αθρώπ’, γιαγιά
- NUM: δυο, μια
- PRON: που, γω, συ, ‘γού, ‘μείς, ’γώ, ιγώ, πού, π’, εσύ
- PROPN: Μπουτέλ, Ανθή, Αντρόνα, Ατζιλικό, Β’ναριώτις, Γιάνν’ς, Ερσσό, Χατζικουμής, γι-Απουστόλ’ς, 15
- SCONJ: τι
- VERB: Ευχαριστημέν’, Παντρεμένος, αβανουκαμένος, αγισμένους, γεννμέν’, ιρουτιβμένους, καμωμένα, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος
- VERB-Part: Ευχαριστημέν’, Παντρεμένος, αβανουκαμένος, αγισμένους, γεννμέν’, ιρουτιβμένους, καμωμένα, λοιμ’τσιασμένους, μιτσ’μένους, μπαντρεμένος
- Voc
- ADJ: κυρά, Αγιά, Κύριοι, Ρήνιω, απρόκουφτι, αχριγιάννα, κυρ, κ’μπάρι
- INTJ: μουρή, βουρή, μουρ, Βούρ’, Μούρ, μουρά, μουρέ
- NOUN: γιε, μάνα, θρώπ’, μουρέλλ’, άθρουπι, άντρα, αγουρουφά, γναίκα, γρουσούζα, γ’ναίκα
- PROPN: Παναγιούδα, Ρουζαλία, Ανθή, Ατζιλικο, Βαρβάρα, Γιώργ’, Δημητρό, Εύα, Θιέ, Θιμιστουκλή
- VERB-Part: αγαπμέν
- Def
- DET: του, τα, η, τ’, το, γη, οι, τουν, τς, γιου
- Ind
- DET: μια, ένα, ένας, έναν, έν’, καμιά, μνιαν
Degree and Polarity
- Aug
- ADJ: λίγα
- ADV: ταχτέρ, ίσια, γύρου
- NOUN: πουρνό, άνια, μπέλι, μπούτσια, παλιουπουτανάρα, χειρούκλις
- Cmp
- ADV: πιο
- Dim
- ADV: λιγάκ’
- NOUN: κουρούδα, μουρέλλ’, ακκλησιούδα, γαβανέλ, εκκλησέλ, καμαρούδα, καφιδέλ, κουπηλούδια, κουπιλούδια, κουπιλούδις
- PROPN: Μπουτέλ, Ατζιλικό, Παναγιούδα, Ασπασέλ’, Ατζιλικο, Γληγουρέλ’, Κατιρίνη, Μαριγώ, Ν’κουλέλ’, Ξινέλ’
- Neg
- CCONJ: μήδ, μήδι
- INTJ: όχ’, Όχι, Όχ
- PART: δεν, δε, εν, ε, μη, έ, όχ’, μην, έν, μή
- Pos
- INTJ: ναι
Verbal Features
- Imp
- AUX-Fin: ήνταν, ήταν, είνι, είν’, είμαι, είναι, είν, είχε, νταν, ένι
- VERB-Conv: γιλώντας, κλέγουντας, τραγδώντας
- VERB-Fin: είχε, έχ’, λέει, έχουν, έπρεπε, έχου, είχαν, θέλ’, κάν’, λέγ’ς
- Perf
- VERB-Fin: έλα, πω, ήρτι, βάλι, είπι, κάνου, κάτσι, δω, είπε, κάν’
- VERB-Inf: ακούσ’, διαβάσ’, μείν’, πάει, πάρ’, πέρνη, φύγ’
- Imp
- VERB-Fin: έλα, βάλι, κάτσι, πάνι, Σώπα, άγι, πλύνι, στρώσε, Άκου, Έχε
- Ind
- AUX-Fin: ήνταν, είνι, ήταν, είναι, είν’, είμαι, ένι, είμι, είν, είνη
- VERB-Fin: είχε, έχ’, κάν’, λέει, έχουν, κάνου, πάμι, πω, έπρεπε, έχου
- Fut
- AUX: θα, α
- Past
- AUX-Fin: ήνταν, ήταν, είχε, νταν, ένι, ήμν-ταν, νι, ταν
- VERB-Fin: είχε, έπρεπε, ήρτι, είπι, είχαν, έπρεπ’, είπε, είχι, πήγι, έκανε
- Pres
- AUX-Fin: είνι, είναι, είν’, είμαι, είμι, είν, είνη, Έχεις, Έχουν, Έχς
- VERB-Fin: έχ’, λέει, έχουν, έχου, θέλ’, κάν’, λέγ’ς, ξέρ’ς, θέλου, λέγου
- Act
- AUX-Fin: είχε, Έχεις, Έχουν, Έχς, έχουμ’, ‘χω
- VERB-Conv: γιλώντας, κλέγουντας, τραγδώντας
- VERB-Fin: είχε, έχ’, κάν’, λέει, έχουν, κάνου, πάμι, πω, έπρεπε, έχου
- VERB-Inf: ακούσ’, διαβάσ’, μείν’, πάει, πάρ’, πέρνη, φύγ’
- Pass
- VERB-Fin: έλα, ήρτι, κάτσι, ήρτα, ήρταν, γίνται, γίνταν, γίν’, γεννήθκα, θμάσαι
- VERB-Part: Ευχαριστημέν’, Παντρεμένος, αβανουκαμένος, αγαπμέν, αγισμένους, γεννμέν’, ιρουτιβμένους, καμωμένα, καμωμένο, λαδουμένου
Pronouns, Determiners, Quantifiers
- Art
- DET: του, τα, η, τ’, το, γη, μια, οι, τουν, τς
- Dem
- ADV: τόσου
- DET: αυτό, αυτός, φτος, έγιουτα, έφτου, έφτα, αυτή, τούτους, φκοι, Φτη
- Ind
- ADV: πουλύ, που, άλλου, λίγου
- DET: άλλου, πουλλά, κάκ’, κάτ’, άλλους, κανέ, άλλα, κάτ, άλλο, άλλοι
- Int
- ADV: πού, πότι, γιατί, πώς, τίλιγια, τι, Τίλουγια, Τ, Τίλια
- DET: τι, Τί, αλλουνού, πόθα, πόσα, τη
- PRON: τι, τί, ποιος, Ποια, Ποιός, Τις, κι, ποιον, πού
- SCONJ: τι
- Neg
- ADV: πουτέ
- DET: κανείς, καμιά, τίπουτα, κανέναν, κάνα, κίποτα, καμιάν, κανέ, κανένας, καν’είς
- Prs
- PRON: μ’, τ’, τα, του, μας, τουν, μ, μι, σ’, ιμ
- Rel
- ADV: που, όπως, Όσου, π
- DET: ό,τ’, όποιους, Όσις, όποιος, όσα
- PRON: που, π’, πού, πό, π
- SCONJ: που, π’
- Tot
- ADV: ούλου, πάντα
- DET: ούλα, ούλ’, ούλου, ούλ, πάντα, κάθα, κάθι, ουλ’, ούλις, κάθε
- Card
- NUM: δυο, ένα, μια, 100, 1912, 9, τρία, 12, 120, 13
- Ord
- ADJ: πρώτους
- Yes
- PRON: μ’, τ’, μας, μ, ιμ, σ’, ιτ, ντ, ς, τ
- 1
- AUX-Fin: είμαι, είμι, έχουμ’, είμαστε, είμη, ‘χω, ’μαστι
- PRON: μ’, μας, μ, μι, ιμ, γω, ‘γού, ‘μείς, ’γώ, ιγώ
- VERB-Fin: κάνου, πάμι, πω, έχου, δω, θέλου, λέγου, μπουρώ, έχουμι, είδα
- 2
- AUX-Fin: Έχεις, Έχς
- PRON: σ’, σι, σ, συ, ς, σας, σε, εσύ, μ’, ση
- VERB-Fin: έλα, βάλι, κάτσι, λέγ’ς, ξέρ’ς, θες, κάν’ς, λες, ξέρς, πάνι
- 3
- AUX-Fin: ήνταν, είνι, ήταν, είναι, είν’, ένι, είν, είνη, είχε, νταν
- DET: αυτός, φτος, έφτοι, έφτου, αυτοί
- PRON: τ’, τα, του, τουν, το, ιτ, τ, ντ, τς, τ’ς
- VERB-Fin: είχε, έχ’, κάν’, λέει, έχουν, έπρεπε, ήρτι, είπι, είχαν, θέλ’
Other Features
- ExtPos
- ADP
- ADV: Απάνου, ίσια, ανάμισα, ιδώ
- ADV
- ADJ: καλού
- ADP: απ, σ
- ADV: άλλου
- NUM: 100
- PART: μπά, Μπα
- CCONJ
- ADV: ακόμα
- INTJ
- X: Εις
- SCONJ
- ADP: για, Μι
- SCONJ: παρόλο
- ADP
- PunctType
- Brck
- PUNCT: (, )
- Colo
- PUNCT: :
- Comm
- PUNCT: ,
- Dash
- PUNCT: -
- Excl
- PUNCT: !
- Peri
- PUNCT: ., ...
- Qest
- PUNCT: ;
- Quot
- PUNCT: «, »
- Brck
- Typo
- Yes
- ADJ: Ελληνις, Ρήνιω, αχριγιάννα, καταμισ’νος
- ADP: μέσ’, μη
- ADV: κουμάτ, κουμάτ’, πού, άναβλα, πά, πλ-ια, πως
- AUX-Fin: είνη, ήμν-ταν, είμη
- CCONJ: τσί, τσι’
- DET: τσ’, γη, γι, ι, Φτη, έγτσιν, γή, κατ’, πουλι, τα
- INTJ: άγντη
- NOUN: Αφουρμί, ακλσησιά, γ-κόσμου, δλεια, δυουλιά, δ’λιά, ηφτσή, καφαλτή, κουπηλούδια, κουρούδα
- PART: Οχ, ένη
- PRON: ’γώ, τό, ν-τουν, πού, τά, μ, ση, τί, τσ, Γω
- PROPN: 15, Ατζιλικο, Γνάτσ, Θρασίβουλου, Κατιρίνη, Ξυνόφς, Σμυρν’, Φρουσήν, τσιριατσή
- SCONJ: μι, νά
- VERB-Conv: κλέγουντας
- VERB-Fin: έφγει, λόγιαζει, ξερς, πήγει, πιάσει, φαίνητι, φώναζει, Ανέβτσει, Κοίτιτι, έδξει
- VERB-Inf: πέρνη
- VERB-Part: συκλινσμέν
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: είμι.
- This corpus uses 4 lemmas as auxiliaries (aux). Examples: θα, να, έχου, ας.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Nom (161)
- VERB-Fin--NOUN-Nom-ADP(σι) (1)
- VERB-Fin--PRON-Nom (62)
- VERB-Inf--NOUN-Nom (1)
- VERB-Part--NOUN-Nom (2)
- obj
- VERB--PRON-Acc (1)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Acc (255)
- VERB-Fin--NOUN-Nom (9)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (171)
- VERB-Fin--PRON-Gen (1)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--PRON-Acc (2)
- VERB-Part--NOUN-Acc (1)
- iobj
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--PRON-Acc (19)
- VERB-Fin--PRON-Gen (13)
Relations Overview
- This corpus uses 5 relation subtypes: acl:relcl, advcl:relcl, compound:redup, nsubj:pass, obl:agent
- The following 3 relation types are not used in this corpus at all: clf, list, dep