UD Cappadocian TueCL
Language: Cappadocian (code: cpg
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.14 release.
The following people have contributed to making this treebank part of UD: Eleni Vligouridou, Inessa Iliadou, Çağrı Çöltekin.
Repository: UD_Cappadocian-TueCL
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-SA 4.0
Genre: fiction
Questions, comments? General annotation questions (either Cappadocian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [cagri • coeltekin (æt) uni-tuebingen • de]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually |
UPOS | annotated manually, natively in UD style |
XPOS | not available |
Features | annotated manually, natively in UD style |
Relations | annotated manually, natively in UD style |
Description
This is a treebank of Pharasiot, a critically endangered Greek dialect originally spoken near Cappadocia. The source material is fairy tales collected during field study.
References
- (citation)
Acknowledgments
Statistics of UD Cappadocian TueCL
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X
Features
Aspect – Case – Definite – Foreign – Gender – Mood – Number – NumType – Person – Poss – PronType – Tense – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – case – cc – ccomp – conj – cop – dep – det – discourse – dislocated – expl – iobj – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – parataxis – punct – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 350 sentences, 3977 tokens and 4118 syntactic words.
- This corpus contains 723 tokens (18%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 97 types of words that contain both letters and punctuation. Examples: ‘τι, τ’, τζ’, ‘ς, σ', σ’, ν’, ‘σ, Λε’, τζ', ‘α, 'ρνιθίουν, 'σ, ‘νι, ‘χα, 'α, 'ινεί, 'ξειά, 'ρνίθε, 'τ, j', έν’, δόσ’, π’, τ', τζυνή’ι, ό,τι, ‘γω, ‘υριστείς, ’γω, ’ναίκα, ’πομεινά, ’ρκούδι, ’ρφανά, ’υρέπ, 'δεφή, 'ναίκα, 'ρκούδι, 'ρνίθα, 'ρνιθού, 'ρτω, 'υριζούτουν, Έπαρ’, Λέ’, Φρουκάλ’, έμπ’, ήρτ’, αβγάτ’ς, γρεπ', εμέν’
- This corpus contains 141 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 21 types of multi-word tokens. Examples: σο, σα, σον, στο, σου, ση, σις, ντα, σ΄ε, στη, σ’η, Σ'του, Στ', σ'το, σ΄εν, σ΄ώστου, στα, στον, στου, σων, σ’ον.
Morphology
Tags
- This corpus uses 17 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, SYM, VERB, X
- This corpus contains 17 word types tagged as particles (PART): jο, Μην, Ούμα, για, κέσκε, κι, μή, μα, με, μη, σα, τε, τζο, τζό, τζ’, τ’, ώστου
- This corpus contains 56 lemmas tagged as pronouns (PRON): (μέτρο), (πώτ’ς), (το), _, ba, bα, dο, dους, jείνα, Ότι, έγώ, α, αdo, αdο, αβούτσι, ατή, ατό, ατός, αυτό, γω, εγω, εγώ, εκείνο, εκείνος, εσυ, εσύ, η, κάτα, κάτε/κάdε, μέτρο, μεις, μου, μου_, μόνα, ο, πα, πο, ποτς, που, πό, πώτς, σου, τάημισα, τίς, τα, τζείνο, τις, το, του, τούτη, τούτηννα, τούτινα, τούτο, χερκές, ό,τι, ἐγώ
- This corpus contains 28 lemmas tagged as determiners (DET): (όινα), bαşκα, o, ένα, ένας, ή, α, αdο, αν, ατό, ατός, αυτό, αὐτό, ε, εν, η, κάτε/κάdε, ο, οι, τ, τo, τάημισα, τι, το, τό, τ’, ἂβου, ὁ
- Out of the above, 10 lemmas occurred sometimes as PRON and sometimes as DET: α, αdο, ατό, ατός, αυτό, η, κάτε/κάdε, ο, τάημισα, το
- This corpus contains 5 lemmas tagged as auxiliaries (AUX): α, είμαι, να, πρέπει, χα
- Out of the above, 1 lemmas occurred sometimes as AUX and sometimes as VERB: είμαι
- There are 2 (de)verbal forms:
- Fin
- AUX: πρέφτει, Ήτουν
- VERB: είπεν, πήρεν, φα, είπαν, σηκώθην, ήρταν, πηάγανε, ήρτεν, είδεν, ήρτες
- Inf
- VERB: κατέσει, πνίξει
Nominal Features
- Fem
- ADJ: άβου, αρά, γκιορέ, ιράστα
- DET: η, τη, την, α, τα, αν, αμ, οι, τις, Κάτα
- NOUN: στράτα, ημέρα, Μαρκάλτσα, Ντιλπέρτσα, ψυσή, εβή, εβήτζα, εβίτζα, μερέ, ρούχα
- NUM: μία, οφτά, τρία, α, δύο, δώδεκα
- PRON: ατέ, κάτα, τα, τούτη, dα, εμέν’, σου, τούτηννας, τούτινα
- PROPN: Καβάρη, Παναγία
- Masc
- ADJ: άβου, καό, μπρο, παλό, τίπκε, άλεϊ, απμένον, αχιλλούς, κιορ, λειψό
- DET: ο, τον, τα, ον, του, οι, το, αν, dα, ένα
- NOUN: αωπός, ασλάνος, νομάτ, αράπ, αωπό, ταρό, τερζής, τσουφαλάς, φτάλμε, dόστοι
- NUM: αν, έξι, α, πένdε, τέσσερα, τρία
- PRON: του, γω, τουν, Σεις, ατός, μας, μου, αdέ, με, συ
- PROPN: Καβάρη
- Neut
- ADJ: άβου, δομαίνο, ζόρι, πίσι, ’πομεινά, gουμουσόνα, άβο, αλτουνώνα, βυνατό, δρα
- DET: το, τα, ο, α, του, τ΄, τ’, αν, ατό, των
- NOUN: φσάχι, άβγο, λαχτόρι, σοιρίδι, μεντζιλίσι, ποτάμι, ξύο, τζαναβάρα, κορτζόκκο, τσίκκιν
- NUM: τρία, δύο, αν, δεύτερο, εν, α, ε, πρωτινά, πρωτινό, τρίτον
- PRON: του, με, dα, μες, μας, σε, τα, πα, συ, τουν
- PROPN: Γενιτζερίουν, μεντζιλίσι
- Plur
- ADJ: πουά, ’πομεινά, gουμουσόνα, αλτουνώνα, αρά, αχιλλούς, γκιορέ, δρα, νηστικά, παλέ
- AUX-Fin: Ήτουν
- DET: τα, α, οι, τις, ο, των, τ’, ις, dα, Τάημισα
- NOUN: τζαναβάρα, χαϊβάνα, φτάλμε, 'ρνιθίουν, dόστοι, νομάτοι, πουλία, τσουφάλε, άβγα, βρασάλε
- NUM: τρία, δύο, οφτά, πρωτινά, έξι, εννέ, πένdε, τέσσερα
- PRON: μας, μες, τουν, Σεις, μεις, του, τουνε, dα, σας, τάημισα
- VERB-Fin: είπαν, ήρταν, πηάγαν, πηάγανε, Έφαγαν, έπαν, έφτασαν, νάρτουν, ήβρετε, γλιτώσουμε
- Sing
- ADJ: άβου, καό, δομαίνο, ζόρι, ιράστα, λειψό, μπρο, πίσι, παλό, τίπκε
- AUX-Fin: πρέφτει
- DET: το, ο, του, τα, η, αν, α, τον, τη, τ’
- NOUN: φσάχι, άβγο, αωπός, λαχτόρι, στράτα, σοιρίδι, μεντζιλίσι, ποτάμι, ασλάνος, ξύο
- NUM: μία, αν, α, δεύτερο, εν, δύο, ε, πρωτινό, τρίτον, δώδεκα
- PRON: του, με, dα, γω, μου, σε, σου, συ, τουν, τα
- PROPN: Καβάρη, Γενιτζερίουν, Παναγία, μεντζιλίσι
- VERB-Fin: είπεν, πήρεν, φα, ήρτεν, είδεν, σηκώθην, ήρτες, πέττασεν, πήεν, πην
- VERB-Inf: πνίξει
- Acc
- ADJ: άβου, δομαίνο, ιράστα, μπρο, παλό, gουμουσόνα, άβο, αλτουνώνα, απμένον, αρά
- DET: το, τα, ο, α, τον, τ’, αν, τη, η, ον
- NOUN: άβγο, ποτάμι, στράτα, μεντζιλίσι, τσίκκιν, ορμάνι, τσάρι, τσουφάλι, φτάλμε, αράπ
- NUM: τρία, δύο, μία, αν, εν, α, δεύτερο, ε, οφτά, πρωτινό
- PRON: με, dα, μες, σε, τα, μένα, ατέ, πα, μας, π’
- PROPN: Καβάρη, μεντζιλίσι
- Gen
- ADJ: άβου
- DET: του, ου, των, τ’, τ΄ς, τα, τ’ς, ων
- NOUN: χωρού, ρουσού, 'ρνιθίουν, Αράπη, Θεού, κουμασού, τζαναβαρίων, 'ρνιθού, άνεμους, αβγάτη
- PRON: του, τουν, μου, σου, μας, τουνε, dου, σε, μ΄, σας
- PROPN: Καβάρη, Γενιτζερίουν
- Nom
- ADJ: άβου, καό, ’πομεινά, άλεϊ, βυνατό, δρα, ζόρι, λειψό, μέγο, μιτσίκκο
- DET: το, ο, τα, η, οι, αν, τ΄, α, Ατό, ένα
- NOUN: φσάχι, αωπός, ασλάνος, λαχτόρι, σοιρίδι, κορτζόκκο, τζαναβάρα, κετσίμι, νομάτ, ημέρα
- NUM: αν, α, μία, τρία, τρίτον, έξι, δεύτερο, δύο, λια, πένdε
- PRON: γω, συ, Σεις, μεις, ατός, μέτρο, αdέ, κάτα, μόνα, τίς
- Voc
- ADJ: πίσι, ραδέ
- DET: Ω, η, τα
- NOUN: dόστοι, λαχτόρι, ντόστη, φσάχι, γιο, κλέφτη, νημά, νομάτη, παλικάρι
- PRON: μου
- PROPN: Παναγία
- Def
- DET: το, ο, τα, του, η, α, τον, τ’, την, οι
- Ind
- DET: α, ένα, αν, αμ, άβο, εν, όινα
Degree and Polarity
Verbal Features
- Imp
- AUX-Fin: Ήτουν
- VERB-Fin: Λε’, ίνεσαι, φταίνουν, 'ξειά, ΄υρέφ, έχω, ζήσεις, θωρεί, λέτε, ποίκα
- Perf
- AUX-Fin: πρέφτει
- VERB-Fin: είπεν, πήρεν, φα, είπαν, σηκώθην, ήρταν, πηάγανε, ήρτεν, ήρτες, είδεν
- VERB-Inf: κατέσει, πνίξει
- Imp
- VERB-Fin: άφτσε, είπεν, Αμέτε, Πέ, Χύτα, δος, είμαι, θέκ, θέκω, κούω
- Ind
- AUX-Fin: πρέφτει, Ήτουν
- VERB-Fin: είπεν, πήρεν, είπαν, φα, σηκώθην, ήρταν, πηάγανε, ήρτεν, ήρτες, είδεν
- VERB-Inf: πνίξει
- Past
- AUX-Fin: πρέφτει
- VERB-Fin: είπεν, πήρεν, είπαν, σηκώθην, πηάγανε, φα, ήρτεν, ήρταν, ήρτες, είδεν
- VERB-Inf: πνίξει
- Pres
- AUX-Fin: Ήτουν
- VERB-Fin: Λε’, πην, ίνεσαι, φα, φταίνουν, 'ινεί, 'ξειά, ΄υρέφ, Έπαρ, Ήρταν
- Act
- AUX-Fin: πρέφτει, Ήτουν
- VERB-Fin: είπεν, πήρεν, φα, είπαν, πηάγανε, ήρτεν, είδεν, ήρτες, πέττασεν, πήεν
- VERB-Inf: κατέσει, πνίξει
- Pass
- VERB-Fin: σηκώθην, ήρταν, νάρτουν, σηκώθη, Ήρτανε, Σωρεύτανε, ίνεσαι, ενόσανdαι, Qαπαdίστη, Κανίστη
Pronouns, Determiners, Quantifiers
- Art
- DET: το, ο, τα, του, α, η, τ’, τον, τ΄, τη
- PRON: τουν, dα, τα, dου, Τούς, μόνα
- Dem
- DET: ατό, Ατέ, αdέ
- PRON: του, ατέ, αdέ, τουν, dου, Αdό, ατό, ατός, τίς, τζείνο
- Ind
- DET: α, αν, Κάτα, Τάημισα, ε, εν, πασκά
- PRON: πα, τάημισα, χέρκες, Ότις, ποτς, χερκές
- Int
- PRON: π’, πο, τίς
- Prs
- PRON: με, dα, γω, του, σου, μας, μου, σε, συ, μες
- Rel
- PRON: Ό,τι
- Card
- NUM: τρία, δύο, έξι, α, ε, εννέ, πένdε, τέσσερα, ‘τζα
- Ord
- ADJ: μπρο, πώτο
- Yes
- PRON: μας, σου, του, μου, τουν, μέτρο, τουνε, σας, dουν, Μεις
- 1
- PRON: μες, μας, γω, μεις, με, μου, ’γω
- VERB-Fin: γλιτώσουμε, ποίκω, υπάμε, έχω, νάρτω, πάρω, ποίκα, ποίκουμε, 'ρτω, dανισεφτούμε
- 2
- PRON: Σεις, μας, σας, σου, συ
- VERB-Fin: ήρτες, ήβρετε, ΄υρέφ, Έπαρ, άφτσε, γαλιτζέψεις, γρεπ, δος, δόσ’, ειπείς
- 3
- AUX-Fin: πρέφτει, Ήτουν
- PRON: dα, του, αdέ, τα, Αdό, τουν, τουνε, jείνοι, Αdε, μου
- VERB-Fin: είπεν, πήρεν, είπαν, φα, σηκώθην, ήρταν, πηάγανε, ήρτεν, είδεν, πέττασεν
- VERB-Inf: πνίξει
Other Features
- Foreign
- Yes
- NOUN: τοκτόρ
- X: Dερβίσης, dουλgέρ, Χαΐρ, Dερβίς, dουλgâρ, Αλλάχ, Χίdα, χοjά
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: είμαι.
- This corpus uses 4 lemmas as auxiliaries (aux). Examples: να, α, χα, πρέπει.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN-Acc (10)
- VERB-Fin--NOUN-Gen (1)
- VERB-Fin--NOUN-Nom (131)
- VERB-Fin--PRON-Nom (50)
- obj
- VERB-Fin--NOUN (2)
- VERB-Fin--NOUN-Acc (120)
- VERB-Fin--NOUN-Acc-ADP(σε) (2)
- VERB-Fin--NOUN-Nom (4)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (60)
- VERB-Fin--PRON-Nom (2)
- VERB-Inf--NOUN-Acc (1)
- VERB-Inf--PRON-Acc (1)
- iobj
- VERB-Fin--NOUN-Acc (3)
- VERB-Fin--NOUN-Acc-ADP(σε) (5)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (23)
- VERB-Fin--PRON-Gen (5)