UD German LIT
Language: German (code: de
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.4 release.
The following people have contributed to making this treebank part of UD: Alessio Salomoni.
Repository: UD_German-LIT
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY-NC-SA 4.0
Genre: nonfiction
Questions, comments? General annotation questions (either German-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [alessio • salomoni (æt) unibg • it]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | assigned by a program, with some manual corrections, but not a full manual verification |
UPOS | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
XPOS | assigned by a program, with some manual corrections, but not a full manual verification |
Features | not available |
Relations | annotated manually, natively in UD style |
Description
This treebank aims at gathering texts of the German literary history. Currently, it hosts Fragments of the early Romanticism, i.e. aphorism-like texts mainly dealing with philosophical issues concerning art, beauty and related topics.
In a long-term perspective, this treebank aims at gathering texts from different genres and different authors of the German literary history. Currently, it exclusively hosts Fragments of the early Romanticism (end of the 18th century, modern German), i.e. really short texts, often in aphorism-like form, that deal with philosophical issues in a witty and cryptic way. They mainly deal with aesthetics, i.e. philosophy concerning art and beauty. This treebank is mainly intended for corpus-based stylistic analysis that can benefit from the dependency relations as well as from all the other levels of annotation (currently LEMMA and both UPOs and XPOS).
The version 2.5 hosts the following texts (each text is followed by the reference to the original edition from which it was digitized, as well as by the permalink to the online source of the digital raw text):
-
Friedrich Schlegel, Kritische Fragmente [Lyceum-Fragmente]. Source: Kritische Friedrich-Schlegel-Ausgabe. Erste Abteilung: Kritische Neuausgabe, Band 2, München, Paderborn, Wien, Zürich 1967, S. 147-164. Erstdruck in: Lyceum der schönen Künste (Berlin), 1. Bd., 2. Teil, 1797. Permalink: http://www.zeno.org/nid/20005618886
-
Friedrich Schelgel, Athenäums-Fragmente [fragments from 1 to 421]. Source: Kritische Friedrich-Schlegel-Ausgabe. Erste Abteilung: Kritische Neuausgabe, Band 2, München, Paderborn, Wien, Zürich 1967, S. 165-256. Erstdruck in: Athenäum (Berlin), 1. Bd., 2. Stück, 1798. Permalink: http://www.zeno.org/nid/20005618908
-
Novalis, Blüthenstaub. Source: Novalis: Schriften. Die Werke Friedrich von Hardenbergs. Band 2, Stuttgart 1960–1977, S. 413-464. Entstanden 1797/98. Erstdruck in: Athenäum (Berlin), 1. Bd., 1. Stück, 1798. Vier Fragmente stammen von Friedrich Schlegel. Permalink: http://www.zeno.org/nid/20005446929
Each sentence in the treebank is preceded by some comments introduced by ‘#’, through which the following information is respectively encoded:
- Genre
- Author
- Work
-
Number of the fragment. It is based upon the classification adopted in the source raw text. Each time a new fragemnt begins, it is preceded by the comment ‘newpar id = [name]’, and the number of the fragment is incorporated into the ‘sent_id’ field as well, followed by the numer of the sentence in that fragment. Moreover, each time a new collection of fragment, i.e. work, begins, it is preceded by the comment ‘# newdoc id = [name]’. For instance:
- ’# newdoc id = bluethenstaub’
- ’# newpar id = bluethenstaub-f1’
- ’# author = Novalis’
- ’# work = Blüthenstaub’
- ’# sent_id = bluethenstaub-f1-s1’
In this case, the sentence following the set of comments would be the first sentence of the first fragment of the collection “Blüthenstaub” written by Novalis. We made this choice about such a use of comments because we want to preserve the parallelism between the treebanked data and the source texts as much as possible. In this perpsetive, this treebank aims to be the linguistically annotated counterpart of the orgiginal texts, thus preserving those categories that we are traditionally acquainted to adopt in order to work on literary texts.
Acknowledgments
Many thanks to Daniel Zeman, who has promptly solved some fundamental problems concerning the data format, and showed great interest for this project right from the beginning. …
Statistics of UD German LIT
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Abbr – Case – Definite – Degree – Foreign – Gender – Gender[psor] – Mood – Number – Number[psor] – NumType – Person – Poss – PronType – Reflex – Tense – VerbForm
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – aux:pass – case – cc – ccomp – compound – compound:prt – conj – cop – csubj – dep – det – det:poss – dislocated – expl – fixed – flat – mark – nmod – nmod:poss – nsubj – nsubj:outer – nsubj:pass – nummod – obj – obl – obl:agent – obl:arg – orphan – parataxis – punct – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 1920 sentences, 40340 tokens and 40450 syntactic words.
- This corpus contains 5432 tokens (13%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 39 types of words that contain both letters and punctuation. Examples: 's, z.B., Hemsterhuys', d.h., u.s.w., 'n, (gleich, Fr., Friedrichsd'or, Früh-, Gattung), Heydenreich,Jacob, Jahrs-, Nicht-Ich, Normal-Seelen, Rechts-, Rubens', S., Scheidungs-, Theorien-Eierstock, W., Z.B., annehme;, bleibt's, d'epigramme, erhebe:so, geheimni?, ist's, jusqu', jusqu'au, können.In, l'essence, niet-, tief-, weg;, »Louise, »Meister, »Nathan, »Wem
- This corpus contains 110 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 9 types of multi-word tokens. Examples: im, zur, zum, am, vom, ins, ers, mans, mirs.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, NOUN, NUM, PART, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: INTJ, SYM
- This corpus contains 4 word types tagged as particles (PART): 's, am, nicht, zu
- This corpus contains 23 lemmas tagged as pronouns (PRON): cela, che, der, du, einander, er, es, etwas, himself, ich, irgendetwas, jedermann, jemand, man, nichts, niemand, nous, sich, sie, this, was, wer, wir
- This corpus contains 31 lemmas tagged as determiners (DET): alle, allerlei, anderer, beide, dein, der, derjenige, derselbe, dieser, ein, einige, ihr, il, irgendein, jeder, jener, kein, le, mancher, mancherlei, mehr, mein, meist, sein, solcher, the, unser, viel, welcher, wenig, wieviel
- Out of the above, 1 lemmas occurred sometimes as PRON and sometimes as DET: der
- This corpus contains 12 lemmas tagged as auxiliaries (AUX): be, dürfen, essere, haben, können, mögen, müssen, sein, sollen, werden, wollen, être
- Out of the above, 8 lemmas occurred sometimes as AUX and sometimes as VERB: dürfen, haben, können, mögen, sein, sollen, werden, wollen
- There are 3 (de)verbal forms:
- Fin
- AUX: ist, era, is, sei, sommes
- VERB: peut, Ehre, erfolge, fait, leben, strömt, wohlgehe
- Inf
- VERB: aller, rester
- Part
- ADJ: gebildeten
- AUX: gewesen
- VERB: zurechtgewiesen
Nominal Features
- Fem
- ADJ: ganze, römische, Letztere, angemessenste, edle, elektrische, erhaltenden, gebildeten, gemeine, gesamte
- ADJ-Part: gebildeten
- DET: die, der, la, eine, jede
- NOUN: poesie, Größe, Kunst, Altertümlichkeit, Arroganz, Charakteristik, Eigenschaften, Eigentümlichkeit, Einfalt, Erden
- PRON: sie, die
- Masc
- ADJ: brillant, feiner, grober, historischen, letzten, menacés, merkwürdigen, primi, secondo
- DET: des, der, le, Einen, dem, den, ein, i, ihren, il
- NOUN: Momente, Abgottes, Alten, Anfangsgründe, Ausdrucks, Autor, Essai, Freimaurer, Gedankens, Kitzel
- PRON: er, ihm, ihn, der, himself
- PROPN: Dantes, Diderots, Leibniz, Lessing, Plato, Römern
- Neut
- ADJ: Rembrandtschen, gebildeten, letzte, prophetisches
- ADJ-Part: gebildeten
- DET: das, Einiges, alles, des, ein, ihr, seinem, welches
- NOUN: Glück, Leben, Gedicht, Helldunkel, Kinder, Mittelglied, Phänomene, Resultat, Stück, Verdienst
- PRON: es, was, nichts, etwas, s, 's, irgendetwas, das
- Plur
- ADJ: erhaltenden, größten, literarischen, menacés, mißlichsten, politischen, primi, wesentlichen, wiederkehrenden
- AUX-Fin: sommes
- DET: den, die, der, alle, allen, diese, i, mancher, meisten
- NOUN: Momente, Alten, Anfangsgründe, Eigenschaften, Freimaurer, Kinder, Leuten, Mengs, Pantomimen, Philosophen
- PRON: wir, uns, ihnen, denen, sie, die, den, nous
- PROPN: Römern
- VERB-Fin: leben
- Sing
- ADJ: ganze, gebildeten, römische, Letztere, Rembrandtschen, angemessenste, brillant, edle, elektrische, feiner
- ADJ-Part: gebildeten
- AUX-Fin: ist, is, sei
- DET: jeder, jedem, jedes, jede, die, der, jeden, la, des, das
- NOUN: poesie, Glück, Größe, Kunst, Leben, Abgottes, Altertümlichkeit, Arroganz, Ausdrucks, Autor
- PRON: es, man, er, was, nichts, etwas, ich, ihm, ihn, wer
- PROPN: Dantes, Diderots, Leibniz, Lessing, Plato
- VERB-Fin: Ehre, erfolge, fait, strömt, wohlgehe
- Acc
- ADJ: alt, befremdlich, bewußt, chimärisch, einseitig, ethischen, ganze, größere, höchsten, klassisch
- DET: alles, die, welche, dies, diese, andre, einen, alle, beides, den
- NOUN: Sinn, Geist, Philosophie, Menschen, Witz, Poesie, Kraft, Welt, Leben, Kunst
- NUM: eins
- PRON: sich, es, was, ihn, sie, nichts, die, mich, den, uns
- PROPN: Fakta, Kant, Denkmal, Friedrichsd'or, Herrmann, Jean, Schellings, Schweiz, Sinn, Wilhelm
- Dat
- ADJ: letzten, neuem, Flüchtigen, Geschichtschreiber, Männer, allgemein, allgemeinen, alt, andichten, besten
- ADJ-Part: gebildeten
- ADP: Uns, »Wem
- DET: dem, der, ihr, den, einem, allem, allen, beiden, dieser, jenem
- NOUN: Sinn, Geist, Philosophie, Art, Mangel, Menschen, Natur, Zeit, Form, Gedanken
- NUM: dreyen
- PRON: ihm, sich, ihnen, uns, dem, denen, mir, der, dir, jemanden
- PROPN: Leibniz, Plato, Aristoteles, Belieben, Bewußtseyn, Candide, Carracci, Chamforts, Denkart, Goethen
- Gen
- ADJ: epischen, jambischen, lieblicher, lyrischen, selbstgeträumten, unschuldiger, gebildeten, griechischen, historischen, literarischen
- ADJ-Part: gebildeten
- DET: der, des, ihres, mancher, meisten
- NOUN: Geistes, Dichters, Menschen, Altertums, Ganzen, Genies, Zeitalters, Individuums, Lebens, Witzes
- PRON: deren, dessen, derer
- PROPN: Laokoon, Cicero, Condorcet, Klosterbruders, Lovell, Siebenkäs, Sophokles, Thomasius, Dantes, Diderots
- Nom
- ADJ: letzte, erste, mimische, Gefühle, Gewisse, Groß, Kant, Neu, abgeleiteten, aktiven
- DET: welche, alles, welches, die, diese, dies, jeder, andre, einer, welcher
- NOUN: Mensch, Philosophie, Geist, Poesie, Witz, Natur, Menschen, Kunst, Künstler, Sinn
- NUM: eins
- PRON: man, sie, er, es, die, der, was, das, wir, ich
- PROPN: Leibniz, Kant, Diderot, Jacobi, Caesar, Christus, Cicero, Dante, Hemsterhuys, Hippel
- Def
- DET: der, die, das, den, des, dem, la, le, the
- Ind
- DET: ein, eine, einer, einen, einem, eines, eins, 'n
Degree and Polarity
- Cmp
- ADJ: Letztere
- ADV: w
- DET: mehr, mehre
- Pos
- ADJ: eignen, einzige, erste, ersten, einzelne, eigne, eigner, einzigen, eignes, einzelnen
- ADJ-Part: gebildeten
- Sup
- ADJ: angemessenste, greatest, größten, merkwürdigste, mißlichsten
- DET: meisten, meiste
Verbal Features
- Imp
- VERB-Fin: Ehre
- Ind
- AUX-Fin: ist, era, is, sommes
- VERB-Fin: fait, strömt
- Sub
- AUX-Fin: sei
- VERB-Fin: erfolge, leben, wohlgehe
- Past
- AUX-Fin: era
- Pres
- AUX-Fin: ist, is, sei, sommes
- VERB-Fin: erfolge, fait, leben, strömt, wohlgehe
Pronouns, Determiners, Quantifiers
- Art
- DET: der, die, ein, das, den, eine, des, dem, einer, einen
- Dem
- ADV: daher, darin, darum, dadurch, dazu, davon, darauf, daraus, dagegen, damit
- DET: diese, dieser, dieses, dies, diesem, solche, jener, jene, diesen, derselben
- PRON: cela, This
- Dem,Rel
- PRON: die, der, das, dem, den, deren, denen, dessen, derer
- Ind
- ADV: genug, etwas, bißchen
- DET: andre, viele, andern, viel, einige, manche, mancher, meisten, mehr, vielen
- PRON: man, etwas, jemand, irgendetwas, jemanden, mans
- Int
- ADV: wodurch, worin, wozu, worauf, wobei, womit, wonach, woraus, wovon
- DET: Wieviel
- Int,Rel
- DET: welche, welches, welcher, welchem, welchen
- PRON: was, wer, wem
- Neg
- ADV: nie
- DET: keine, kein, keinen, keiner, keins, keinem, keines
- PRON: nichts, niemand, niemanden
- Prs
- DET: ihre, seine, ihr, seiner, ihrer, sein, ihren, seinem, seinen, seines
- PRON: es, sich, sie, er, wir, uns, ich, ihm, ihn, ihnen
- Rcp
- PRON: einander
- Rel
- PRON: che
- Tot
- DET: alle, alles, aller, allen, jeder, jedem, jedes, jede, beiden, allem
- PRON: jedermann
- Card
- DET: ein, eine, einer, einen, einem, eines, beiden, beide, beyde, beides
- NUM: eins, dreyen
- Ord
- ADJ: erste, ersten, erstes, erster
- Yes
- DET: ihre, seine, ihr, seiner, ihrer, sein, ihren, seinem, seinen, seines
- Yes
- PRON: sich, mir, himself
- 1
- AUX-Fin: sommes
- DET: unsere, unsern, unsers, unser, meine, unsrer, mein, meinem, meinen, meiner
- PRON: wir, uns, ich, mich, mir, nous
- 2
- DET: deine, deiner
- PRON: du, dich, dir
- VERB-Fin: Ehre
- 3
- AUX-Fin: ist, is, sei
- DET: ihre, seine, ihr, seiner, ihrer, sein, ihren, seinem, seinen, seines
- PRON: es, sich, sie, er, ihm, ihn, ihnen, s, 's, himself
- VERB-Fin: erfolge, fait, leben, strömt, wohlgehe
- Fem
- DET: ihren
- Masc
- DET: seinem
- Masc,Neut
- DET: seine, seiner, sein, seinem, seinen, seines
- Plur
- DET: unsere, unsern, unsers, unser, unsrer, ihr, unserer, unserm, unsre
- Sing
- DET: seine, seiner, sein, seinem, seinen, seines, meine, mein, deine, deiner
Other Features
- Abbr
- Yes
- ADV: s, w
- CCONJ: u
- Yes
- Foreign
- Yes
- ADJ: grand, brillant, greatest, menacés, primi, secondo
- ADP: de, à, except, fra, in, jusqu', jusqu'au, sur
- ADV: pourtant, toujours
- AUX-Fin: era, is, sommes
- CCONJ: et
- DET: la, le, the, i, il
- NOUN: sentiment, Essai, elephant, gêne, hauteur, l'essence, merite, peinture, philosophie, poesie
- PRON: cela, This, che, himself, nous
- PROPN: François
- PUNCT: ,
- SCONJ: que
- VERB-Fin: peut, fait
- VERB-Inf: aller, rester
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 3 lemmas as copulas (cop). Examples: sein, be, essere.
- This corpus uses 10 lemmas as auxiliaries (aux). Examples: können, müssen, sollen, haben, sein, werden, wollen, dürfen, mögen, être.
- This corpus uses 2 lemmas as passive auxiliaries (aux:pass). Examples: werden, sein.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN-Acc-ADP(für) (2)
- VERB--NOUN-Nom (721)
- VERB--NOUN-Nom-ADP(als) (1)
- VERB--NOUN-Nom-ADP(jenseits) (1)
- VERB--NOUN-Nom-ADP(unter) (1)
- VERB--NOUN-Nom-ADP(–) (1)
- VERB--PRON (7)
- VERB--PRON-Acc (1)
- VERB--PRON-Dat (1)
- VERB--PRON-Nom (1038)
- VERB-Fin--NOUN (1)
- VERB-Fin--PRON (2)
- VERB-Fin--PRON-Nom (2)
- obj
- VERB--NOUN (1)
- VERB--NOUN-Acc (766)
- VERB--NOUN-Acc-ADP(als) (1)
- VERB--NOUN-Acc-ADP(an) (1)
- VERB--NOUN-Acc-ADP(auf) (2)
- VERB--NOUN-Acc-ADP(bey) (1)
- VERB--NOUN-Acc-ADP(durch) (1)
- VERB--NOUN-Acc-ADP(für) (1)
- VERB--NOUN-Acc-ADP(mit) (1)
- VERB--NOUN-Acc-ADP(nach) (1)
- VERB--NOUN-Acc-ADP(um) (1)
- VERB--NOUN-Acc-ADP(wie) (1)
- VERB--NOUN-Acc-ADP(zu) (4)
- VERB--NOUN-Gen (1)
- VERB--PRON (24)
- VERB--PRON-Acc (512)
- VERB--PRON-Acc-ADP(in) (1)
- VERB--PRON-Acc-ADP(mit) (1)
- VERB--PRON-Dat (3)
- VERB--PRON-Nom (1)
- VERB-Fin--NOUN (1)
- VERB-Fin--NOUN-Acc (2)
Verbs with Reflexive Core Objects
- This corpus contains 132 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: lassen sich, finden sich, bilden sich, erheben sich, verhalten sich, verstehen sich, setzen sich, äußern sich, annihilieren sich, befinden sich, berühren sich, bewegen sich, bewußt sich, durchdringen sich, nähern sich, regen sich, stellen sich, verlieren sich, affizieren sich, ausdrücken sich, beschränken sich, beziehen sich, denken sich, entwickeln sich, ergötzen sich, erinnern sich, halten sich, machen sich, organisieren sich, scheinen sich, sehen sich, verfeinern sich, verstehn sich, widersprechen sich, wundern sich, zeigen sich, zersetzen sich, abfinden sich, akkomodieren sich, anlächeln sich, anschauen sich, anschaun sich, aufheben sich, ausreden sich, bedienen sich, behelfen sich, beklagen sich, bemächtigen sich, bemühen sich, bereichern sich
- Out of those, 9 lemmas occurred more than once, but never without a reflexive dependent. Examples: verhalten, befinden, regen, affizieren, ergötzen, verfeinern, widersprechen, wundern, zersetzen
Relations Overview
- This corpus uses 9 relation subtypes: acl:relcl, aux:pass, compound:prt, det:poss, nmod:poss, nsubj:outer, nsubj:pass, obl:agent, obl:arg
- The following 7 relation types are not used in this corpus at all: iobj, vocative, discourse, clf, list, goeswith, reparandum