home edit page issue tracker

This page pertains to UD version 2.

It appears that you have Javascript disabled. Please consider enabling Javascript for this page to see the visualizations.

UD Swedish Talbanken

Language: Swedish (code: sv)
Family: IE

This treebank has been part of Universal Dependencies since the UD v1.0 release.

The following people have contributed to making this treebank part of UD: Joakim Nivre, Aaron Smith, Victor Norrman.

Repository: UD_Swedish-Talbanken
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.18

License: CC BY-SA 4.0

Genre: news, nonfiction

Questions, comments? General annotation questions (either Swedish-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [joakim • nivre (æt) lingfil • uu • se]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.

Annotation	Source
Lemmas	assigned by a program, with some manual corrections, but not a full manual verification
UPOS	annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion
XPOS	annotated manually
Features	annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion
Relations	annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion

Description

The Swedish-Talbanken treebank is based on Talbanken, a treebank developed at Lund University in the 1970s.

The Swedish-Talbanken treebank is a conversion of the Prose section of Talbanken (Einarsson, 1976), originally annotated by a team led by Ulf Teleman at Lund University according to the MAMBA annotation scheme (Teleman, 1974). It consists of roughly 6,000 sentences and 95,000 tokens taken from a variety of informative text genres, including textbooks, information brochures, and newspaper articles. The syntactic annotation is converted directly from the original MAMBA annotation, while the morphological annotation is based on the reannotation performed when incorporating Talbanken into the Swedish Treebank (Nivre and Megyesi, 2007). Tokenization mostly follows the standard of the Stockholm-Umeå Corpus, Version 2.0 (2006), and lemmatization is based on Saldo (Borin et al., 2008), with some revisions to harmonize with other Swedish treebanks.

Acknowledgments

The new conversion has been performed by Joakim Nivre and Aaron Smith at Uppsala University. A semi-automatic correction of features and lemmas was done by Victor Norrman and Joakim Nivre. Recent harmonization efforts were carried out in collaboration with Lars Ahrenberg, Aleksandrs Berdicevskis, and Adriana Masciolini. Recent work to improve the annotation has benefited greatly from discussions within UniDive (COST Action CA21167).

We thank everyone who has been involved in previous conversion efforts at Växjö University and Uppsala University, including Bengt Dahlqvist, Sofia Gustafson-Capkova, Johan Hall, Anna Sågvall Hein, Beáta Megyesi, Jens Nilsson, and Filip Salomonsson. Special thanks also to Lars Borin and Markus Forsberg at Språkbanken for help with the lemmatization. Finally, we owe a huge debt to the team who produced the original treebank in the 1970s.

Annotations for constructions according to the UCxn framework were added by Joakim Nivre and Victor Norrman.

Annotations for multiword expressions according to the PARSEME framework were added by Sara Stymne, based on manual annotations by Astrid Berntsson Ingelstam, Sara Stymne, Eva Petterson, Stella Lundqvist, and Ida Nilsson.

References

Lars Borin, Markus Forsberg, Lennart Lönngren. 2008. Saldo 1.0 (Svenskt associationslexikon version 2). Språkbanken, Göteborg universitet.
Einarsson, Jan. 1976. Talbankens skriftspråkskonkordans. Lund University: Department of Scandinavian Languages.
Joakim Nivre and Beáta Megyesi. 2007. Bootstrapping a Swedish treeebank using cross-corpus harmonization and annotation projection. In Proceedings of the 6th International Workshop on Treebanks and Linguistic Theories, pages 97-102.
Teleman, Ulf. 1974. Manual för grammatisk beskrivning av talad och skriven svenska. Studentlitteratur.
The Stockholm Umeå Corpus. Version 2.0. 2006. Stockholm University: Department of Linguistics.

Statistics of UD Swedish Talbanken

POS Tags

ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PART – PRON – PROPN – PUNCT – SCONJ – SYM – VERB – X

Features

Abbr – Case – Definite – Degree – ExtPos – Foreign – Gender – Mood – Number – NumType – Polarity – Poss – PronType – Tense – Typo – VerbForm – Voice

Relations

acl – acl:cleft – acl:relcl – advcl – advcl:relcl – advmod – amod – appos – aux – aux:pass – case – cc – ccomp – compound – compound:prt – conj – cop – csubj – csubj:outer – csubj:pass – dep – det – discourse – dislocated – expl – fixed – flat – flat:name – goeswith – iobj – list – mark – nmod – nmod:poss – nsubj – nsubj:outer – nsubj:pass – nummod – obj – obl – obl:agent – orphan – parataxis – punct – root – vocative – xcomp

Tokenization and Word Segmentation

This corpus contains 6038 sentences and 96820 tokens.

This corpus contains 9733 tokens (10%) that are not followed by a space.

This corpus contains 12 types of words with spaces. Examples: t ex, s k, bl a, t o m, o s v, d v s, fr o m, m m, f n, e d, m fl, t v

This corpus contains 365 types of words that contain both letters and punctuation. Examples: t.ex., bl.a., u-länderna, s., EEC:s, kap., s.k., u-länder, 60-talet, kl., EEC-länderna, dvs., 1800-talet, yrkes-, 1960-talet, 70-talet, FN:s, RFSU-laboratoriet, a., doc., m.fl., resp., sid., t.o.m., u-ländernas, 1800-talets, 1900-talet, KF:s, barn-, ett-, i-länderna, m.m., manisk-depressiva, u-land, 15-årsperioden, 1960-talets, B-inkomster, I., Ollo-Food, Per-Ola, RFSU-laboratoriets, a), b), fack-, far-, fig., hem-, i-länder, kibbutz-, kommun-

Morphology

Nominal Features

Gender

Com
- ADJ: stor, annan, själv, sådan, viss, egen, ny, hög, kristen, social
- ADJ-Part: särskild, ökad, beredd, angiven, född, genomförd, reglerad, taxerad, avsedd, begränsad
- DET: en, den, denna, någon, ingen, vilken, var, all, varannan, nån
- NOUN: del, procent, människor, tid, familjen, kvinnor, man, dag, miljoner, fråga
- NUM: en
- PRON: man, vi, den, du, sin, han, jag, oss, hon, en
- VERB: vald, vänd, hörselskadad, accepterad, förstärkt, förändrad, ifylld, komplicerad, likställd, lämnad
- VERB-Part: vald, vänd, accepterad, förstärkt, förändrad, komplicerad, likställd, lämnad, omsatt, tvättad

Fem
- NOUN: nuptiam

Masc
- NOUN: consensus

Neut
- ADJ: annat, svårt, nytt, möjligt, sådant, viktigt, eget, socialt, stort, övrigt
- ADJ-Part: sett, taget, särskilt, sagt, ökat, förbjudet, fött, räknat, valt, angivet
- DET: ett, det, detta, något, allt, inget, vilket, vart, vartannat
- NOUN: år, barn, äktenskapet, barnen, sätt, samhället, arbete, fall, äktenskap, barnet
- NUM: ett
- PRON: det, detta, sitt, något, vad, vårt, allt, vilket, annat, ditt
- VERB: förbjudet, opåverkat, reglerat, sysselsatt, tillgodosett, upplagt
- VERB-Part: förbjudet, reglerat, sysselsatt, tillgodosett

Number

Plur
- ADJ: olika, andra, vissa, stora, flera, nya, sådana, små, fler, psykiska
- ADJ-Part: särskilda, handikappade, gifta, bestämda, skilda, ökade, avsedda, höjda, kända, upptagna
- DET: de, alla, dessa, några, vilka, båda, inga, bägge, dom, Somliga
- NOUN: barn, år, barnen, procent, människor, kvinnor, miljoner, kronor, fall, länder
- PRON: de, vi, dem, sina, oss, våra, andra, många, varandra, alla
- VERB: påverkade, tvungna, anpassade, bedövade, diciplinerade, emanciperade, fjärrundersökta, frusterade, färdigräknade, fördelade
- VERB-Part: påverkade, tvungna, anpassade, bedövade, diciplinerade, emanciperade, frusterade, fördelade, insatta, instruerade

Sing
- ADJ: stor, annan, själv, sådan, viss, egen, annat, ny, svårt, hög
- ADJ-Part: särskild, ökad, sett, taget, beredd, särskilt, fortsatt, gift, bosatt, sagt
- DET: en, den, ett, det, denna, varje, någon, detta, ingen, något
- NOUN: del, äktenskapet, år, tid, samhället, familjen, arbete, barn, sätt, äktenskap
- NUM: en, ett
- PRON: det, man, den, du, sin, detta, vad, han, jag, sitt
- PROPN: York
- VERB: vald, vänd, hörselskadad, accepterad, förbjudet, förstärkt, förändrad, ifylld, komplicerad, likställd
- VERB-Part: vald, vänd, accepterad, förbjudet, förstärkt, förändrad, komplicerad, likställd, lämnad, omsatt

Case

Acc
- NOUN: nuptiam
- PRON: sig, dem, oss, dig, varandra, mig, henne, honom, sej, varann

Gen
- ADJ: anställdas, enskildes, försäkrades, äldres, andres, avlidnes, dubbelarbetandes, efterkommandes, enskilds, frånskildas
- ADJ-Part: anställdas, försäkrades, avlidnes, dubbelarbetandes, efterkommandes, frånskildas, sammanboendes, studerandes
- NOUN: äktenskapets, kvinnans, världens, barnens, familjens, års, dagens, samhällets, jordens, slags
- PROPN: Sveriges, EEC:s, Guds, Stockholms, FN:s, Kristi, KF:s, Parsons, Europas, Jesu

Nom
- ADJ: olika, andra, nya, många, stora, stor, samma, större, vissa, första
- ADJ-Part: följande, beroende, särskild, särskilda, ökad, motsvarande, liknande, ökade, gifta, nuvarande
- NOUN: år, barn, del, äktenskapet, procent, barnen, människor, tid, sätt, samhället
- NUM: två, tre, en, 1, 20, 2, ett, 1970, 3, 10
- PRON: man, de, vi, du, han, jag, hon, ni, bägge, en
- PROPN: Sverige, EEC, Stockholm, USA, ATP, Gud, Göteborg, Horn, Danmark, Indien
- VERB: påverkade, vald, vänd, hörselskadad, tvungna, accepterad, anpassade, bedövade, diciplinerade, emanciperade
- VERB-Part: påverkade, vald, vänd, tvungna, accepterad, anpassade, bedövade, diciplinerade, emanciperade, frusterade

Definite

Def
- ADJ: hela, nya, svenska, flesta, stora, andra, bästa, ekonomiska, sociala, kristna
- ADJ-Part: ökade, gifta, nämnda, avlönade, dolda, isolerade, kända, minskade, särskilda, angivna
- DET: den, de, det, denna, dessa, detta, båda, ena, bägge, varannan
- NOUN: äktenskapet, barnen, samhället, familjen, kvinnan, barnet, mannen, kvinnorna, världen, föräldrarna
- PRON: det, de, sig, vi, den, du, sin, detta, dem, han

Ind
- ADJ: olika, andra, stor, samma, vissa, stora, annan, själv, sådan, viss
- ADJ-Part: särskild, ökad, särskilda, sett, taget, handikappade, beredd, gifta, bestämda, skilda
- DET: en, ett, varje, någon, några, ingen, vilka, något, vilken, var
- NOUN: år, barn, del, procent, människor, tid, sätt, arbete, fall, kvinnor
- NUM: en, ett
- PRON: man, vad, en, andra, något, många, alla, allt, var, vilket
- VERB: vald, vänd, hörselskadad, accepterad, förbjudet, förstärkt, förändrad, ifylld, komplicerad, likställd
- VERB-Part: vald, vänd, accepterad, förbjudet, förstärkt, förändrad, komplicerad, likställd, lämnad, omsatt

Degree and Polarity

Degree

Cmp
- ADJ: större, flera, högre, bättre, mindre, fler, äldre, längre, lättare, lägre
- ADV: mer, tidigare, mindre, mera, längre, senare, vidare, ytterligare, närmare, bättre

Pos
- ADJ: olika, andra, nya, många, stora, stor, samma, vissa, hela, annan
- ADJ-Part: följande, beroende, särskild, särskilda, ökad, motsvarande, liknande, ökade, gifta, nuvarande
- ADV: mycket, helt, ofta, länge, långt, snabbt, relativt, direkt, bra, starkt
- ADV-Part: flytande, förfärande, försvinnande, imponerande, koncentrerat, oroande, renodlat

Sup
- ADJ: flesta, bästa, största, närmaste, högsta, viktigaste, senaste, vanligaste, störst, främsta
- ADV: mest, minst, främst, högst, helst, bäst, oftast, längst, knappast, ytterst

Polarity

Neg
- ADV: aldrig, knappast, ingalunda, föga, nu, näppeligen, knappt, långt, minst, så
- CCONJ: varken
- PART: inte, ej, icke
- PRON: sig

Verbal Features

Mood

Imp
- AUX-Fin: Varen
- VERB-Fin: se, låt, ta, ge, jfr, kontrollera, Diskutera, kolla, Läs, byt

Ind
- AUX-Fin: är, kan, har, måste, skall, skulle, ska, var, kommer, får
- VERB-Fin: har, finns, blir, får, gäller, behöver, ger, går, kommer, gör

Sub
- AUX-Fin: vore
- VERB-Fin: vare, Gånge, finge

Tense

Past
- ADJ-Part: särskild, särskilda, ökad, ökade, gifta, sett, taget, handikappade, beredd, bestämda
- ADV-Part: koncentrerat, renodlat
- AUX-Fin: skulle, var, kunde, hade, borde, ville, fick, vore, torde, blev
- VERB-Fin: blev, fick, hade, började, gjorde, kom, gick, fanns, gav, tog
- VERB-Part: påverkade, vald, vänd, tvungna, accepterad, anpassade, bedövade, diciplinerade, emanciperade, frusterade

Pres
- ADJ-Part: följande, beroende, motsvarande, liknande, nuvarande, omfattande, avgörande, krävande, tillfredsställande, förvärvsarbetande
- ADV-Part: flytande, förfärande, försvinnande, imponerande, oroande
- AUX-Fin: är, kan, har, måste, skall, ska, kommer, får, bör, vill
- VERB-Fin: har, finns, blir, får, gäller, behöver, ger, går, kommer, gör

Voice

Act
- AUX-Fin: är, kan, har, måste, skall, skulle, ska, var, kommer, får
- AUX-Inf: vara, kunna, få, ha, bli, vilja, komma
- AUX-Sup: varit, kunnat, fått, kommit, blivit, velat
- VERB-Fin: har, blir, får, gäller, behöver, ger, går, kommer, gör, visar
- VERB-Inf: få, ha, bli, göra, ge, ta, komma, gå, se, hålla
- VERB-Sup: fått, blivit, haft, gjort, ökat, kommit, gått, visat, börjat, skett

Pass
- VERB: kallas, användas, behövs, anses, beräknas, tas, används, ges, användes, förändras
- VERB-Fin: behövs, kallas, beräknas, används, anses, användes, föds, ges, görs, tvingas
- VERB-Inf: användas, göras, tas, ses, anses, sägas, utnyttjas, hållas, kallas, kompletteras
- VERB-Part: påverkade, vald, vänd, tvungna, accepterad, anpassade, bedövade, diciplinerade, emanciperade, frusterade
- VERB-Sup: gjorts, nämnts, förändrats, framhållits, sagts, ansetts, inlämnats, byggts, givits, införts

Pronouns, Determiners, Quantifiers

PronType

Art
- DET: en, den, ett, de, det, dom, the

Dem
- DET: denna, dessa, detta, den, det
- PRON: detta, dessa, denna, det, denne, dennes, den, dessas

Ind
- DET: någon, några, något, var, varje, Somliga, alla, inget, nån, vartannat
- PRON: man, andra, många, något, någon, mer, mycket, annat, flesta, mindre

Int
- DET: vilka, vilken, vilket, vad
- PRON: vad, vem, vilka, vilken, vilket, Vems

Int,Rel
- PRON: som

Neg
- DET: ingen, inget, inga, någon
- PRON: ingen, ingenting, inget, inga, ingendera

Prs
- DET: varje, alla, detta, någon, all
- PRON: det, de, sig, vi, den, du, sin, dem, han, sina

Rcp
- PRON: varandra, varann, varandras

Rel
- PRON: som, vad, vilket, vilka, vars, vilken, något, vilkas, man

Tot
- DET: alla, varje, båda, allt, all, var, ena, bägge, varannan, vardera
- PRON: alla, var, allt, båda, allting, vart, bägge, bådadera, ena, ene

NumType

Card
- NUM: två, tre, en, 1, 20, 2, ett, 1970, 3, 10

Ord
- ADJ: första, andra, tredje, fjärde, femte, III, andre, fjortonde, 25:e, 700:e

Poss

Yes
- PRON: sin, sina, deras, sitt, våra, vår, vårt, dess, din, ditt

Other Features

Abbr
- Yes
  - ADJ: s k, s.k., ev, resp, Kungl, Kungl., S:t, Teol, a., fil
  - ADP: f
  - ADV: t.ex., ca, t ex, bl.a., etc, bl a, dvs, osv, t o m, resp
  - NOUN: kr, %, dr, s., kap., proc, KPI, milj, mån, kl
  - VERB-Fin: jfr

ExtPos
- ADJ
  - ADP: före
- ADP
  - ADP: för, i
  - NOUN: tack
- ADV
  - ADP: i, a
  - ADV: så, till, rent, sent
  - CCONJ: som
  - NOUN: vice, Poste, stick
  - PART: Icke
  - PRON: det
  - SCONJ: som
  - VERB-Fin: låt, vill
- CCONJ
  - CCONJ: vare
- SCONJ
  - ADV: därför

Foreign
- Yes
  - ADJ: European, American, Boiling, Economic, Free, Intermittent, International, National, New, North
  - ADP: of, in, for, under
  - CCONJ: and
  - DET: the
  - NOUN: Organization, Reactor, Water, companionship, family, Agriculture, Association, Authority, Children, Clearinghouse
  - PROPN: Atlantic

Typo
- Yes
  - ADJ-Part: mantalskriven, nurvarande
  - ADP: efter
  - ADV: juridisk

Syntax

Auxiliary Verbs and Copula

This corpus uses 1 lemmas as copulas (cop). Examples: vara.

This corpus uses 11 lemmas as auxiliaries (aux). Examples: kunna, ha, skola, måste, komma, få, böra, vilja, torde, må, lär.
This corpus uses 1 lemmas as passive auxiliaries (aux:pass). Examples: bli.

Core Arguments, Oblique Arguments and Adjuncts

Here we consider only relations between verbs (parent) and nouns or pronouns (child).

nsubj
- VERB-Fin--NOUN (11)
- VERB-Fin--NOUN-Nom (2041)
- VERB-Fin--NOUN-Nom-ADP(till) (2)
- VERB-Fin--PRON (1052)
- VERB-Fin--PRON-Nom (1027)
- VERB-Inf--NOUN (1)
- VERB-Inf--NOUN-Nom (489)
- VERB-Inf--PRON (185)
- VERB-Inf--PRON-Nom (506)
- VERB-Sup--NOUN (3)
- VERB-Sup--NOUN-Nom (272)
- VERB-Sup--PRON (101)
- VERB-Sup--PRON-Nom (152)

obj
- VERB--NOUN-Nom (1)
- VERB-Fin--NOUN (32)
- VERB-Fin--NOUN-Acc (1)
- VERB-Fin--NOUN-Gen (1)
- VERB-Fin--NOUN-Nom (1785)
- VERB-Fin--NOUN-Nom-ADP(för) (1)
- VERB-Fin--NOUN-Nom-ADP(mellan) (1)
- VERB-Fin--PRON (174)
- VERB-Fin--PRON-Acc (230)
- VERB-Inf--NOUN (10)
- VERB-Inf--NOUN-Nom (1289)
- VERB-Inf--NOUN-Nom-ADP(för) (1)
- VERB-Inf--PRON (126)
- VERB-Inf--PRON-Acc (149)
- VERB-Sup--NOUN (2)
- VERB-Sup--NOUN-Nom (259)
- VERB-Sup--PRON (30)
- VERB-Sup--PRON-Acc (33)

iobj
- VERB-Fin--NOUN-Nom (26)
- VERB-Fin--PRON (1)
- VERB-Fin--PRON-Acc (43)
- VERB-Inf--NOUN-Nom (23)
- VERB-Inf--PRON (1)
- VERB-Inf--PRON-Acc (49)
- VERB-Sup--NOUN-Nom (1)
- VERB-Sup--PRON-Acc (12)

Relations Overview

This corpus uses 12 relation subtypes: acl:cleft, acl:relcl, advcl:relcl, aux:pass, compound:prt, csubj:outer, csubj:pass, flat:name, nmod:poss, nsubj:outer, nsubj:pass, obl:agent
The following 2 relation types are not used in this corpus at all: clf, reparandum