home edit page issue tracker

This page pertains to UD version 2.

UD Dutch

Language: Dutch (code: nl)
Family: Indo-European, Germanic

This treebank has been part of Universal Dependencies since the UD v1.2 release.

The following people have contributed to making this treebank part of UD: Daniel Zeman, Zdeněk Žabokrtský, Gosse Bouma, Gertjan van Noord.

Repository: UD_Dutch

License: CC BY-SA 4.0

Genre: news

Questions, comments? General annotation questions (either Dutch-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [g • bouma (æt) rug • nl]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.

Annotation Source
Lemmas annotated manually in non-UD style, automatically converted to UD
UPOS annotated manually in non-UD style, automatically converted to UD
XPOS annotated manually
Features annotated manually in non-UD style, automatically converted to UD
Relations annotated manually in non-UD style, automatically converted to UD

Description

This corpus consists of samples from various treebanks annotated at the University of Groningen using the Alpino annotation tools and guidelines.

The data consists of samples from various treebanks annotated at the University of Groningen using the Alpino annotation tools and guidelines:

The data was thoroughly revised by Gosse Bouma and Gertjan van Noord for UD 2.1 in November 2017. The new version was created using the same conversion script as was used for Dutch LassySmall. As sources, we used the (manually corrected) Alpino treebank annotation for this material as it is available in Groningen. Links to original files have been added. Note that tokenization may differ from the previous UD version.

The conversion script can be found here: https://github.com/gossebouma/lassy2ud

Acknowledgments

Statistics of UD Dutch

POS Tags

ADJADPADVAUXCCONJDETINTJNOUNNUMPRONPROPNPUNCTSCONJSYMVERBX

Features

AbbrCaseDefiniteDegreeForeignGenderNumberPersonPronTypeReflexTenseVerbForm

Relations

aclacl:relcladvcladvmodamodapposauxaux:passcaseccccompcompound:prtconjcopcsubjdetexplfixedflat:nameiobjmarknmodnmod:possnsubjnsubj:passnummodobjoblparataxispunctrootxcomp

Tokenization and Word Segmentation

Morphology

Tags

Nominal Features

  • Gender
    • Com
      • NOUN: heer, plaats, tijd, minister, flo, stad, man, dag, week, politie
      • PROPN: zaterdag, januari, zondag, JGZ, Robbert, mei, juli, september, vrijdag, april
    • Com,Neut
      • NOUN: soort, boord, keer, paar, subsidie, opium, punt, accordeon, affiche, animo
      • PROPN: Holthaus, WK, Bijlmerbetonmeer, Enkelaar, Enusa, Europe, Gezant, Hoch, Hoornik, Kvp
    • Neut
      • NOUN: jaar, land, uur, aantal, deel, procent, huis, miljoen, werk, leven
      • PROPN: Nederland, Amsterdam, Groningen, Rotterdam, Europa, Engeland, Aduard, Frankrijk, Utrecht, Ajax
  • Number
    • Plur
      • AUX-Fin: zijn, hebben, worden, zullen, waren, werden, kunnen, zouden, hadden, willen
      • NOUN: mensen, kinderen, jaren, problemen, zaken, landen, boeken, dagen, vrouwen, weken
      • PROPN: Italianen, Nederlanders, GGD-en, Egyptenaren, Rabo's, Surinamers, Cubanen, Nederlanden, Zuid-Amerikanen, Afrikanen
      • VERB-Fin: hebben, zijn, moeten, komen, gaan, kwamen, hadden, krijgen, moesten, konden
    • Sing
      • AUX-Fin: is, was, heeft, werd, wordt, zal, zou, kan, heet, had
      • NOUN: jaar, land, heer, plaats, tijd, minister, flo, uur, stad, man
      • PROPN: Nederland, Amsterdam, zaterdag, Groningen, Rotterdam, Europa, Engeland, januari, zondag, JGZ
      • VERB-Fin: moet, heeft, komt, is, zei, noemt, kwam, ligt, staat, gaat
  • Case
    • Acc
      • PRON: zich, hem, me, ons, mij, elkaar, haar, hen, je, zichzelf
    • Dat
      • PRON: dien, dezen
    • Gen
      • PRON: beider, uwer, zijner
    • Nom
      • PRON: hij, ik, we, men, je, zij, wij, u, jij, ie
  • Definite
    • Def
      • DET: de, het, der, 's, 't, den, des, dé
    • Ind
      • DET: een, 'n, en
  • Degree and Polarity

  • Degree
    • Cmp
      • ADJ: verder, beter, later, jongeren, langer, groter, grotere, hoger, vroeger, vroegere
    • Pos
      • ADJ: nieuwe, grote, andere, Nederlandse, goed, heel, groot, goede, Amerikaanse, eigen
    • Sup
      • ADJ: laatste, grootste, beste, belangrijkste, hoogste, best, hoogst, jongste, voornaamste, oudste
  • Verbal Features

  • Tense
    • Past
      • AUX-Fin: was, werd, zou, had, waren, werden, kon, zouden, hadden, wilde
      • VERB-Fin: zei, kwam, had, was, moest, vond, kreeg, vroeg, won, maakte
    • Pres
      • AUX-Fin: is, heeft, wordt, zijn, zal, kan, hebben, heet, heb, worden
      • VERB-Fin: moet, heeft, komt, is, noemt, hebben, zijn, ligt, staat, gaat
  • Pronouns, Determiners, Quantifiers

  • PronType
    • Dem
      • PRON: dat, dit, die, deze, zo'n, degenen, datgene, degene, zulke, dien
    • Ind
      • PRON: meer, veel, minder, weinig, iets, vele, niets, wat, meest, alles
    • Int
      • PRON: wat, wie, welke, welk
    • Prs
      • PRON: hij, ik, het, zijn, zich, ze, we, je, men, hun
    • Rcp
      • PRON: elkaar
    • Rel
      • PRON: die, dat, hetgeen, hetgene
  • Reflex
    • Yes
      • PRON: zich, zichzelf
  • Person
    • 1
      • PRON: ik, we, ons, wij, me, mijn, mij, onze, mezelf, m'n
    • 2
      • PRON: je, u, jullie, jij, jou, uw, gij, jouw, ge, jezelf
    • 3
      • PRON: hij, het, dat, zijn, wat, zich, ze, wie, men, hun
  • Other Features

  • Abbr
    • Yes
      • X: o.a., jl., o.m., Ad, a.s., etc., v.j., enz., b.v., e.d.
  • Foreign
    • Yes
      • X: fancy, a, the, and, front, to, National, be, fiction, flo
  • Syntax

    Auxiliary Verbs and Copula

    Core Arguments, Oblique Arguments and Adjuncts

    Here we consider only relations between verbs (parent) and nouns or pronouns (child).

    Verbs with Reflexive Core Objects

    Relations Overview