home edit page issue tracker

This page pertains to UD version 2.

UD French

Language: French (code: fr)
Family: Indo-European, Romance

This treebank has been part of Universal Dependencies since the UD v1.0 release.

The following people have contributed to making this treebank part of UD: Marie-Catherine de Marneffe, Bruno Guillaume, Ryan McDonald, Alane Suhr, Joakim Nivre, Matias Grioni.

Repository: UD_French

License: CC BY-NC-SA 3.0 US

Genre: blog, news, reviews, wiki

Questions, comments? General annotation questions (either French-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [demarneffe • 1 (æt) osu • edu, bruno • guillaume (æt) inria • fr]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.

Annotation Source
Lemmas assigned by a program, with some manual corrections, but not a full manual verification
UPOS annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion
XPOS not available
Features assigned by a program, with some manual corrections, but not a full manual verification
Relations annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion

Description

The French UD was converted in 2015 from the content head version of the universal dependency treebank v2.0 (https://github.com/ryanmcd/uni-dep-tb). It is updated since 2015 independently from the previous source.

The French UD is converted from the content head version of the universal dependency treebank v2.0 (https://github.com/ryanmcd/uni-dep-tb). The README for the original project is available in the file README_Google_dataset.txt.

The French data consists of 402,404 words (16,448 sentences). No sentence id were available in the original resource, so new sent_id were automatically introduced in the converted corpus with prefixes fr-ud-train, fr-ud-dev and fr-ud-test on the correponding original files, followed by a 5 digit number following the order of sentences.

:warning: to meet the size requirements of test data of 10K words, a part of the dev original file was moved to the test file! Since version 2.0, the splitting of data is:

Sentences are shuffled and there is no way to know what is the genre of a given sentence.

Probably due to some bug in a conversion program, version 1.2 contains many truncated sentences (date missing for instance). Almost every truncated sentence is from Wikipedia, so it was possible to recover the original text. Most of the truncated sentences were completed in version 1.3. Some sentences were completed later. There are probably still some truncated sentences.

Acknowledgments

The latest version of the corpus was produced by Marie-Catherine de Marneffe, Bruno Guillaume and Matias Grioni. Automatic modifications and consistency checking were partly done using the Grew software (see http://grew.loria.fr).

See file README_Google_dataset.txt for references and acknowledgments concerning the original corpus.

Statistics of UD French

POS Tags

ADJADPADVAUXCCONJDETINTJNOUNNUMPARTPRONPROPNPUNCTSCONJSYMVERBX

Features

CaseDefiniteDegreeGenderMoodNumberNumTypePersonPolarityPossPronTypeReflexTenseVerbForm

Relations

aclacl:relcladvcladvmodamodapposauxaux:causaux:passcaseccccompcompoundconjcopcsubjcsubj:passdepdetdiscoursedislocatedexplfixedflat:foreignflat:namegoeswithiobjiobj:agentmarknmodnsubjnsubj:causnsubj:passnummodobjobj:agentoblobl:agentorphanparataxispunctreparandumrootvocativexcomp

Tokenization and Word Segmentation

Morphology

Tags

Nominal Features

  • Gender
    • Fem
      • ADJ: première, française, grande, même, nouvelle, nombreuses, nationale, autres, seule, internationale
      • AUX-Part: faite
      • DET: la, une, les, l', sa, cette, des, ses, son, leur
      • NOUN: ville, partie, région, fois, commune, années, famille, année, fin, place
      • NUM: 00H30, 12H30, 14h25, 15H00, 18h, 18h40, 20h40, 22h, 23h, 48H
      • PRON: elle, elles, une, la, celle, laquelle, celles, -elle, celle-ci, lesquelles
      • PROPN: Italie
      • VERB-Part: située, née, créée, appelée, utilisée, connue, construite, mise, publiée, nommée
    • Masc
      • ADJ: premier, français, autres, grand, nouveau, même, dernier, nombreux, seul, ancien
      • AUX-Part: été, fait
      • DET: le, les, un, l', son, des, ce, ses, ces, de
      • NOUN: ans, pays, nom, monde, temps, groupe, siècle, état, cours, lieu
      • PRON: il, on, ils, le, un, -il, lequel, celui, tout, ceux
      • PROPN: Palais, mémorique
      • VERB-Part: né, situé, eu, fait, mort, connu, nommé, réalisé, utilisé, créé
    • Neut
      • ADJ: Koninklijk
      • NOUN: Museum
  • Number
    • Plur
      • ADJ: autres, nombreux, nombreuses, grands, premières, premiers, différents, grandes, français, nouveaux
      • AUX-Fin: sont, ont, étaient, avons, furent, avaient, seront, sommes, soient, auraient
      • DET: les, des, ses, ces, de, plusieurs, leurs, tous, quelques, toutes
      • NOUN: ans, années, pays, enfants, habitants, personnes, jours, droits, points, hommes
      • NUM: 00H30, 12H30, 14h25, 15H00, 18h, 18h40, 20h40, 22h, 23h, 48H
      • PRON: ils, nous, vous, autres, les, elles, ceux, eux, leur, tous
      • VERB-Fin: ont, peuvent, font, sont, prennent, trouvent, vont, permettent, constituent, allez
      • VERB-Part: utilisés, appelés, utilisées, connus, situés, produits, réalisés, liées, mis, prises
    • Sing
      • ADJ: première, premier, même, français, française, grande, grand, nouveau, autre, politique
      • AUX-Fin: est, a, était, fut, avait, ai, sera, soit, aurait, suis
      • AUX-Part: été, fait, faite
      • DET: le, la, l', un, une, son, sa, cette, ce, leur
      • NOUN: ville, partie, nom, monde, région, commune, groupe, temps, famille, année
      • PRON: il, elle, on, c', lui, ce, je, le, l', j'
      • PROPN: Italie, Palais, mémorique
      • VERB-Fin: a, peut, fait, est, trouve, devient, doit, permet, faut, agit
      • VERB-Part: né, située, situé, eu, fait, mort, connu, nommé, née, réalisé
  • Case
    • Abl
      • NOUN: laude
    • Acc
      • NOUN: Krisen
    • Nom
      • NOUN: Verantwortung
    • Voc
      • NOUN: Domine
  • Definite
    • Def
      • DET: le, la, les, l', the, l, là
    • Ind
      • DET: un, une, des, de, d', telle, in
  • Degree and Polarity

  • Degree
    • Cmp
      • ADJ: Higher
  • Polarity
    • Neg
      • ADV: pas, n', ne, plus, jamais, non, qu', point, guère, not
      • DET: aucun, aucune, no, Nul
      • PART: n', not
      • PRON: rien
  • Verbal Features

  • Mood
    • Cnd
      • AUX-Fin: aurait, serait, auraient, seraient, serais, aurais, aurions, seriez, ferait, serions
      • VERB-Fin: pourrait, devrait, pourraient, serait, aurait, devraient, auraient, faudrait, souhaiterait, viendrait
    • Imp
      • AUX-Fin: soyez, sois
      • VERB-Fin: allez, hésitez, Rappelons, Notons, arrêtez, pensez, Cliquez, Demandez, Suivez, attendez
    • Ind
      • AUX-Fin: est, a, sont, ont, était, fut, avait, ai, sera, étaient
      • VERB-Fin: a, peut, fait, est, trouve, devient, doit, ont, permet, faut
    • Sub
      • AUX-Fin: soit, ait, soient, aient, fût, eût, fasse, aie, ayez, fassent
      • VERB-Fin: puisse, soit, puissent, agisse, fasse, aient, ait, arrive, prenne, change
  • Tense
    • Fut
      • AUX-Fin: sera, seront, aura, auront, fera, feront, serez, aurons
      • VERB-Fin: aura, fera, pourra, permettra, restera, feront, sera, deviendra, permettront, devra
    • Imp
      • AUX-Fin: était, avait, étaient, avaient, avais, avions, faisait, étais, étions, fût
      • VERB-Fin: avait, était, devait, comptait, pouvait, faisait, allait, avaient, portait, disait
    • Past
      • AUX-Fin: fut, furent, fit, eut, firent
      • AUX-Part: été, fait, faite
      • NOUN: Fermée, aéroportée, séquestrés
      • VERB-Fin: prit, devint, fit, eut, donna, reçut, décida, participa, écrivit, demanda
      • VERB-Part: né, située, situé, eu, fait, mort, connu, nommé, née, réalisé
    • Pres
      • AUX-Fin: est, a, sont, ont, ai, soit, avons, aurait, suis, fait
      • AUX-Part: étant, ayant, faisant, Etant
      • VERB-Fin: a, peut, fait, est, trouve, devient, doit, ont, permet, faut
      • VERB-Part: appartenant, concernant, faisant, permettant, ayant, portant, pouvant, prenant, utilisant, visant
  • Pronouns, Determiners, Quantifiers

  • PronType
    • Art
      • DET: le, la, les, l', un, une, des, de, d', l
      • NOUN: Fédération, Institut
    • Dem
      • DET: cette, ce, ces, cet
      • PRON: c', ce, cela, celle, celui, ceux, celui-ci, celles, ça, celle-ci
    • Ind
      • PRON: quiconque
    • Int
      • PRON: Que
    • Neg
      • DET: aucun, aucune, aucunes
      • PRON: personne
    • Prs
      • DET: son, sa, ses, leur, leurs, notre, mon, nos, ma, votre
      • PRON: il, se, s', elle, ils, lui, nous, je, le, vous
    • Rel
      • PRON: qui, dont, où, qu', que, lequel, laquelle, lesquels, lesquelles, ou
  • NumType
    • Ord
      • ADJ: XIXe, XXe, XVIIe, XVIe, XVIIIe, XIIe, XVe, XIe, XIIIe, VIe
  • Poss
    • Yes
      • DET: son, sa, ses, leur, leurs, notre, mon, nos, ma, votre
      • NOUN: Citizen
      • PRON: Your
      • PROPN: Dumbo, Lincoln, Andrew, Barney, Benson, Devil, Schott
  • Reflex
    • Yes
      • PRON: lui-même, elle-même, eux-mêmes, elles-mêmes, moi-même, moi, nous-mêmes, soi-même
  • Person
    • 1
      • AUX-Fin: ai, avons, suis, sommes, avais, avions, étais, serais, étions, aurais
      • PRON: nous, je, j', m', me, moi, -je, -nous, -moi, I
      • VERB-Fin: recommande, conseille, ai, trouve, vais, pense, pouvons, aime, devons, peux
    • 2
      • AUX-Fin: êtes, avez, es, soyez, as, serez, seriez, ayez, fais, sois
      • PRON: vous, -vous, tu, -tu, t', te, toi, -toi, you, tien
      • VERB-Fin: allez, hésitez, avez, voulez, pouvez, passez, pourrez, êtes, pensez, protégés
    • 3
      • AUX-Fin: est, a, sont, ont, était, fut, avait, sera, étaient, soit
      • PRON: il, se, s', elle, on, c', en, ils, lui, ce
      • VERB-Fin: a, peut, fait, est, devient, doit, ont, trouve, permet, faut
  • Other Features

    Syntax

    Auxiliary Verbs and Copula

    Core Arguments, Oblique Arguments and Adjuncts

    Here we consider only relations between verbs (parent) and nouns or pronouns (child).

    Verbs with Reflexive Core Objects

    Relations Overview