UD French Rhapsodie
Language: French (code: fr)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.2 release.
The following people have contributed to making this treebank part of UD: Kim Gerdes, Sylvain Kahane, Mariam Nakhlé, Chunxiao Yan, Aline Etienne, Marine Courtin.
Repository: UD_French-Rhapsodie
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.18
License: CC BY-SA 4.0
Genre: spoken
Questions, comments? General annotation questions (either French-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [kim (æt) gerdes • fr]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually in non-UD style, automatically converted to UD |
| UPOS | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
| XPOS | not available |
| Features | not available |
| Relations | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
Description
A Universal Dependencies corpus for spoken French.
The corpus was converted automatically from the Rhapsodie treebank with manual corrections. The treebank in maintained in the repository SUD_French-Rhapsodie in the SUD annotation schema.
The SUD version is also available with prosodic annotation (see SUD README.md).
Acknowledgments
The final discussions on the guidelines for spoken treebanks were supported by the COST Action CA21167 —Universality, diversity and idiosyncrasy in language technology (UniDive). Resource maintenance has been supported by Autogramm, ANR (Agence Nationale de la Recherche), Projet-ANR-21-CE38-0017 (2021-2026).
Statistics of UD French Rhapsodie
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Case – Definite – Emph – ExtPos – Foreign – Gender – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – Poss – PronType – Reflex – Tense – VerbForm – Voice
Relations
acl – acl:relcl – advcl – advcl:cleft – advmod – amod – appos – aux – aux:caus – aux:pass – aux:tense – case – cc – ccomp – compound – conj – cop – csubj – csubj:pass – dep – dep:comp – det – discourse – dislocated – dislocated:mod – dislocated:obj – dislocated:obl – dislocated:subj – expl:comp – expl:pass – expl:pv – expl:subj – fixed – flat – flat:foreign – flat:name – iobj – mark – nmod – nmod:appos – nsubj – nsubj:caus – nsubj:outer – nsubj:pass – nummod – obj – obj:lvc – obl – obl:agent – obl:arg – obl:mod – orphan – parataxis – parataxis:insert – parataxis:parenth – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 3209 sentences, 43691 tokens and 44234 syntactic words.
- This corpus contains 10956 tokens (25%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 123 types of words that contain both letters and punctuation. Examples: c', l', d', j', qu', n', s', m', -ce, -là, jusqu', peut-être, aujourd'hui, c'est-à-dire, dix-huit, quelqu'un, rond-point, Notre-Dame, l'on, -vous, là-bas, -il, celui-là, t', -chose, Alsace-Lorraine, dix-neuvième, rendez-vous, vingt-cinq, vingt-deux, -on, -tu, Saint-Jean-de-Maurienne, Sainte-Claire, après-midi, dix-huitième, dix-neuf, lorsqu', là-dedans, là-dessus, mi-temps, quatre-vingt-six, soixante-dix, vingt-et-unième, vingt-neuf, vis-à-vis, -d', -ils, -moi, -nous
- This corpus contains 543 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 5 types of multi-word tokens. Examples: du, au, des, aux, auquel.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: PART, SYM
- This corpus contains 39 lemmas tagged as pronouns (PRON): aucun, autre, ce, ceci, cela, celui, celui-là, certains, chacun, ci, dont, en, lequel, lui, lui-même, moi, moi-même, nous, on, personne, plusieurs, que, quel, quelqu'un, qui, quoi, rien, sien, soi, soi-même, tel, toi, tous, tout, un, vous, vous-même, y, ça
- This corpus contains 14 lemmas tagged as determiners (DET): aucun, ce, certains, chaque, du, le, plusieurs, quel, quelque, quelques, son, tel, tout, un
- Out of the above, 8 lemmas occurred sometimes as PRON and sometimes as DET: aucun, ce, certains, plusieurs, quel, tel, tout, un
- This corpus contains 3 lemmas tagged as auxiliaries (AUX): avoir, faire, être
- Out of the above, 3 lemmas occurred sometimes as AUX and sometimes as VERB: avoir, faire, être
- There are 3 (de)verbal forms:
- Fin
- AUX: est, a, ai, était, sont, suis, ont, avez, êtes, avait
- VERB: a, est, va, faut, allez, ai, peut, avait, crois, sais
- Inf
- AUX: être, faire, avoir
- VERB: dire, faire, avoir, aller, voir, passer, travailler, arriver, mettre, apprendre
- Part
- ADJ: entendu, étonnée
- AUX: été, fait, ayant, faisant, étant
- VERB: dit, fait, eu, pu, travaillé, vu, arrivé, compris, vécu, été
Nominal Features
- Fem
- ADJ: jeune, grande, petite, autre, magique, bonne, toutes, première, toute, même
- ADJ-Part: étonnée
- DET: la, une, l', cette, sa, ma, son, toute, mon, aucune
- NOUN: place, vie, fille, chose, gauche, rue, droite, fois, boule, choses
- PRON: elle, elles, une, la, laquelle, celle, celles, chacune, aucune, celle-là
- PROPN: Nef, Beauce, Seine, CGC, France, Marne, Rolex, Shoah, Vire
- VERB-Part: arrivée, née, venue, rentrée, restée, étonnée, obligée, partie, renforcée, revenue
- Masc
- ADJ: tout, petit, tous, vrai, droit, premier, sûr, même, bon, grand
- ADJ-Part: entendu
- AUX-Part: été, fait
- DET: le, un, l', ce, mon, son, cet, du, aucun, quel
- NOUN: peu, fait, moment, ans, français, gens, temps, art, côté, monde
- PRON: c', il, on, ça, ce, ils, le, -ce, lui, rien
- PROPN: Kenya, Gâtinais, Figaro, Beauceron, Christ, Parisien
- VERB-Part: dit, fait, eu, pu, travaillé, vu, arrivé, compris, vécu, été
- Plur
- ADJ: tous, toutes, grands, autres, jeunes, petits, grandes, bons, différentes, nombreux
- AUX-Fin: sont, ont, avez, êtes, avons, étaient, sommes, avaient, étiez, soient
- DET: les, des, ces, ses, vos, nos, mes, de, quelques, plusieurs
- NOUN: ans, gens, choses, enfants, années, heures, études, livres, hommes, fonctions
- NUM: deux, cent, mille, neuf, dix-huit, trois, quatre, trente, douze, quarante
- PRON: vous, ils, nous, les, ceux, autres, elles, -vous, tous, eux
- PROPN: Antilles, Mines
- VERB-Fin: allez, ont, avez, continuez, disons, voulez, voyez, sont, pouvez, savez
- VERB-Inf: réussirons
- VERB-Part: partis, données, eus, passées, passés, prises, rentrés, repartis, touchés, vues
- Sing
- ADJ: tout, petit, jeune, autre, grande, vrai, droit, même, premier, grand
- ADJ-Part: entendu, étonnée
- AUX-Fin: est, a, ai, était, suis, avait, étais, soit, sera, aurais
- AUX-Part: été, fait
- DET: le, la, l', un, une, ce, cette, mon, votre, sa
- NOUN: fait, moment, place, art, côté, monde, vie, fille, chose, accord
- NUM: mille, cent, un, cinquante, deux, trente, vingt, quarante-neuf, trois, cinq
- PRON: c', je, il, on, ça, j', ce, tu, elle, me
- PROPN: Nef, Kenya, Beauce, Gâtinais, Ethiopie, Figaro, Beauceron, Seine, Église, Élysée
- VERB-Fin: a, est, va, faut, ai, peut, avait, crois, sais, vais
- VERB-Part: dit, fait, eu, pu, travaillé, vu, arrivé, vécu, été, choisi
- Acc
- PRON: le, vous, l', les, m', nous, me, la, t', te
- Dat
- PRON: me, m', vous, nous, lui, leur, te, t'
- Nom
- PRON: je, il, vous, on, j', ils, tu, nous, elle, elles
- Def
- DET: le, la, les, l'
- Ind
- DET: un, une, des, du, de, d'
Degree and Polarity
- Neg
- ADV: pas, non, n', ne, plus, que, qu'
- SCONJ: qu', que
Verbal Features
- Cnd
- AUX-Fin: aurais, aurait, serais, serait, auraient
- VERB-Fin: pourrait, faudrait, dirais, voudrais, aimerais, devrait, pourrais, remarquerait, serait, devraient
- Imp
- AUX-Fin: sois
- VERB-Fin: disons, continuez, attendez, allez, bougez, gardons, mettez, regardez, traversez, écoute
- Ind
- AUX-Fin: est, a, ai, était, sont, suis, ont, avez, êtes, avait
- VERB-Fin: a, est, va, faut, ai, allez, peut, avait, crois, sais
- Sub
- AUX-Fin: soit, soient, ait, ayez, sois, soyez
- VERB-Fin: ait, soit, dise, puisse, puissent, acceptent, achètent, aie, aille, arrive
- Fut
- AUX-Fin: sera, serons, aurai, serai, seras
- VERB-Fin: verrez, aura, serez, verras, pourra, sera, acceptera, annoncera, appellerai, attarderai
- Imp
- AUX-Fin: était, avait, étais, étaient, avaient, étiez, avais, aviez, étions
- VERB-Fin: avait, avais, était, avaient, pouvait, voulais, étais, connaissais, faisait, allait
- Past
- ADJ-Part: entendu, étonnée
- AUX-Fin: fut
- AUX-Part: été, fait
- VERB-Fin: durent
- Pres
- AUX-Fin: est, a, ai, sont, suis, ont, avez, êtes, avons, soit
- AUX-Part: ayant, faisant, étant
- VERB-Fin: a, est, va, faut, ai, allez, peut, crois, sais, vais
- Act
- VERB-Part: dit, eu, fait, pu, travaillé, vu, vécu, été, arrivé, choisi
- Pass
- VERB-Part: fait, venue, devenu, obligée, rentrée, revenue, abîmée, attifée, contré, développée
Pronouns, Determiners, Quantifiers
- Art
- DET: le, la, les, l', un, une, des, du, de, d'
- Dem
- DET: ce, cette, ces, cet
- PRON: c', ça, ce, -ce, ceux, cela, celui, celui-là, celle, ceci
- Exc
- ADV: combien, comment
- Ind
- ADJ: autres
- DET: quelque, chaque, quelques, plusieurs, certains, toute, tel, certaines, tous, toutes
- PRON: on, tout, autres, un, quelqu'un, l'on, autre, tous, une, chacun
- Int
- ADJ: quel, quelles, quels
- ADV: comment, pourquoi, combien, quand, où
- DET: quel, quelle
- PRON: qu', quoi, qui, quel, quelles
- Neg
- ADV: jamais
- DET: aucun, aucune
- PRON: rien, personne, aucun, aucune
- Prs
- DET: mon, votre, sa, son, notre, ma, ses, vos, nos, mes
- PRON: je, il, vous, y, j', ils, nous, se, tu, elle
- Rel
- ADJ: quelle
- ADV: où
- PRON: qui, que, qu', dont, lequel, laquelle, quoi, lesquelles
- Ord
- ADJ: vingt-et-unième
- Yes
- DET: mon, votre, sa, son, notre, ma, ses, vos, nos, mes
- Yes
- PRON: se, s', lui-même, vous-même, elle-même, moi-même, soi-même
- 1
- AUX-Fin: ai, suis, étais, avons, sommes, aurais, avais, serais, serons, aurai
- PRON: je, j', nous, me, moi, m', -moi, -nous, moi-même
- VERB-Fin: ai, crois, sais, vais, avais, pense, veux, vois, disons, aime
- VERB-Inf: réussirons
- 2
- AUX-Fin: avez, êtes, étiez, as, aviez, ayez, es, seras, sois, soyez
- PRON: vous, tu, -vous, te, t', toi, -tu, vous-même, -toi
- VERB-Fin: allez, avez, continuez, voulez, voyez, pouvez, savez, passez, prenez, arrives
- 3
- AUX-Fin: est, a, était, sont, ont, avait, étaient, soit, sera, fait
- PRON: c', il, on, ça, y, ce, ils, se, elle, s'
- VERB-Fin: a, est, va, faut, peut, avait, fait, ont, dit, voit
- Plur
- DET: votre, notre, vos, nos, leur, leurs
- Sing
- DET: mon, sa, son, ma, ses, mes, ta, ton
- PRON: mien, sien
Other Features
- Emph
- No
- PRON: je, il, vous, on, j', ils, nous, tu, elle, le
- Yes
- PRON: moi, lui, eux, toi, -nous, lui-même, vous-même, -vous, elle, elle-même
- No
- ExtPos
- ADJ
- ADP: à
- ADV: bien
- X: aus~, ex~, frai~, hédo~, portu~, qu~, éner~
- ADP
- ADP: d', en, à, pour
- PRON: il
- X: a~, dep~, de~
- ADV
- ADJ: petit
- ADP: en, à, de, par, a, d', sur
- ADV: bien, tout, peu, pas, non
- CCONJ: et
- DET: un, une
- NOUN: grâce
- NUM: cent
- PRON: rien
- SCONJ: quand
- VERB-Fin: sais
- X: n~, beau~, tou~, ass~, au~, déj~, maint~, peut~, pra~, s~
- CCONJ
- CCONJ: et, c'est-à-dire, ou, sauf
- PRON: y
- X: c'est~
- DET
- ADP: de
- ADV: n'
- X: l~, u~, un~, d~
- INTJ
- INTJ: ah, oh, eh, ouh
- NOUN: bonjour, attention
- VERB: voilà, allez
- VERB-Fin: allez
- NOUN
- ADP: pour
- ADV: bien
- AUX-Fin: est, sont, était
- NOUN: chef, face
- VERB-Fin: disons, sais
- VERB-Inf: dire
- X: XXX, ca~, dis~, entour~, ex~, ma~, ar~, ch~, desc~, déb~
- NUM
- X: vingt~
- PRON
- ADJ: grand
- ADV: beaucoup, n', combien, quand
- X: j~, qu~
- PROPN
- NOUN: Barrage, Amant, Maladie, Photographie, Voix, jeux, reflet
- PROPN: Kafka
- VERB-Part: lus
- X: XXX, A~, Bel~, Ch~, Emmanu~, Fran~, Gu~, M~, Ora~, Sor~
- SCONJ
- ADV: parce, alors, plus, plutôt, ainsi, encore, peut-être, surtout
- CCONJ: sauf
- DET: une
- X: pa~
- VERB
- AUX-Fin: est
- VERB-Fin: est, sait
- X: f~, XXX, p~, a~, sa~, ét~, é~, ai~, arri~, conti~
- ADJ
- Foreign
- Yes
- X: A, Small, World, aisthesis, poïésis, best, doctors, flying, sellers
- Yes
- Person[psor]
- 1
- DET: mon, notre, ma, nos, mes
- PRON: mien
- 2
- DET: votre, vos, ta, ton
- 3
- DET: sa, son, ses, leur, leurs
- PRON: sien
- 1
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: être.
- This corpus uses 1 lemmas as auxiliaries (aux). Examples: avoir.
- This corpus uses 1 lemmas as passive auxiliaries (aux:pass). Examples: être.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB-Fin--NOUN (185)
- VERB-Fin--PRON (445)
- VERB-Fin--PRON-Nom (1422)
- VERB-Inf--NOUN (6)
- VERB-Inf--PRON (12)
- VERB-Inf--PRON-Nom (1)
- VERB-Part--NOUN (41)
- VERB-Part--PRON (85)
- VERB-Part--PRON-Nom (309)
- obj
- VERB--NOUN (3)
- VERB-Fin--NOUN (546)
- VERB-Fin--NOUN-ADP(dans) (2)
- VERB-Fin--NOUN-ADP(de) (17)
- VERB-Fin--NOUN-ADP(que) (1)
- VERB-Fin--PRON (188)
- VERB-Fin--PRON-ADP(de) (1)
- VERB-Fin--PRON-Acc (104)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--NOUN (233)
- VERB-Inf--NOUN-ADP(de) (2)
- VERB-Inf--PRON (71)
- VERB-Inf--PRON-Acc (60)
- VERB-Part--NOUN (143)
- VERB-Part--NOUN-ADP(de) (1)
- VERB-Part--NOUN-ADP(sur) (1)
- VERB-Part--PRON (43)
- VERB-Part--PRON-ADP(à) (1)
- VERB-Part--PRON-Acc (40)
- VERB-Part--PRON-Nom (1)
- iobj
- VERB-Fin--PRON (22)
- VERB-Fin--PRON-Acc (3)
- VERB-Fin--PRON-Dat (69)
- VERB-Fin--PRON-Nom (1)
- VERB-Inf--PRON (16)
- VERB-Inf--PRON-Dat (26)
- VERB-Part--PRON (11)
- VERB-Part--PRON-Dat (37)
Reflexive Verbs
- This corpus contains 46 lemmas that occur at least once with an expl:pv child. Examples: passer se, appeler s', agir s', trouver se, aller s', enfuir s', faire se, mettre se, abstenir s', accorder s', affirmer s', apercevoir s', apprêter s', asseoir s', attendre s', attrouper s', balader se, coaliser se, douter se, dégrader se, dérouler se, désunir se, efforcer s', entendre se, gagner se, gourer se, intéresser s', mettre s', méfier se, opposer s', passer s', perdre se, plaire se, prononcer se, précipiter se, préoccuper se, remettre se, reprendre se, réaliser se, sauver se, sortir s', tenir se, voir se, vouloir s', échapper s', étonner s'
Reflexive Passive
- This corpus contains 29 lemmas that occur at least once with an expl:pass child. Examples: situer se, achever s', développer s', faire se, ouvrir s', régler se, savoir se, appliquer s', arrêter s', balader se, définir se, dégager se, exercer s', inscrire s', installer s', modifier se, obstiner s', porter se, poser se, poursuivre se, produire s', produire se, retrouver s', retrouver se, répandre s', terminer se, transmettre se, ébaucher s', étendre s'
Verbs with Reflexive Core Objects
- This corpus contains 34 lemmas that occur at least once with a reflexive core object (obj or iobj). Examples: retrouver se, dire se, accuser s', confier se, croiser se, heurter se, montrer se, rencontrer se, éloigner s', accorder s', compénétrer se, consacrer se, cristalliser se, demander se, diriger se, dégager se, empêcher s', exposer s', faire s', faire se, habiller s', imposer s', installer s', introduire s', marier se, mentir se, payer se, rapporter se, retirer se, retourner se, salir se, stationner se, séparer se, toucher se
- Out of those, 4 lemmas occurred more than once, but never without a reflexive dependent. Examples: accuser, confier, croiser, heurter
Relations Overview
- This corpus uses 27 relation subtypes: acl:relcl, advcl:cleft, aux:caus, aux:pass, aux:tense, csubj:pass, dep:comp, dislocated:mod, dislocated:obj, dislocated:obl, dislocated:subj, expl:comp, expl:pass, expl:pv, expl:subj, flat:foreign, flat:name, nmod:appos, nsubj:caus, nsubj:outer, nsubj:pass, obj:lvc, obl:agent, obl:arg, obl:mod, parataxis:insert, parataxis:parenth
- The following 1 main types are not used alone, they are always subtyped: expl
- The following 3 relation types are not used in this corpus at all: clf, list, goeswith