UD French Rhapsodie
Language: French (code: fr
)
Family: Indo-European, Romance
This treebank has been part of Universal Dependencies since the UD v2.2 release.
The following people have contributed to making this treebank part of UD: Kim Gerdes, Sylvain Kahane, Mariam Nakhlé, Chunxiao Yan, Aline Etienne, Marine Courtin.
Repository: UD_French-Rhapsodie
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.10
License: CC BY-SA 4.0
Genre: spoken
Questions, comments? General annotation questions (either French-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [kim (æt) gerdes • fr]. Development of the treebank happens directly in the UD repository, so you may submit bug fixes as pull requests against the dev branch.
Annotation | Source |
---|---|
Lemmas | annotated manually in non-UD style, automatically converted to UD |
UPOS | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
XPOS | not available |
Features | not available |
Relations | annotated manually in non-UD style, automatically converted to UD, with some manual corrections of the conversion |
Description
A Universal Dependencies corpus for spoken French.
The corpus was converted automatically from the Rhapsodie treebank with manual corrections.
Xpos and features (which are not available in v2.2 of UD_French-Spoken) will be added to future versions of this treebank as they are encoded in the Rhapsodie treebank.
Acknowledgments
Statistics of UD French Rhapsodie
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Definite – Foreign – Gender – Mood – Number – Number[psor] – NumType – Person – Person[psor] – Polarity – PronType – Reflex – Tense – VerbForm
Relations
acl – acl:relcl – advcl – advcl:cleft – advmod – amod – appos – aux – aux:caus – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – csubj:pass – dep – dep:comp – det – discourse – dislocated – expl:subj – fixed – flat – iobj – mark – nmod – nmod:appos – nsubj – nsubj:caus – nsubj:pass – nummod – obj – obj:lvc – obl – obl:agent – obl:arg – obl:mod – orphan – parataxis – parataxis:insert – parataxis:parenth – punct – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 3210 sentences, 43700 tokens and 44243 syntactic words.
- This corpus contains 10965 tokens (25%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 120 types of words that contain both letters and punctuation. Examples: c', l', d', j', qu', n', s', m', -ce, -là, jusqu', peut-être, aujourd'hui, c'est-à-dire, dix-huit, quelqu'un, rond-point, Notre-Dame, l'on, -vous, là-bas, -il, t', -chose, Alsace-Lorraine, dix-neuvième, rendez-vous, vingt-cinq, vingt-deux, -on, -tu, Saint-Jean-de-Maurienne, Sainte-Claire, après-midi, dix-huitième, dix-neuf, lorsqu', là-dedans, là-dessus, mi-temps, quatre-vingt-six, soixante-dix, vingt-et-unième, vingt-neuf, vis-à-vis, -d', -ils, -moi, -nous, -t-il
- This corpus contains 543 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 5 types of multi-word tokens. Examples: du, au, des, aux, auquel.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: PART, SYM
- This corpus contains 41 lemmas tagged as pronouns (PRON): aucun, autre, ce, ceci, cela, celui, certain, chacun, ci, deux, dont, en, il, j~, le, lequel, lui, lui-même, me, nous, on, où, personne, plusieurs, que, quel, quelqu'un, qui, quoi, qu~, rien, se, sien, soi, soi-même, tel, tout, un, y, ça, íl
- This corpus contains 25 lemmas tagged as determiners (DET): A, XXX, aucun, autre, ce, certain, chaque, de, de+le, des, du, d~, le, les, l~, plusieurs, quel, quelque, son, tel, tout, toute, un, un~, u~
- Out of the above, 10 lemmas occurred sometimes as PRON and sometimes as DET: aucun, autre, ce, certain, le, plusieurs, quel, tel, tout, un
- This corpus contains 3 lemmas tagged as auxiliaries (AUX): avoir, faire, être
- Out of the above, 3 lemmas occurred sometimes as AUX and sometimes as VERB: avoir, faire, être
- There are 3 (de)verbal forms:
- Fin
- AUX: est, a, ai, était, sont, suis, ont, avez, êtes, avait
- VERB: a, est, va, faut, ai, allez, peut, avait, crois, sais
- Inf
- AUX: être, faire, avoir
- VERB: dire, faire, avoir, aller, voir, passer, travailler, arriver, mettre, apprendre
- Part
- ADJ: entendu, étonnée
- AUX: été, fait, ayant, faisant, étant
- VERB: dit, fait, eu, pu, travaillé, vu, arrivé, compris, vécu, choisi
Nominal Features
- Fem
- ADJ: grande, petite, magique, bonne, autre, toutes, première, toute, seule, certaine
- ADJ-Part: étonnée
- DET: la, une, cette, sa, ma, toute, aucune, quelle, certaines, ta
- NOUN: place, vie, fille, chose, gauche, rue, droite, fois, boule, choses
- PRON: elle, elles, une, la, celle, laquelle, celles, chacune, aucune, autre
- PROPN: Nef, Beauce, Seine, CGC, France, Marne, Mort, Rolex, Shoah, Vire
- VERB-Part: arrivée, née, venue, rentrée, restée, étonnée, dites, obligée, partie, renforcée
- Masc
- ADJ: petit, tous, tout, vrai, droit, français, premier, sûr, bon, gros
- ADJ-Part: entendu
- AUX-Part: été, fait
- DET: le, un, ce, cet, du, aucun, quel, certains, tel, tous
- NOUN: fait, temps, moment, ans, gens, art, côté, cas, monde, accord
- PRON: c', il, on, ça, ils, ce, le, -ce, lui, rien
- PROPN: Kenya, Maître, Gâtinais, Figaro, Beauceron, Argentins, Beaucerons, Chinois, Christ, Conseil
- VERB: dit, fait, eu, pu, travaillé, vu, arrivé, compris, vécu, choisi
- VERB-Part: dit, fait, eu, pu, travaillé, vu, arrivé, compris, vécu, choisi
- Plur
- ADJ: tous, jeunes, toutes, grands, autres, petits, politiques, grandes, bons, différentes
- AUX-Fin: sont, ont, avez, êtes, avons, étaient, sommes, avaient, étiez, soient
- DET: les, des, ces, ses, vos, nos, mes, de, plusieurs, quelques
- NOUN: ans, gens, choses, enfants, années, heures, études, livres, fonctions, hommes
- NUM: deux, mille, cent, neuf, dix-huit, trois, trente, quatre, cinquante, douze
- PRON: vous, ils, nous, les, ceux, autres, elles, -vous, tous, deux
- PROPN: Antilles, Mines, Argentins, Beaucerons, Français, Hommes, Portugais
- VERB: allez, ont, avez, continuez, disons, voulez, voyez, sont, pouvez, savez
- VERB-Fin: allez, ont, avez, continuez, disons, voulez, voyez, sont, pouvez, savez
- VERB-Part: partis, dites, données, eus, passées, passés, prises, rentrés, repartis, touchés
- Sing
- ADJ: jeune, même, petit, tout, difficile, grande, vrai, autre, droit, premier
- ADJ-Part: entendu, étonnée
- AUX-Fin: est, a, ai, était, suis, avait, étais, sera, soit, aurais
- AUX-Part: été, fait
- DET: le, la, l', un, une, ce, cette, mon, votre, sa
- NOUN: fait, moment, place, art, côté, monde, vie, fille, chose, accord
- NUM: un, zéro
- PRON: c', je, il, on, ça, j', ce, tu, elle, me
- PROPN: Nef, Kenya, Maître, Beauce, Gâtinais, Ethiopie, Figaro, Beauceron, Seine, Église
- VERB: a, est, va, dit, faut, fait, ai, peut, avait, crois
- VERB-Fin: a, est, va, faut, ai, peut, avait, crois, sais, vais
- VERB-Part: dit, fait, eu, pu, travaillé, vu, arrivé, vécu, choisi, commencé
- Def
- DET: le, la, les, l'
- Ind
- DET: un, une, des, du, de, d'
- PRON: un
Degree and Polarity
- Neg
- ADV: pas, non, n', ne
Verbal Features
- Cnd
- AUX-Fin: aurais, aurait, serais, serait, auraient, s~
- VERB-Fin: pourrait, faudrait, dirais, voudrais, aimerais, devrait, pourrais, remarquerait, serait, devraient
- Imp
- AUX-Fin: sois
- VERB-Fin: disons, continuez, attendez, bougez, gardons, mettez, regardez, traversez, écoute, écoutez
- Ind
- AUX-Fin: est, a, ai, était, sont, suis, ont, avez, êtes, avait
- VERB-Fin: a, est, va, faut, ai, allez, peut, avait, crois, sais
- Sub
- AUX-Fin: soit, soient, ait, ayez, sois, soyez
- VERB-Fin: ait, soit, dise, puisse, puissent, acceptent, achètent, aie, aille, ayez
- Fut
- AUX-Fin: sera, serons, aurai, serai, seras
- VERB-Fin: verrez, aura, serez, verras, pourra, sera, acceptera, annoncera, appellerai, attarderai
- Imp
- AUX-Fin: était, avait, étais, étaient, avaient, étiez, avais, aviez, étions
- VERB-Fin: avait, avais, était, avaient, pouvait, voulais, étais, connaissais, faisait, allait
- Past
- ADJ-Part: entendu, étonnée
- AUX-Fin: fut
- AUX-Part: été, fait
- VERB-Fin: durent
- VERB-Part: dit, fait, eu, pu, travaillé, vu, arrivé, compris, vécu, choisi
- Pres
- AUX-Fin: est, a, ai, sont, suis, ont, avez, êtes, avons, soit
- AUX-Part: ayant, faisant, étant
- VERB-Fin: a, est, va, faut, ai, allez, peut, crois, sais, vais
- VERB-Part: attendant, disant, parlant, restant, allant, croyant, donnant, entendant, faisant, longeant
Pronouns, Determiners, Quantifiers
- Art
- DET: le, la, les, l', un, une, des, du, de, d'
- PRON: un
- Dem
- DET: ce, cette, ces, cet
- PRON: c', ça, ce, -ce, ceux, cela, celui, celle, ceci, celles
- Ind
- ADJ: autres
- DET: quelque, chaque, quelques, plusieurs, toute, certains, tel, tous, certaines, toutes
- PRON: on, tout, autres, un, quoi, quelqu'un, l'on, autre, tous, une
- Int
- DET: quel, quelle
- PRON: qu', quoi
- Neg
- DET: aucun, aucune
- PRON: rien, personne
- Prs
- DET: mon, votre, sa, son, notre, ma, ses, vos, nos, mes
- PRON: je, il, vous, y, j', ils, nous, se, tu, elle
- Rel
- ADV: où
- PRON: qui, que, où, qu', dont, lequel, laquelle, lesquelles
- Ord
- ADJ: vingt-et-unième
- Yes
- PRON: lui-même, vous-même, elle-même, moi-même, soi-même
- 1
- AUX-Fin: ai, suis, étais, avons, sommes, aurais, avais, serais, serons, aurai
- PRON: je, j', nous, me, moi, m', -moi, -nous, moi-même
- VERB: ai, crois, sais, vais, avais, pense, veux, vois, disons, aime
- VERB-Fin: ai, crois, sais, vais, avais, pense, veux, vois, disons, aime
- 2
- AUX-Fin: avez, êtes, étiez, as, aviez, ayez, es, seras, sois, soyez
- PRON: vous, tu, -vous, te, t', toi, -tu, vous-même, -toi
- VERB-Fin: allez, avez, continuez, voulez, voyez, pouvez, savez, passez, prenez, arrives
- VERB-Part: dites
- 3
- ADJ: autres
- AUX-Fin: est, a, était, sont, ont, avait, étaient, sera, soit, fait
- DET: mon, votre, sa, notre, ces, ma, quelque, vos, nos, mes
- PRON: c', il, on, ça, y, ce, ils, se, elle, s'
- VERB-Fin: a, est, va, faut, peut, avait, fait, ont, dit, voit
- Plur
- DET: votre, notre, vos, nos, leur, leurs
- Sing
- DET: mon, sa, son, ma, ses, mes, ta, ton
- PRON: mien, sien
Other Features
- Foreign
- Yes
- ADJ: Small, flying
- DET: A
- NOUN: World, aisthesis, poïésis, doctors
- Yes
- Person[psor]
- 1
- DET: mon, notre, ma, nos, mes
- PRON: mien
- 2
- DET: votre, vos, ta, ton
- 3
- DET: sa, son, ses, leur, leurs
- PRON: sien
- 1
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: être.
- This corpus uses 2 lemmas as auxiliaries (aux). Examples: avoir, être.
- This corpus uses 2 lemmas as passive auxiliaries (aux:pass). Examples: être, avoir.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--PRON (38)
- VERB-Fin--NOUN (176)
- VERB-Fin--NOUN-ADP(de) (1)
- VERB-Fin--PRON (1936)
- VERB-Inf--NOUN (6)
- VERB-Inf--PRON (15)
- VERB-Part--NOUN (41)
- VERB-Part--PRON (385)
- obj
- VERB--NOUN (5)
- VERB--PRON (5)
- VERB-Fin--NOUN (507)
- VERB-Fin--NOUN-ADP(dans) (2)
- VERB-Fin--NOUN-ADP(de) (16)
- VERB-Fin--NOUN-ADP(que) (1)
- VERB-Fin--PRON (280)
- VERB-Fin--PRON-ADP(de) (1)
- VERB-Inf--NOUN (212)
- VERB-Inf--NOUN-ADP(de) (2)
- VERB-Inf--PRON (123)
- VERB-Part--NOUN (136)
- VERB-Part--NOUN-ADP(de) (1)
- VERB-Part--PRON (81)
- VERB-Part--PRON-ADP(à) (1)
- iobj
- VERB--PRON (1)
- VERB-Fin--NOUN (71)
- VERB-Fin--PRON (301)
- VERB-Inf--NOUN (19)
- VERB-Inf--PRON (37)
- VERB-Part--NOUN (13)
- VERB-Part--PRON (44)
Relations Overview
- This corpus uses 16 relation subtypes: acl:relcl, advcl:cleft, aux:caus, aux:pass, csubj:pass, dep:comp, expl:subj, nmod:appos, nsubj:caus, nsubj:pass, obj:lvc, obl:agent, obl:arg, obl:mod, parataxis:insert, parataxis:parenth
- The following 1 main types are not used alone, they are always subtyped: expl
- The following 3 relation types are not used in this corpus at all: clf, list, goeswith