UD Italian KIParlaForest
Language: Italian (code: it)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.17 release.
The following people have contributed to making this treebank part of UD: Ludovica Pannitto, Eleonora Zucchini, Cristina Bosco, Caterina Mauri, Manuela Sanguinetti, Esther Cocco.
Repository: UD_Italian-KIParlaForest
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.17
License: CC BY-NC-SA 4.0
Genre: spoken
Questions, comments?
General annotation questions (either Italian-specific or cross-linguistic) can be raised in the main UD issue tracker.
You can report bugs in this treebank in the treebank-specific issue tracker on Github.
If you want to collaborate, please contact [ellepannitto (æt) gmail • com].
Development of the treebank happens in the UD repository but not directly in the final CoNLL-U files.
You may submit bug fixes as pull requests against the dev branch but you have to go to the folder called not-to-release and locate the source files there.
Contact the treebank maintainers if in doubt.
| Annotation | Source |
|---|---|
| Lemmas | annotated manually |
| UPOS | annotated manually, natively in UD style |
| XPOS | not available |
| Features | assigned by a program, with some manual corrections, but not a full manual verification |
| Relations | annotated manually, natively in UD style |
Description
The KIParla Forest treebank is a treebank of spoken Italian based on the KIParla Corpus
Acknowledgments
Statistics of UD Italian KIParlaForest
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – SCONJ – SYM – VERB – X
Features
Definite – Degree – ExtPos – Foreign – Gender – Mood – Number – NumType – Person – Poss – PronType – Tense – VerbForm
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – aux:pass – case – cc – ccomp – ccomp:reported – compound – conj – cop – csubj – dep – det – det:poss – det:predet – discourse – dislocated – expl – expl:impers – expl:pass – fixed – flat:foreign – flat:name – iobj – mark – nmod – nsubj – nsubj:pass – nummod – obj – obl – obl:agent – orphan – parataxis – reparandum – root – vocative – xcomp
Tokenization and Word Segmentation
- This corpus contains 1007 sentences, 9135 tokens and 9348 syntactic words.
- This corpus contains 256 tokens (3%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 50 types of words that contain both letters and punctuation. Examples: c', l', [TOWN_NAME], po', un', m', [PLACE_NAME], anda', cos', fa', s', anch', com', d', 'sta, 'sto, mezz', quant', sta', t', 'mbare, 'ste, 'sti, [PERSON_NAME], di', n', pranza', 'nte, [INHABITANTS_NAME], co', consegna', da', do', entra', mado', magna', mangia', neanch', organizza', parla', picc', quand', quell', quest', regala', spara', trattene', trent', u-, va'
- This corpus contains 212 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 64 types of multi-word tokens. Examples: nel, al, della, alla, alle, del, nella, dal, delle, all', dei, dell', nelle, dai, dalla, sulla, agli, ai, allo, coi, col, farmi, gliel', nei, preparati, dalle, darsi, farli, farlo, tradurli, addormentamme, averlo, compraglielo, dall', degli, dello, descriverlo, divertirmi, eccoci, esprimersi, esserci, farci, farle, fatte, fottiti, glielo, lavorarci, metterti, negli, nell'.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, SCONJ, SYM, VERB, X
- This corpus does not use the following tags: PART, PUNCT
- This corpus contains 54 lemmas tagged as pronouns (PRON): altro, c, ce, che, chi, chiunque, ci, ciò, cosa, cui, c~, egli, gli, glie, il, io, l', la, le, lei, li, lo, loro, lui, me, mi, miei, mio, molto, ne, nessuno, niente, noi, ognuno, po', poco, qualcosa, qualcuno, quale, quanto, quello, questo, se, si, stesso, tantissimo, te, ti, tu, tua, tutto, uno, ve, voi
- This corpus contains 36 lemmas tagged as determiners (DET): abbastanza, alcuno, altro, certo, che, degli, dei, del, delle, diverso, i, il, la, le, lo, mio, nessuno, ogni, più, plurimo, poco, qualche, quanto, quello, questa, questo, stesso, suo, tanto, tuo, tutto, u, un, una, uno, un~
- Out of the above, 15 lemmas occurred sometimes as PRON and sometimes as DET: altro, che, il, la, le, lo, mio, nessuno, poco, quanto, quello, questo, stesso, tutto, uno
- This corpus contains 10 lemmas tagged as auxiliaries (AUX): andare, avere, dovere, essere, fare, potere, sapere, stare, venire, volere
- Out of the above, 8 lemmas occurred sometimes as AUX and sometimes as VERB: andare, avere, essere, fare, sapere, stare, venire, volere
- There are 4 (de)verbal forms:
- Fin
- AUX: è, ho, era, ha, devi, sono, son, devo, hai, sei
- NOUN: tipo, incentivo, apostrofo, assistente, interrompo, mezzogiorno, raga
- VERB: è, so, fa, ha, diciamo, penso, era, fai, hai, ho
- Ger
- AUX: essendo, avendo
- VERB: precipitando, studiando, accorgendo, crescendo, uscendo, vedendo, aspettando, cercando, dicendo, facendo
- Inf
- AUX: essere, esse, aver, esser, fare
- VERB: fare, andare, dire, far, stare, avere, vedere, abitare, cambiare, censurare
- Part
- ADJ: immersa, preferita, colorate, fortunata, indaffarato, interessata, isolata, offerte, rotto, salato
- AUX: stata, stato
- NOUN: cioccolato, ristorante
- VERB: detto, fatto, fatta, sentito, vissuto, capito, mangiato, parlato, pensato, raccontato
Nominal Features
- Fem
- ADJ: mia, piccola, bella, tua, mezza, universitaria, altra, lontana, sola, tedesca
- ADJ-Part: immersa, preferita, colorate, fortunata, interessata, isolata, offerte
- ADV: cosa, lì, molte, tutta, tutte, vicina
- AUX: stata, son
- AUX-Part: stata
- CCONJ: oppure
- DET: la, le, una, un', delle, quella, mia, questa, tutte, altra
- NOUN: città, casa, realtà, università, cosa, parte, via, zona, macchina, volta
- NUM: prima, seconda
- PRON: lei, quella, questa, le, altra, la, quelle, tutta, tutte, una
- VERB: fatta, basta, chiusa, costruita, fo, legata, mangiata, preferita, ristrutturata, sputtanata
- VERB-Inf: sta'
- VERB-Part: fatta, costruita, legata, mangiata, preferita, ristrutturata, sputtanata, vista, abitata, andata
- X: s~
- Masc
- ADJ: esatto, miei, strano, grosso, piccolo, scorso, vero, bel, bellissimo, bello
- ADJ-Part: indaffarato, rotto, salato, zitto
- ADV: quanto, giusto, meno, bene, esatto, lontano, manco, pochino, quanti, vero
- AUX: son, stato, ero, stavo
- AUX-Part: stato
- DET: il, un, i, gli, dei, lo, tutti, questo, uno, 'sto
- NOUN: tipo, centro, anni, senso, minuti, uovo, anno, livello, piedi, sacco
- NOUN-Part: cioccolato
- NUM: primi, primo, secondo
- PRON: lo, quello, l', tutti, questo, uno, li, niente, quelli, altro
- PROPN: fermo
- VERB: detto, fatto, sentito, vissuto, capito, mangiato, parlato, pensato, raccontato, scoperto
- VERB-Part: detto, fatto, sentito, vissuto, capito, mangiato, parlato, pensato, raccontato, scoperto
- Plur
- ADJ: miei, pari, uguali, celiaci, ciclabili, coetanei, criminali, culturali, erboristiche, grande
- ADJ-Part: offerte
- ADV: molte, quanti, tutte
- AUX: son, sono, hanno, abbiamo, siamo, dobbiamo, devi, abbiam, han, stiamo
- AUX-Fin: son, sono, hanno, abbiamo, siamo, dobbiamo, abbiam, han, stiamo, avete
- CCONJ: oppure
- DET: le, i, gli, dei, delle, tutti, tutte, tante, 'sti, altri
- NOUN: anni, minuti, persone, piedi, eventi, famiglie, ore, volte, edifici, sottotitoli
- NUM: primi
- PRON: c', ci, tutti, li, quelli, ce, noi, miei, altri, le
- VERB: diciamo, sono, stanno, stiamo, son, abbiamo, avete, erano, hanno, siano
- VERB-Fin: diciamo, sono, stanno, stiamo, son, abbiamo, avete, erano, hanno, siano
- VERB-Part: sposti, andate, avessi, convinte, divisi, metti, resti, rimaste, uscissi
- Sing
- ADJ: grande, mia, esatto, difficile, piccola, bella, familiare, intollerante, strano, tua
- ADJ-Part: immersa, preferita, colorate, fortunata, indaffarato, interessata, isolata, rotto, salato, zitto
- ADV: quanto, cosa, giusto, bene, esatto, lontano, manco, pochino, tutta, vero
- AUX: è, ho, era, ha, devi, devo, hai, sei, fosse, sto
- AUX-Fin: è, ho, era, ha, devi, devo, hai, sei, fosse, sto
- AUX-Part: stata, stato
- DET: la, il, un, una, l', un', quella, lo, mia, questa
- NOUN: tipo, casa, centro, cosa, parte, realtà, senso, zona, via, macchina
- NOUN-Fin: tipo, incentivo, apostrofo, assistente, interrompo, mezzogiorno, raga
- NOUN-Part: cioccolato, ristorante
- NUM: prima, primo, seconda, secondo
- PRON: io, lo, mi, me, ti, l', te, quello, lei, niente
- PROPN: fermo
- SCONJ: che
- VERB: è, so, detto, fa, ha, penso, sta, era, fai, fatto
- VERB-Fin: è, so, fa, ha, penso, era, fai, hai, ho, sta
- VERB-Inf: sta'
- VERB-Part: detto, fatto, fatta, sentito, vissuto, capito, mangiato, parlato, pensato, raccontato
- Def
- DET: la, il, le, l', i, gli, lo
- PRON: l', le, lo, la
- Ind
- DET: un, una, un', uno
- PRON: uno
Degree and Polarity
- Abs
- ADJ: bellissimo, difficilissimo, bellissima, bruttissimo, fighissimi, fighissimo, salatissima
- ADV: tantissimo
Verbal Features
- Cnd
- AUX-Fin: potrebbe, sarebbe, vorrei, dovrebbe, dovresti, potresti, vorresti
- VERB-Fin: abiterei, piacerebbe, direi, abiteresti, metterei, ritrasferirei, saprei, vivrei, vorrei
- Imp
- AUX-Fin: abbiamo, stiamo
- VERB-Fin: prendi, trascrivi, vai, guarda, vedi, trovi, andati, aspetti, compri, conoscete
- VERB-Part: sgozzati
- Ind
- AUX-Fin: è, ho, era, ha, devi, sono, son, devo, hai, sei
- NOUN-Fin: tipo, incentivo, apostrofo, assistente, interrompo, mezzogiorno, raga
- VERB-Fin: è, so, fa, ha, diciamo, penso, era, fai, hai, ho
- Sub
- AUX-Fin: fosse, sia, dovessi, volessero
- VERB-Fin: sia, siano, trovi, fosse, sposti, stavi, aspiri, cerchi, chiami, compravi
- Fut
- AUX-Fin: sarà, dovrò, vorrò
- VERB-Fin: divertirò, avrà, avrò, capirai, costerà, darà, diventerà, divertirai, finiremo, finirà
- Imp
- AUX-Fin: era, fosse, volevo, avevo, ero, doveva, stava, potevo, aveva, avevano
- VERB-Fin: era, avevo, pensavo, aveva, erano, facevo, stavo, avevano, fosse, lasciavano
- Past
- ADJ-Part: immersa, preferita, colorate, fortunata, indaffarato, interessata, isolata, offerte, rotto, salato
- AUX-Fin: vorrò
- AUX-Part: stata, stato
- NOUN-Part: cioccolato
- VERB-Fin: stai, andrò, visiterò, vorrò
- VERB-Part: detto, fatto, fatta, sentito, vissuto, capito, mangiato, parlato, pensato, raccontato
- Pres
- AUX-Fin: è, ho, ha, devi, sono, son, devo, hai, sei, hanno
- NOUN-Fin: tipo, incentivo, apostrofo, assistente, interrompo, mezzogiorno, raga
- NOUN-Part: ristorante
- VERB-Fin: è, so, fa, ha, diciamo, penso, fai, hai, ho, sono
- VERB-Part: sgozzati
Pronouns, Determiners, Quantifiers
- Art
- DET: la, il, un, le, una, l', i, gli, un', lo
- PRON: l', le, lo, la, uno
- Dem
- ADJ: stessa
- DET: quella, questa, questo, sta, 'sta, 'sto, quel, 'sti, quell', quello
- PRON: quello, questo, quella, questa, quelli, 'sta, 'ste, quelle, ciò, quel
- Exc
- DET: che, quanti
- Ind
- ADJ: diverse, altro, altra, pochi, vari, pochissimi, tanti, tutto
- ADV: quant', tutte
- DET: dei, delle, altra, tante, altre, tutti, tutto, altri, certi, ogni
- NOUN: granché, po'
- PRON: niente, tutti, uno, altra, altro, nessuno, tutto, qualcosa, tutta, altri
- Int
- ADV: cos', cosa, quant', quanti
- DET: che, quanti
- PRON: che, cosa, cos', co~, quale, qual, quante
- Neg
- ADV: non, no, neanche, nemmeno
- Prs
- ADJ: mia, miei, tua, loro, nostro, propria, proprio, suo, suoi, tue
- ADV: cos'
- DET: mia, lo, mio, tua, la, miei, sua, sue
- PRON: c', ci, lo, io, mi, me, ti, si, ne, te
- Rel
- DET: che
- PRON: che, chi, cui, io, quanto, chiunque, quali
- SCONJ: che
- Tot
- DET: tutte, tutti, tutta, tutto
- PRON: quanti, tutta
- Card
- ADJ: mezz'
- NUM: due, quattro, tre, dodici, quattordici, undici, venti, cinquanta, cinque, dieci
- Ord
- ADJ: quarti, ultimi, ultimo
- NUM: prima, primi, primo, secondo
- Yes
- ADJ: mia, miei, tua, loro, propria, proprio, suo, suoi, tue, tuo
- DET: mia, mio, tua, miei, sua, sue
- PRON: miei, mie, tue
- 1
- AUX-Fin: ho, devo, abbiamo, sto, volevo, siamo, sono, avevo, dobbiamo, ero
- NOUN-Fin: tipo, incentivo, apostrofo, interrompo, mezzogiorno
- PRON: io, mi, me, c', ci, m', ce, noi, c~
- VERB-Fin: so, diciamo, penso, ho, dico, visto, avevo, pensavo, abito, mangio
- 2
- AUX-Fin: devi, hai, sei, puoi, vuoi, avete, dovete, dovresti, potresti, sai
- PRON: ti, te, tu, t', voi, ci, ve
- VERB-Fin: fai, hai, vuoi, prendi, sai, stai, metti, trascrivi, vai, dici
- VERB-Part: sgozzati
- 3
- ADV: cos'
- AUX-Fin: è, era, ha, son, sono, hanno, fosse, sia, viene, può
- DET: lo, la
- NOUN-Fin: assistente, raga
- PRON: lo, si, l', li, la, le, gli, lui, s', glie
- VERB-Fin: è, fa, ha, era, sono, sta, sa, stanno, dice, piace
Other Features
- ExtPos
- ADP
- ADP: fin, a, da, in
- ADV: fuori, rispetto, fino, intorno, vicino, davanti, più, prima
- ADV
- ADV: più
- SCONJ
- ADP: a, per, da
- ADV: anche, comunque, prima
- ADP
- Foreign
- Yes
- X: day, may, slut, fuck, ja, translation, wunderbar, you
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: essere.
- This corpus uses 7 lemmas as auxiliaries (aux). Examples: avere, dovere, essere, volere, potere, stare, sapere.
- This corpus uses 3 lemmas as passive auxiliaries (aux:pass). Examples: essere, venire, andare.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (1)
- VERB--PRON (8)
- VERB-Fin--NOUN (89)
- VERB-Fin--NOUN-ADP(di) (1)
- VERB-Fin--PRON (109)
- VERB-Ger--NOUN (1)
- VERB-Ger--PRON (3)
- VERB-Inf--NOUN (4)
- VERB-Inf--PRON (9)
- VERB-Part--NOUN (6)
- VERB-Part--PRON (25)
- obj
- VERB--NOUN (12)
- VERB--PRON (12)
- VERB-Fin--NOUN (134)
- VERB-Fin--NOUN-ADP(con) (1)
- VERB-Fin--NOUN-ADP(da) (1)
- VERB-Fin--NOUN-ADP(di) (1)
- VERB-Fin--PRON (108)
- VERB-Ger--NOUN (6)
- VERB-Ger--NOUN-ADP(di) (1)
- VERB-Inf--NOUN (41)
- VERB-Inf--PRON (39)
- VERB-Part--NOUN (23)
- VERB-Part--PRON (42)
- iobj
- VERB--PRON (2)
- VERB-Fin--PRON (75)
- VERB-Ger--PRON (1)
- VERB-Ger--PRON-ADP(a) (1)
- VERB-Inf--PRON (9)
- VERB-Part--PRON (27)
Reflexive Passive
- This corpus contains 1 lemmas that occur at least once with an expl:pass child. Examples: operare si
Relations Overview
- This corpus uses 11 relation subtypes: acl:relcl, aux:pass, ccomp:reported, det:poss, det:predet, expl:impers, expl:pass, flat:foreign, flat:name, nsubj:pass, obl:agent
- The following 1 main types are not used alone, they are always subtyped: flat
- The following 4 relation types are not used in this corpus at all: clf, list, goeswith, punct