UD Italian MarkIT
Language: Italian (code: it
)
Family: IE
This treebank has been part of Universal Dependencies since the UD v2.10 release.
The following people have contributed to making this treebank part of UD: Teresa Paccosi, Alessio Palmero Aprosio, Sara Tonelli.
Repository: UD_Italian-MarkIT
Search this treebank on-line: PML-TQ
Download all treebanks: UD 2.15
License: CC BY 4.0
Genre: grammar-examples
Questions, comments? General annotation questions (either Italian-specific or cross-linguistic) can be raised in the main UD issue tracker. You can report bugs in this treebank in the treebank-specific issue tracker on Github. If you want to collaborate, please contact [aprosio (æt) fbk • eu]. Development of the treebank happens outside the UD repository. If there are bugs, either the original data source or the conversion procedure must be fixed. Do not submit pull requests against the UD repository.
Annotation | Source |
---|---|
Lemmas | assigned by a program, with some manual corrections, but not a full manual verification |
UPOS | assigned by a program, with some manual corrections, but not a full manual verification |
XPOS | assigned by a program, with some manual corrections, but not a full manual verification |
Features | assigned by a program, with some manual corrections, but not a full manual verification |
Relations | annotated manually, natively in UD style |
Description
The MarkIT resource contains around 800 sentences extracted from students’ essays manually annotated with syntactic depencendies. The treebank covers seven types of marked constructions, plus some ambiguous sentences whose syntax can be wrongly classified as marked.
MarkIT is a treebank of marked constructions in Italian, containing around 1,300 sentences with dependency annotation. First we automatically annotate the sentences using Tint, then a manual fix of the errors is performed on the whole dataset. The resource covers seven types of marked constructions plus some ambiguous sentences, whose syntax can be wrongly classified as marked.
Acknowledgments
The selection, extraction, and annotation of the dataset have been performed by Teresa Paccosi, Alessio Palmero Aprosio, and Sara Tonelli.
Statistics of UD Italian MarkIT
POS Tags
ADJ – ADP – ADV – AUX – CCONJ – DET – INTJ – NOUN – NUM – PRON – PROPN – PUNCT – SCONJ – VERB – X
Features
Clitic – Definite – Degree – Gender – Mood – Number – NumType – Person – Poss – PronType – Tense – VerbForm
Relations
acl – acl:relcl – advcl – advmod – amod – appos – aux – aux:pass – case – cc – ccomp – compound – conj – cop – csubj – det – det:poss – det:predet – discourse – dislocated – expl – expl:impers – expl:pass – fixed – flat – flat:foreign – flat:name – iobj – mark – nmod – nsubj – nsubj:outer – nsubj:pass – nummod – obj – obl – obl:agent – orphan – parataxis – punct – root – xcomp
Tokenization and Word Segmentation
- This corpus contains 1292 sentences, 38237 tokens and 40488 syntactic words.
- This corpus contains 9 tokens (0%) that are not followed by a space.
- This corpus does not contain words with spaces.
- This corpus contains 63 types of words that contain both letters and punctuation. Examples: l', c', un', d', quest', E', cos', A., po', F., B., M., P., quell', G., anch', dev', ecc., ex-senatore, quegl', super-io, tutt', 'Brain', 'captatio, 'mappare', 'rivoluzionare, 'scienza', 'x', 'y', C., C.E.E., E., H., J., Merleau-Ponty, N., P.P., Roma-Bari, Stato-giustizia, benevolentiae', cinquant', com', confronto-scontro, dis-armonia, economico-politiche, etc., hi-tech, latino-americana, mass-media, musica-arte
- This corpus contains 2246 multi-word tokens. On average, one multi-word token consists of 2.00 syntactic words.
- There are 239 types of multi-word tokens. Examples: della, del, nel, dell', al, alla, nella, all', dei, delle, nell', dal, dalla, ai, nei, alle, degli, sul, dall', nelle, dello, negli, agli, sulla, dalle, sull', allo, dagli, dai, nello, sulle, farlo, farsi, sugli, col, dallo, focalizzarsi, sentirsi, sui, sullo, sviluppatasi, vederla, attivarsi, aumentarla, avvicinarci, avvicinarsi, considerarla, essendoci, esserlo, giudicarti.
Morphology
Tags
- This corpus uses 15 UPOS tags out of 17 possible: ADJ, ADP, ADV, AUX, CCONJ, DET, INTJ, NOUN, NUM, PRON, PROPN, PUNCT, SCONJ, VERB, X
- This corpus does not use the following tags: PART, SYM
- This corpus contains 80 lemmas tagged as pronouns (PRON): Qual, alcuni, alcuno, altra, altri, altro, c', ce, che, chi, ci, ciò, coloro, colui, cosa, cui, diverso, egli, entrambi, essa, essi, esso, gli, il, io, l', la, le, lei, li, lo, loro, lui, me, medesimo, mi, mio, molte, molti, molto, ne, nessuno, niente, noi, nostro, nulla, ognuno, pochi, poco, primo, qualcosa, qualcuno, quale, quali, quanto, quella, quelli, quello, questa, queste, questi, questo, se, si, stesso, suo, suoi, sè, sé, tanti, tanto, te, ti, tuo, tutti, tutto, uno, ve, vi, voi
- This corpus contains 58 lemmas tagged as determiners (DET): Del, I, alcun, alcuno, altre, altro, altrui, certo, che, ciascuno, cui, degli, dei, della, di, diverso, entrambi, il, l', la, le, lo, loro, mio, molto, nessun, nessuno, nostro, numeroso, ogni, più, poco, proprio, qualche, qualcun, qualcuno, quale, qualsiasi, qualsivoglia, qualunque, quanto, quella, quello, questo, suo, svariato, tale, tanto, troppo, tuo, tutti, tutto, un, un', una, uno, vario, vostro
- Out of the above, 29 lemmas occurred sometimes as PRON and sometimes as DET: alcuno, altro, che, cui, diverso, entrambi, il, l', la, le, lo, loro, mio, molto, nessuno, nostro, poco, qualcuno, quale, quanto, quella, quello, questo, suo, tanto, tuo, tutti, tutto, uno
- This corpus contains 10 lemmas tagged as auxiliaries (AUX): andare, avere, dovere, essere, fare, potere, sapere, stare, venire, volere
- Out of the above, 10 lemmas occurred sometimes as AUX and sometimes as VERB: andare, avere, dovere, essere, fare, potere, sapere, stare, venire, volere
- There are 4 (de)verbal forms:
- Fin
- AUX: è, sono, ha, può, hanno, era, possiamo, fu, deve, viene
- CCONJ: e
- VERB: è, ha, sono, fa, dice, rende, sta, abbiamo, era, trova
- Ger
- AUX: essendo, potendo
- VERB: facendo, essendo, arrivando, affermando, andando, dando, lavorando, partendo, considerando, credendo
- Inf
- AUX: essere, aver, poter, dover, esser, voler, avere
- VERB: far, fare, essere, trovare, dare, avere, capire, vivere, raggiungere, dire
- Part
- ADJ: diffuso
- AUX: stata, stato, stati, potuto, state, voluto, potuta
- NOUN: stato
- VERB: avuto, dato, fatto, visto, creata, inteso, stato, fatta, porta, cercato
Nominal Features
- Fem
- ADJ: stessa, diverse, moderna, prima, seconda, unica, italiana, umana, nuova, nuove
- ADP: a
- AUX-Part: stata, state, potuta
- CCONJ: e
- DET: la, le, una, questa, sua, l', nostra, queste, sue, propria
- NOUN: vita, società, persone, scienza, felicità, parte, amicizia, ricerca, storia, filosofia
- PRON: ci, la, questa, vi, essa, quella, le, mi, qualcosa, sé
- VERB: creata, fatta, porta, sviluppata, considerata, vista, avuta, composta, fatte, sentita
- VERB-Part: creata, fatta, porta, sviluppata, considerata, vista, avuta, composta, fatte, sentita
- Masc
- ADJ: stesso, grande, importante, primo, umano, possibile, difficile, piccolo, grandi, vero
- ADJ-Part: diffuso
- ADV: parecchio
- AUX-Part: stato, stati, potuto, voluto
- DET: il, un, i, gli, questo, lo, suo, questi, ogni, l'
- NOUN: uomo, tempo, esempio, anni, modo, mondo, amico, paese, stato, motivo
- NOUN-Part: stato
- PRON: si, lo, questo, ci, ciò, quello, tutti, altri, lui, tutto
- PROPN: Human, brain, project
- SCONJ: perché
- VERB-Part: avuto, dato, fatto, visto, inteso, stato, cercato, detto, legati, permesso
- Plur
- ADJ: diverse, grandi, importanti, nuove, nuovi, primi, ultimi, felici, materiali, molteplici
- AUX-Fin: sono, hanno, possiamo, siamo, possono, dobbiamo, erano, siano, abbiamo, vengono
- AUX-Part: stati, state
- CCONJ: e
- DET: i, le, gli, questi, queste, tutti, dei, molti, sue, alcuni
- NOUN: persone, anni, cose, stati, uomini, cittadini, forme, giovani, paesi, artisti
- PRON: ci, noi, cui, vi, tutti, altri, quali, molti, le, li
- VERB: abbiamo, troviamo, sono, hanno, sorpassano, fanno, siano, erano, nascono, pensano
- VERB-Fin: abbiamo, troviamo, sono, hanno, sorpassano, fanno, siano, erano, nascono, pensano
- VERB-Part: legati, stati, elencati, fatte, ottenuti, soddisfatti, abituati, compresi, confrontati, conosciuti
- Sing
- ADJ: stesso, grande, importante, possibile, primo, stessa, umano, difficile, piccolo, moderna
- ADJ-Part: diffuso
- ADP: a
- ADV: parecchio
- AUX-Fin: è, ha, può, sono, era, fu, deve, viene, sia, E'
- AUX-Part: stata, stato, potuto, voluto, potuta
- CCONJ-Fin: e
- DET: la, il, un, una, l', questo, lo, questa, suo, sua
- NOUN: vita, uomo, tempo, società, scienza, felicità, esempio, parte, modo, amicizia
- NOUN-Part: stato
- PRON: si, lo, questo, ciò, la, quello, quale, questa, essa, chi
- PROPN: Human, brain, project
- SCONJ: perché
- VERB: è, ha, fa, porta, dice, avuto, rende, sta, era, trova
- VERB-Fin: è, ha, fa, dice, rende, sta, era, trova, porta, spinge
- VERB-Part: avuto, dato, fatto, visto, creata, inteso, stato, fatta, porta, cercato
- Def
- DET: la, il, i, le, l', gli, lo, un'
- PRON: lo, la
- Ind
- DET: un, una, uno, dei, delle, degli, un', del, della, di
Degree and Polarity
- Abs
- ADJ: scarsissime, moltissime, bassissima, bellissimo, costosissimo, difficilissimo, elevatissimo, famosissimi, famosissimo, grandissima
- ADV: benissimo
- DET: moltissimi, moltissime
- Cmp
- ADJ: maggiore, maggior, miglior
Verbal Features
- Cnd
- AUX-Fin: dovrebbe, potrebbe, sarebbe, potrebbero, vorrei, dovrebbero, potremmo, avrebbe, avrebbero, vorrebbe
- VERB-Fin: sarebbe, avrebbe, bisognerebbe, sarebbero, significherebbe, verrebbe, Parlerebbe, appagherebbe, basterebbe, darebbe
- Imp
- VERB-Fin: desta, invariate
- Ind
- AUX-Fin: è, sono, ha, può, hanno, era, possiamo, fu, deve, viene
- CCONJ-Fin: e
- VERB-Fin: è, ha, sono, fa, dice, rende, sta, abbiamo, era, trova
- VERB-Part: porta, vista
- Sub
- AUX-Fin: sia, possa, siano, abbia, potesse, fosse, possano, stia, abbiano, abbiate
- VERB-Fin: sia, siano, fosse, diventi, esistano, sviluppi, abbia, abbiano, accada, cambi
- Fut
- AUX-Fin: sarà, potrà, saranno, verrà, dovrà, dovranno, potranno
- VERB-Fin: sarà, porterà, avrà, daranno, farà, impedirà, permetterà, saranno, troverà, accadrà
- Imp
- AUX-Fin: era, erano, aveva, potesse, fosse, potevano, avevano, dovevano, volevo, avevo
- VERB-Fin: era, erano, affermava, fosse, sosteneva, andava, iniziava, legava, portava, stava
- Past
- ADJ-Part: diffuso
- AUX-Fin: fu, furono, venne, vennero, avremmo, poté
- AUX-Part: stata, stato, stati, potuto, state, voluto, potuta
- NOUN-Part: stato
- VERB-Fin: fu, affermò, diede, fece, portò, ebbe, furono, iniziarono, nacquero, portarono
- VERB-Part: avuto, dato, fatto, visto, creata, inteso, stato, fatta, cercato, detto
- Pres
- AUX-Fin: è, sono, ha, può, hanno, possiamo, deve, viene, sia, siamo
- CCONJ-Fin: e
- VERB-Fin: è, ha, sono, fa, dice, rende, sta, abbiamo, trova, troviamo
- VERB-Part: riguardanti, aderenti, appartenente, credenti, dipendenti, erranti, esistente, facenti, inquinanti, pensante
Pronouns, Determiners, Quantifiers
- Art
- DET: la, il, un, i, le, una, l', gli, lo, uno
- PRON: la, lo
- Dem
- DET: questo, questa, questi, queste, quest', quel, quella, quei, quell', quelle
- PRON: questo, ciò, quello, questa, quella, queste, quelli, colui, coloro, quelle
- Ind
- ADJ: molta
- DET: ogni, molti, tutto, alcuni, molte, qualche, qualsiasi, nessun, diversi, pochi
- PRON: tutti, altri, tutto, molti, uno, qualcosa, altro, nessuno, ognuno, altra
- Int
- DET: che, quanto
- PRON: cosa, cos', chi, quale
- Neg
- ADV: non, nemmeno, neanche, neppure, no
- Prs
- ADJ: proprio, propria, proprie, propri
- DET: suo, sua, loro, nostra, nostro, sue, propria, nostre, suoi, propri
- PRON: si, ci, lo, la, noi, ne, vi, essa, loro, lui
- Rel
- DET: cui
- PRON: cui, quale, chi, che, quali, quanto, quanti
- Tot
- DET: tutti, tutte, tutto, tutta, entrambi
- Card
- NUM: due, tre, Novecento, quattro, dieci, mille, cinque, duemila, tredici, '900
- Ord
- ADJ: primo, prima, seconda, primi, secondo, ultimo, prime, ultimi, 1°, II
- PRON: prima
- Yes
- ADJ: proprio, propria, proprie, propri
- DET: suo, sua, loro, nostra, nostro, sue, propria, nostre, suoi, propri
- PRON: nostro, nostre, sua, suo
- 1
- AUX-Fin: sono, possiamo, siamo, sia, dobbiamo, possa, abbiamo, ho, abbia, vorrei
- PRON: ci, noi, mi, io, me, ce
- VERB-Fin: abbiamo, troviamo, sono, credo, sappiamo, sia, cerchiamo, ritroviamo, siamo, viviamo
- 2
- AUX-Fin: abbiate, avresti
- PRON: vi, ti, Ve, te, voi
- VERB-Fin: basti, cerchi, diventi, fai, accorgi, allarghi, arrivi, derivi, invariate, migliorate
- 3
- AUX-Fin: è, ha, può, sono, hanno, era, fu, deve, viene, E'
- CCONJ-Fin: e
- DET: tutti, tutto
- PRON: si, lo, questo, la, ciò, ne, cui, quello, quale, questa
- VERB-Fin: è, ha, fa, dice, rende, sta, era, trova, porta, sono
- VERB-Part: porta
Other Features
- Clitic
- Yes
- PRON: si, ci, lo, la, ne, vi, le, se, mi, gli
- Yes
Syntax
Auxiliary Verbs and Copula
- This corpus uses 1 lemmas as copulas (cop). Examples: essere.
- This corpus uses 10 lemmas as auxiliaries (aux). Examples: potere, avere, essere, dovere, volere, stare, andare, fare, sapere, venire.
- This corpus uses 4 lemmas as passive auxiliaries (aux:pass). Examples: essere, venire, stare, andare.
Core Arguments, Oblique Arguments and Adjuncts
Here we consider only relations between verbs (parent) and nouns or pronouns (child).
- nsubj
- VERB--NOUN (1)
- VERB--PRON (1)
- VERB-Fin--NOUN (504)
- VERB-Fin--PRON (732)
- VERB-Ger--NOUN (10)
- VERB-Ger--PRON (5)
- VERB-Inf--NOUN (74)
- VERB-Inf--PRON (58)
- VERB-Part--NOUN (102)
- VERB-Part--PRON (112)
- obj
- VERB--NOUN (2)
- VERB--PRON (1)
- VERB-Fin--NOUN (515)
- VERB-Fin--NOUN-ADP(di) (1)
- VERB-Fin--NOUN-ADP(durante) (1)
- VERB-Fin--PRON (283)
- VERB-Ger--NOUN (81)
- VERB-Ger--PRON (19)
- VERB-Inf--NOUN (446)
- VERB-Inf--NOUN-ADP(a) (2)
- VERB-Inf--NOUN-ADP(quale) (1)
- VERB-Inf--PRON (180)
- VERB-Part--NOUN (118)
- VERB-Part--PRON (59)
- iobj
- VERB-Fin--PRON (105)
- VERB-Ger--PRON (9)
- VERB-Inf--PRON (27)
- VERB-Part--PRON (22)
Reflexive Passive
- This corpus contains 3 lemmas that occur at least once with an expl:pass child. Examples: distinguere si, fare si, trovare si
Relations Overview
- This corpus uses 11 relation subtypes: acl:relcl, aux:pass, det:poss, det:predet, expl:impers, expl:pass, flat:foreign, flat:name, nsubj:outer, nsubj:pass, obl:agent
- The following 6 relation types are not used in this corpus at all: vocative, clf, list, goeswith, reparandum, dep