MIDIA (Morfologia dell'Italiano in DIAcronia) è un corpus di testi scritti in lingua italiana, completamente
annotato con indicazione del lemma e della parte del discorso cui è ricondotta ciascuna occorrenza nei testi.
Il corpus, che si estende per un arco cronologico che va dall'inizio del XIII alla prima metà del XX secolo, è ripartito in
cinque periodi temporali e
sette tipologie testuali,
e comprende circa 7,8 milioni di occorrenze tratte da
circa 800 testi.
La selezione del corpus e gli strumenti di ricerca permettono
una facile estrazione di dati,
utili in particolare per lo studio della
formazione delle parole in italiano dal punto di vista diacronico,
ma fruibili anche per indagini linguistiche relative ad altri livelli di analisi. MIDIA è stato realizzato grazie al progetto Prin 2009 "La storia della formazione delle parole
in italiano" finanziato dal MIUR nel 2011. La consultazione a fini di ricerca è libera e gratuita.
Se pubblicate lavori basati sul nostro corpus vi chiediamo di
citare MIDIA e vi invitiamo a
contattarci (infocorpusmidia@gmail.com). Una più ampia presentazione del corpus MIDIA e alcuni primi lavori basati sul corpus sono stati pubblicati nel volume curato da Paolo D’Achille e Maria Grossmann, Per la storia della formazione delle parole in italiano. Un nuovo corpus in rete (MIDIA) e nuove prospettive di studio, Firenze, Franco Cesati Editore, 2017.
Per ulteriori informazioni sulle caratteristiche e sull'utilizzo di MIDIA, potete cliccare sull'icona
informazioni in alto a destra.
Il corpus MIDIA è distribuito con licenza Creative Commons BY-NC 4.0.