E’ iniziato ieri, a Vienna, il 63° meeting della ACL (Association for Computational Linguistics) la più importante associazione di studiosi di linguistica computazione e intelligenza artificiale (link) cui partecipano oltre 6.000 scienziati e leader del settore dell’elaborazione del linguaggio naturale.
A dirigere il congresso è Roberto Navigli, docente alla Sapienza di Roma dove dirige Sapienza NLP, un gruppo di ricerca del dipartimento di Ingegneria Informatica, Automatica e Gestionale dedicato allo sviluppo di sistemi di intelligenza artificiale e alla loro applicazione in vari campi.
Il Natural Language Processing è la parte dell’AI che lavora per insegnare ai computer a comprendere, interpretare e generare il linguaggio umano. Si tratta quindi di un elemento chiave che ha determinato il successo della AI conversazionale (ad esempio ChatGPT, Gemini, Mistral) “democratizzandone” l’utilizzo, ovvero mettendolo a disposizioni di tutti, a prescindere dalla propria competenza informatica.
In che lingua addestriamo i modelli di Intelligenza Artificiale?
A questo punto l’elemento chiave diventa l’addestramento dei modelli di intelligenza artificiale
Un LM (large language model) addestrato in inglese tenderà ovviamente a riprodurre i riferimenti culturali, valoriali, di visione della realtà e del mondo tipici della cultura che ha dato vita alla lingua inglese. E questo vale non solo per le frasi idiomatiche ma per quelle che potremmo definire visione del mondo, weltanschauung.
Il gruppo di lavoro del prof. Navigli ha così lavorato, negli ultimi anni, a costruire un LLL basato sulla lingua italiana, ovvero addestrato in italiano, arrivato oggi al modello 7B che così si presenta sul sito https://nlp.uniroma1.it/posts/34:
I Large Language Model (LLM) stanno trasformando il nostro modo di interagire con la tecnologia, ma la maggior parte è progettata con l’inglese come focus principale, spesso trascurando altre lingue. Ecco Minerva AI , la prima famiglia di LLM sviluppata da zero con un focus primario sulla lingua italiana.
Minerva apre nuovi orizzonti dando priorità all’italiano nel suo nucleo, a differenza della maggior parte dei modelli che adattano le basi incentrate sull’inglese ad altre lingue. Questo permette a Minerva di eccellere nel catturare la ricchezza del vocabolario, della sintassi e delle sfumature culturali italiane, stabilendo un nuovo standard per l’intelligenza artificiale in lingua italiana. Ma Minerva non riguarda solo la lingua: si occupa di inclusività ed equità nell’intelligenza artificiale. Concentrandosi su una lingua diversa dall’inglese, Minerva affronta i pregiudizi globali nella ricerca sull’intelligenza artificiale e apre la strada a una tecnologia più equa. Basato interamente su dati open source, Minerva promuove anche la trasparenza, offrendo a ricercatori e sviluppatori una piattaforma per l’innovazione.
Dall’Università La Sapienza, nel 2016, ha preso poi avvio la startup deep-tech Babelscape . L’azienda si occupa di elaborazione del linguaggio naturale (NLP) multilingue con la missione principale di superare le barriere linguistiche e consentire la comprensione e la generazione di testo in un’ampia gamma di lingue e applicazioni.
Grazie al trasferimento tecnologico del gruppo di ricerca NLP di fama internazionale guidato dal Prof. Roberto Navigli Babelscape unisce la ricerca accademica all’avanguardia con soluzioni industriali innovative, tra cui l’integrazione di modelli linguistici di grandi dimensioni (LLM) di nuova generazione per la comprensione e la generazione multilingue. Babelscape sta guidando l’industrializzazione di Minerva, ottimizzando il modello per applicazioni reali che richiedono soluzioni di intelligenza artificiale ad alte prestazioni. Da qui la collaborazione con il supercomputer Leonardo del CINECA, e quindi di un hardware all’avanguardia.