GILEAD
Leadership Heade
Poste Italiane
Cerca
Close this search box.

Intelligenza artificiale, a che punto sono gli Llm italiani

intelligenza artificiale arte cultura tecnologia

Spinta dal mercato, dall’Europa, dal Governo italiano, l’intelligenza artificiale del Paese ha iniziato a correre. O perlomeno a provarci. Aziende ed enti di ricerca si affrettano a lavorare sui propri modelli – o meglio, famiglie di modelli – di intelligenze artificiali.

Un compito non facile che però è prioritario: sia il governo che il veicolo che finora ha promesso più soldi per l’AI (Cdp venture capital) puntano a favorire la nascita di campioni italiani dell’intelligenza artificiale e di modelli di linguaggio competitivi, anche se i vari Gpt, Llama e Gemini rimarranno con ogni probabilità irraggiungibili.

Tra chi ha già annunciato i propri piani, chi lavora sottotraccia e chi ha già raggiunto qualche risultato concreto, ecco un riepilogo dei progetti italiani. Partendo da chi sembra più avanti e prendendo in considerazione i modelli che provano a poggiare non su basi esistenti, come Llama (usato per l’italiano Llamantino) o il modello della francese Mistral (utilizzato per Dante, progetto targato Sapienza). Anche Mistral, va ricordato, in ogni caso è stato addestrato nel ‘tempio’ del supercalcolo bolognese: il supercomputer Leonardo, sesto più potente al mondo.

Modello ‘Italia’ di iGenius

Partiamo dall’ultimo annuncio: iGenius, l’azienda di Uljan Sharka, ha presentato “Italia” (non più ‘modello Italia’ come da annuncio di qualche mese fa) un modello di linguaggio di grandi dimensioni addestrato con fonti in italiano e rilasciato Open Source con licenza Mit. iGenius è stata la prima ad annunciare un modello, qualche mese fa: il risultato sarà destinato alle aziende di settori altamente regolamentati e alla Pa. Il progetto, scaricabile sul sito web di iGenius, raggiunge la tappa fondamentale della ‘public release’, che permette di testare le capacità dell’AI messa a punto dall’azienda in 5 mesi grazie alla capacità di calcolo del supercomputer Leonardo del Cineca. Il lavoro continuerà anche dopo il primo rilascio, con nuove versioni “ancora più potenti, accurate e versatili, nonché ad una versione multilingua”. Il modello è stato addestrato da zero in italiano su oltre mille miliardi di parole, attraverso fonti pubbliche, dati sintetici e contenuti di partner di iGenius. Per il momento il modello foundational (alla base di altri modelli sviluppati successivamente) di Italia ha un’architettura da 9 miliardi di parametri, con 50.000 token. Secondo iGenius il suo ‘Tokenizer’ proprietario riduce l’efficienza in termini di costi e le risorse necessarie per servire il modello. “Stiamo lavorando per rilasciare a breve una versione di Italia da 10 miliardi di parametri e, successivamente, una versione multilingua,” ha spiegato Sharka.

Minerva, Sapienza

A inizio maggio è stata resa disponibile una public release della famiglia di Large language model italiani che sembra più avanti rispetto alle altre iniziative: Minerva, la famiglia di modelli creata dal team della Sapienza guidato dal professore Roberto Navigli. Ci sono tre diversi modelli (da 350 milioni, 1 miliardo e 3 miliardi di parametri) addestrati da zero su contenuti in lingua italiana. Ma sulla roadmap futura di Minerva Navigli ha svelato a Fortune Italia qualche dettaglio: il team della Sapienza (il cui modello ha mostrato i limiti di generazione di contenuti tossici che hanno caratterizzato anche i modelli più avanzati, ha spiegato Navigli su Linkedin) sta lavorando per ampliarne le capacità e la potenza.

Intelligenza artificiale, Minerva brucia le tappe: a giugno il quarto modello

Velvet, Almawave

Anche in questo caso si parla di uno dei modelli creati grazie a Leonardo. Almawave è una società italiana quotata su Euronext Growth Milan e parte del Gruppo Almaviva, ha annunciato un accordo con il Cineca (anticipato da Fortune Italia) per lo sviluppo di Velvet, un modello italiano anche in questo caso open source (come tutti quelli realizzati grazie al supercomputer) multilingua e multimodale (testi, audio, video). Anche in questo caso il focus è sulla lingua italiana, ma Almawave ha precisato che saranno implementati il portoghese brasiliano e lo swahili: l’azienda è attiva in Sud America e in Africa, e ultimamente ha stretto accordi per portare le sue soluzioni AI anche in Medio Oriente. Il rilascio della prima versione di Velvet è previsto alla fine del 2024 dall’azienda guidata da Valeria Sandei, che è attiva da anni nel settore AI.

Chi lavora sottotraccia: Istella

La società nata dall’esperienza del motore di ricerca italiano, che ha come presidente l’ex governatore della Sardegna Renato Soru, finora non ha fatto annunci. Ma è al lavoro (come scritto da Fortune Italia) per lo sviluppo di Llm: per questo è stato siglato un accordo con il consorzio Cineca che ospita Leonardo. Il lavoro sugli llm di Istella è agli inizi (per questo non sono stati fatti annunci) ma l’azienda viene dall’esperienza del motore di ricerca e da una attività di lunga data di raccolta di dati dal web: materiale prezioso per la creazione di un llm. Renato Soru, presidente di Istella, ha svelato a Fortune Italia qualche dettaglio: innanzitutto che lo spinoff di Tiscali lavora non per “essere il primo, ma per essere il migliore” nel campo dei modelli italiani di intelligenza artificiale. Inoltre Istella sta lavorando anche da ‘consulente’ per i modelli che la stessa Tiscali Italia deve sviluppare nel progetto Villanova, dopo la selezione a fine 2023 nel progetto europeo Ipcei-Cis per lo sviluppo di un’intelligenza artificiale generativa multimodale . Il compito di Villanova è istituire un laboratorio all’avanguardia nell’ambito GenAI. Nella collaborazione con Tiscali i modelli su cui lavorerà Istella saranno in spagnolo, francese, tedesco e italiano (più l’indispensabile inglese). Ad aiutare l’azienda arriverà l’ex Ad di Engineering Paolo Pandozy. “Ha un’esperienza straordinaria nell’industrializzazione dei prodotti tecnologici”, spiega Soru. “Siamo felici e orgogliosi dell’accordo che abbiamo fatto con il Cineca”.

Il supercomputer di Fastweb e gli altri modelli

Fastweb vuole creare un’intelligenza artificiale completamente made in Italy. Il progetto sta entrando nella fase operativa, dopo l’acquisto a fine del 2023 del supercomputer Nvidia che verrà inaugurato a inizio luglio in un data center della Lombardia, ha spiegato recentemente il country manager Walter Renna. Il supercomputer verrà collegato con gli altri data center nazionali di Fastweb. Renna ha parlato di 1.500 miliardi di token in italiano e frutto di accordi con attori come Bignami Edizioni, ma anche documenti pubblici come le Gazzette ufficiali e dati presi dal web e a prova di copyright. Tra gli altri modelli da segnalare in Italia, ci sono Magiq, sviluppato dall’italiana Synapsia ma insieme a un’azienda Usa, My Maia, e i già menzionati Llamantino, sviluppato dall’Università di Bari, e Dante, altro progetto della Sapienza sviluppato da Fabrizio Silvestri.

 

 

Nell’immagine in evidenza, l’installazione ‘Leonardo Da Vinci: Wisdom of AI Light Exhibition’ nell’ X Media Art Museum (XMAM) di Istanbul, nel 2022. EPA/SEDAT SUNA

Gileadpro
Leadership Forum
Poste Italiane

Leggi anche

Ultima ora

ABBIAMO UN'OFFERTA PER TE

€2 per 1 mese di Fortune

Oltre 100 articoli in anteprima di business ed economia ogni mese

Approfittane ora per ottenere in esclusiva:

Fortune è un marchio Fortune Media IP Limited usato sotto licenza.