Questo articolo è stato pubblicato da questo sito
C’è un suggestivo progetto in fase di sviluppo a Google, il suo nome è Imagen e il suo funzionamento è presto detto: è un generatore di immagini che interpretano un testo. Detto anche text-to-image, questo metodo sfrutta il machine learning e l’intelligenza artificiale per comprendere un’indicazione scritta e trasformarla in un input al sistema che pesca da un ampio database di foto, oggetti o animali miscelando gli elementi in modo realistico e spesso con risultati sorprendenti. Per dimostrare la bontà di questa tecnologia per ora ancora in fase di test chiuso, Google ha diffuso alcune immagini in cui il sistema Imogen è riuscito con grande efficacia a generare immagini da richieste anche assurde.
“Una tazza a forma di fragola riempita di semi di sesamo che galleggia in un mare di cioccolato fuso” oppure “Un polipo alieno con in mano un quotidiano che entra all’interno di un portale spaziale” o ancora “Un cervello che cavalca un razzo spaziale verso la Luna”, ma anche “Un gigantesco cobra di mais all’interno di un campo coltivato” e perché non citare anche la foto di “Un astronauta procione che osserva la città di notte”. Le potenzialità di Imagen sono pressoché illimitate, come funziona questo metodo? Secondo quanto anticipato sul sito ufficiale dal cosiddetto Brain Team di Google, il sistema che genera immagini a partire da un testo scritto complesso sfruttando la combinazione di machine Learning e i.a. che riesce a interpretare correttamente una descrizione testuale per isolare i vari elementi da unire poi come un collage grazie al fotoritocco. Il sistema è in fase di addestramento e quindi andrà a migliorare in modo esponenziale col tempo anche grazie all’intervento umano che corregge e segnala eventuali imperfezioni.
La pratica utilizzata è quella dei modelli di diffusione da testo a immagine con esempi di base che poi vengono utilizzati per richieste simili, poggiandosi su set di coppie di testi-immagini da combinare. Il sistema avanza passo a passo nella frase aggiungendo contenuto ed eventualmente ricalibrando ciò che ha appena generato. Per il momento non ci si può ancora divertire con Imagen non solo perché il progetto è ancora in fase di sviluppo, ma anche per evitare sicure problematiche dovute al fatto che nei database potrebbero esserci coppie di immagini-descrizioni che sono stereotipi o che potrebbero creare rappresentazioni dannose per il pubblico. I precedenti sono lampanti, come per esempio l’associazione dei tag di primati a persone afroamericane apparse nel 2015 in Google Foto. Insomma, è comprensibile che prima di diffondere questo tool Google voglia assicurarsi che il sistema non caschi in problemi che potrebbero generare polemiche. Quel che è certo è che quando sarà ufficiale Imagen diventerà un fenomeno di sicuro impatto sui social grazie alla sua straordinaria capacità di generare immagini, anche le più fantasiose e creative, senza dimenticare applicazioni commerciali oppure montaggi con foto personali.