Skip to main content

Dall-e-2 di Elon Musk ha dovuto affrettarsi a correggere i difetti più evidenti del suo modello di creazione di immagini. Ora si appresta a navigare in mare aperto

Will Douglas Heaven

Come dice “MIT Technology Review” ora OpenAI venderà il suo programma di creazione di immagini DALL-E-2 al milione di persone in lista d’attesa. Circa 100.000 persone hanno giocato con DALL-E 2 dal suo lancio su invito ad aprile. Oggi, l’azienda con sede a San Francisco sta aprendo le porte a un numero di utenti 10 volte superiore per trasformare l’AI in un servizio a pagamento. “Abbiamo riscontrato un interesse molto più grande rispetto a GPT-3“, afferma Peter Welinder, vicepresidente per il prodotto e partnership di OpenAI.

I clienti paganti potranno ora utilizzare le immagini che creano con DALL-E in progetti commerciali, come illustrazioni in libri per bambini, concept art per film, giochi e brochure di marketing. Ma il lancio del prodotto sarà anche il test più importante per l’implementazione della sua potente intelligenza artificiale, che si basa sull’assistenza continua ai clienti per fronteggiare i problemi non appena si presentano.

Un abbonamento DALL-E beta non costerà una fortuna: con 15 dollari si acquistano 115 crediti. Ognuno di questi consente di inviare un messaggio di testo all’AI, che restituisce quattro immagini alla volta. In altre parole, 15 dollari per 460 immagini. Inoltre, gli utenti ottengono 50 crediti gratuiti nel primo mese e 15 crediti gratuiti un mese dopo. Tuttavia, gli utenti che generano decine di immagini alla volta potrebbero presto bruciare la quota.

In vista di questo lancio, OpenAI ha già iniziato a collaborare con i primi utenti che hanno prodotto un flusso costante di immagini surreali e sorprendenti: mash-up di simpatici animali, immagini di grande precisione che imitano lo stile dei veri fotografimoodboard per ristoranti e design di sneaker. Ciò ha consentito a OpenAI di esplorare i punti di forza e di debolezza del suo strumento. 

OpenAI ha già adottato misure per controllare il tipo di immagini che gli utenti possono produrre. Per esempio, le persone non possono generare immagini che mostrano individui noti. In preparazione di questo lancio commerciale, OpenAI ha affrontato un altro grave problema segnalato dai primi utenti. La versione di DALL-E rilasciata ad aprile spesso produceva immagini che riflettevano chiari pregiudizi di genere e razziali, come immagini di amministratori delegati e vigili del fuoco che erano tutti uomini bianchi e insegnanti e infermiere che erano tutte donne bianche.

Il 18 luglio, OpenAI ha annunciato una correzione. Quando gli utenti chiedono a DALL-E 2 di generare un’immagine che includa un gruppo di persone, l’AI ora attinge a un set di dati di campioni, secondo OpenAI, più rappresentativo della diversità globale, come confermato dagli stessi utenti.

È una correzione necessaria, ma superficiale. OpenAI affronta molti dei problemi segnalati dai suoi utenti filtrando ciò che le persone possono chiedere o censurando ciò che il modello sottostante produce. Ma non sta risolvendo i problemi del modello stesso o dei dati su cui è stato addestrato. Questo approccio consente a OpenAI di apportare soluzioni rapide, ma non risolve i nodi di fondo. “Il problema dei pregiudizi sociali negli algoritmi è enorme”, afferma Judy Wajcman della London School of Economics, che studia anche il genere nella scienza dei dati e nell’intelligenza artificiale al Turing Institute.

OpenAI afferma che il suo lavoro sull’affrontare i pregiudizi di genere e razziali di DALL-E 2 gli ha permesso di andare avanti con il lancio completo. Non sarà l’ultima parola, però. Il pregiudizio nell’AI è una caratteristica di base, difficilmente aggredibile, e l’azienda dovrà continuare a mettere toppe. OpenAI afferma che si prenderà tutto il tempo necessario ogni volta che il prodotto deve essere modificato.  

È un processo basato su un costante riequilibrio, dice Welinder. Le modifiche a volte possono creare nuovi disagi. Per esempio, quando OpenAI ha rilasciato per la prima volta la sua correzione per il pregiudizio di genere, alcuni utenti si sono lamentati del fatto che ora apparivano troppi Super Mario femminili. Questo tipo di caso è difficile da prevedere, afferma Welinder: “Vedere cosa vogliono gli utenti ci consente di mettere a punto e calibrare”.

Ma monitorare centinaia di milioni di immagini prodotte da un milione o più di utenti sarà un’impresa ardua. Welinder non specifica quanti moderatori umani richiederà, ma saranno personale interno, dice. L’azienda adotta un approccio ibrido alla moderazione, mescolando il giudizio umano con il monitoraggio automatizzato. A maggio, Google ha mostrato la propria AI per la creazione di immagini, chiamata Imagen. A differenza di OpenAI, Google ha detto molto poco sui suoi piani per la tecnologia. “Non abbiamo ancora nulla di nuovo da condividere su Imagen”, afferma il portavoce di Google Brian Gabriel.

Quando OpenAI è stata fondata nel 2015, è stata presentata come un puro laboratorio di ricerca, che credeva nell’intelligenza artificiale generale e si impegnava a garantire che la tecnologia andasse a beneficio dell’umanità, se mai fosse arrivata. Ma negli ultimi anni è diventata un’azienda di prodotti, offrendo la sua potente AI ai clienti paganti. “Ma tutto rientra nella stessa visione”, spiega Welinder: “Diffondere la nostra tecnologia come prodotto e su larga scala è una parte fondamentale della nostra missione”.

Immagine: Open AI

(rp)