ChatGPT ha imparato a disegnare molto meglio

Con il suo ultimo aggiornamento imita benissimo stili come quello dello Studio Ghibli, con nuove preoccupazioni sulla tutela del diritto d'autore

(ChatGPT)
(ChatGPT)
Caricamento player

Da un paio di giorni i social network sono pieni di disegni con uno stile che ricorda molto quello dello Studio Ghibli, il famoso studio di animazione giapponese creato da Hayao Miyazaki. Non sono stati disegnati da artisti o fan di cartoni animati come La città incantata e Il mio vicino Totoro, ma da una nuova versione della funzione di generazione delle immagini di ChatGPT, il sistema di intelligenza artificiale di OpenAI. Il nuovo modello è stato diffuso in questi giorni e ha ricevuto molti apprezzamenti per la qualità delle immagini prodotte, rispetto alla versione precedente, ma ha anche fatto sollevare nuovi dubbi e critiche sulla tutela del diritto d’autore.

Le immagini che imitano i cartoni animati dello Studio Ghibli, per esempio, sono estremamente aderenti allo stile di Miyazaki e dei suoi disegnatori, sia per quanto riguarda il tratto sia la scelta delle palette di colori e del modo in cui sono resi gli sfondi. Per ottenere immagini di quel tipo è sufficiente specificare lo stile nei comandi testuali (“prompt”) che si danno a ChatGPT, oppure caricare una qualsiasi immagine con l’indicazione di renderla come i disegni dello Studio Ghibli.

Al momento il nuovo sistema di generazione delle immagini è disponibile solamente nella versione a pagamento di ChatGPT e mercoledì Sam Altman, il CEO di OpenAI, ha annunciato che la diffusione del sistema anche agli account gratuiti sarà rinviata a causa dell’alto utilizzo da parte di chi paga il servizio. La generazione delle immagini richiede infatti maggiori capacità di calcolo rispetto ai modelli precedenti, resa evidente anche dalla maggiore lentezza con cui viene eseguita.

Diverse persone hanno condiviso sui social network i risultati dei loro primi esperimenti, mostrando i netti miglioramenti soprattutto nella modifica delle immagini. Un utente ha per esempio mostrato come si possano ottenere versioni dei più famosi “meme” del Web in stile manga o espressamente in stile Studio Ghibli.

Altri hanno condiviso immagini che mostrano come partendo da una fotografia si possano ottenere disegni in vario stile, molto aderenti all’originale.

Rispetto alle versioni precedenti, il sistema è migliorato notevolmente nell’inserimento di scritte all’interno dei disegni. Mentre in precedenza venivano quasi sempre prodotte scritte verosimili, ma prive di senso, ora ChatGPT riesce nella maggior parte dei casi a mostrare testi corretti e contestuali a ciò che viene disegnato. Nell’esempio qui sotto, è stato per esempio chiesto a ChatGPT di disegnare una schermata di Wikipedia che mostri alcuni particolari anatomici dei gatti.

La capacità di produrre immagini e testi coerenti è dimostrata anche da alcuni esperimenti per far disegnare a ChatGPT un fumetto, con più vignette e una storia che si sviluppa in diverse pagine.

In una breve presentazione del sistema organizzata lo scorso mercoledì, i responsabili di OpenAI hanno spiegato di essersi concentrati soprattutto sulle capacità artistiche del modello, senza cercare necessariamente di raggiungere nuovi grandi progressi nella realizzazione di immagini iper realistiche. Produrre con sistemi di intelligenza artificiale immagini di questo tipo è del resto molto difficile ed è uno degli ambiti in cui sono più frequenti le “allucinazioni”, cioè interpretazioni sbagliate da parte della AI che portano a produrre dettagli inverosimili, come persone con più di due braccia o con più di cinque dita per mano.

Come hanno fatto notare molti osservatori, sembra comunque che il modello sia stato allenato anche in questo caso su una enorme quantità di immagini protette dal diritto d’autore, non solo dello Studio Ghibli ovviamente. I sistemi di intelligenza artificiale hanno bisogno di moltissimi esempi per affinare le loro capacità e le società che li sviluppano – come OpenAI, Alphabet o Meta – attingono a cataloghi e librerie di film e testi, quasi sempre senza l’esplicito permesso da parte di chi ne detiene i diritti. Le aziende sostengono di poterlo fare perché tanto i loro sistemi generano immagini e testi nuovi, senza riproporre fedelmente quelli di partenza e quindi senza violazioni di copyright.

Molti editori e autori ritengono che le cose stiano diversamente e hanno avviato varie cause legali contro i principali sviluppatori di intelligenza artificiale. Ci sono decine di cause sulle quali i tribunali si devono ancora pronunciare, soprattutto negli Stati Uniti, e le loro decisioni condizioneranno le prossime evoluzioni di una tecnologia che in pochi anni ha raccolto grandi interessi economici.

In seguito alla diffusione del nuovo modello e alle polemiche che ne sono seguite, OpenAI ha detto che ChatGPT è impostato per rifiutare le richieste di imitazione dello «stile di artisti ancora viventi», mentre consente di riprodurre «stili in generale come quelli di uno studio grafico». Il fatto è che in diversi casi uno studio ha un proprio stile che deriva da un primo disegnatore, come è stato nel caso dello Studio Ghibli con Hayao Miyazaki.