La voce di uno dei nuovi assistenti di ChatGPT era troppo simile a quella di Scarlett Johansson

L'attrice, che aveva interpretato un famoso bot nel film “Her”, ha ottenuto che la funzionalità fosse rimossa, dicendosi «scioccata»

L'attrice Scarlett Johansson (Charley Gallay/Getty Images for Netflix)
L'attrice Scarlett Johansson (Charley Gallay/Getty Images for Netflix)
Caricamento player

OpenAI, società statunitense specializzata nello sviluppo di software di intelligenza artificiale, ha rimosso uno dei suoi cinque assistenti vocali introdotti pochi giorni fa nella nuova versione del suo prodotto di punta, il chatbot ChatGPT, dopo che l’attrice statunitense Scarlett Johansson aveva sostenuto che assomigliasse in modo «inquietante» alla sua voce, nonostante si fosse esplicitamente rifiutata di prestarla.

Johansson ha detto di essere rimasta «scioccata» dal comportamento di Sam Altman, l’amministratore delegato di OpenAI. In una dichiarazione ripresa dalle testate internazionali, ha scritto che a settembre Altman l’aveva contattata per chiederle di fornire la sua voce per il nuovo aggiornamento di ChatGPT, ma che poi aveva rifiutato l’offerta «per motivi personali». Tra i suoi molti ruoli celebri, Johansson aveva interpretato un’assistente vocale virtuale nel film Her di Spike Jonze, a cui era proprio stata paragonata la resa delle nuove funzioni di ChatGPT: è probabilmente per questo che Altman le aveva chiesto di doppiare l’assistente.

Johansson ha raccontato anche che due giorni prima della pubblicazione dei primi demo Altman le aveva scritto nuovamente per chiederle di riconsiderare la sua decisione, ma che «prima ancora che potessimo rispondere, l’aggiornamento era già disponibile». A quel punto, Johansson ha assunto un consulente legale per chiedere a OpenAI di rimuovere la voce di Sky – il nome dell’assistente con la voce simile a quella di Johansson – dalle proprie funzionalità, e di «dettagliare l’esatto processo» attraverso cui era stata creata.

Lunedì, dopo che le parole di Johansson erano state ampiamente riprese, l’azienda ha rimosso Sky dagli assistenti vocali di ChatGPT. Anche se non ha spiegato nel dettaglio i motivi della sua decisione, in un comunicato OpenAI ha specificato di non avere imitato Johansson, e che per Sky ha utilizzato la voce naturale di un’altra attrice professionista, senza però rivelarne l’identità.

Johansson ha scritto di essere rimasta stupita dalla sfrontatezza di Altman, che la scorsa settimana aveva presentato l’aggiornamento con un post su X accompagnato dalla scritta Her, un riferimento all’omonimo film di fantascienza del 2013 diretto da Spike Jonze. In Her Johansson doppiava la voce di Samantha, l’assistente vocale di cui si innamora il protagonista Theodore Twombly (Joaquin Phoenix). Johansson ha infine scritto:

«in un’epoca in cui siamo alle prese con i deepfake e con la tutela della nostra immagine, del nostro lavoro, della nostra identità, credo che queste siano domande che meritano assoluta chiarezza. Attendo con impazienza una soluzione trasparente e l’approvazione di una legislazione adeguata per garantire la tutela dei diritti individuali».

Il nuovo aggiornamento di ChatGPT era stato presentato lo scorso 13 maggio nel corso di un evento online preceduto da numerose anticipazioni e ipotesi, compresa la possibilità che OpenAI volesse presentare un proprio motore di ricerca per fare concorrenza a Google. Durante l’evento erano state invece presentate nuove funzionalità per dialogare più facilmente con ChatGPT a voce, facendole anche analizzare ciò che si ha intorno tramite la fotocamera dello smartphone.

La nuova versione di ChatGPT è basata su GPT-4o, la più recente evoluzione del modello GPT-4 che fa funzionare il sistema di intelligenza artificiale di OpenAI. Sam Altman, il CEO della società, aveva spiegato che la nuova versione è stata sviluppata per essere «multimodale», e cioè in grado di generare contenuti sulla base di indicazioni e comandi derivanti da testi, immagini e audio. L’idea è di rendere ChatGPT sempre più simile a un assistente virtuale, in modo che possa conversare naturalmente con i propri interlocutori umani, fornendo indicazioni, informazioni o contenuti di fantasia.