ChatGPT si è fissato con i goblin
L'ha raccontato l'azienda di intelligenza artificiale OpenAI, che ora gli ha impedito di citarli a meno che non sia proprio necessario

«Non parlare di goblin, gremlins, procioni, troll, orchi, piccioni o altri animali o creature a meno che non sia assolutamente e inequivocabilmente rilevante». È una delle ultime indicazioni (tecnicamente: prompt di sistema) che OpenAI, la società che sviluppa ChatGPT, ha dato a Codex, il suo sistema di intelligenza artificiale per scrivere codice, dopo che molti utenti avevano cominciato a segnalare un’eccessiva fissazione del chatbot con una serie di figure fantastiche, e con i goblin nello specifico.
Per il chatbot i goblin erano diventati una metafora valida un po’ per tutto: per esempio, con alcuni utenti, Codex aveva cominciato a chiamare «piccoli goblin» i difetti che identificava nel codice; con un altro aveva definito se stesso «goblin con la torcia», per spiegare come il suo lavoro fosse quello di andare in cerca di errori. Dopo essere intervenuta ordinando a Codex di smettere di parlare di goblin, OpenAI ha pubblicato un post sul suo blog intitolato «Da dove vengono i goblin», in cui spiega cosa c’è dietro questo fenomeno.
OpenAI ha raccontato di aver cominciato a notare un uso più ricorrente delle parole «goblin» e «gremlin» nei suoi sistemi lo scorso novembre. I goblin sono creature maligne tipiche dell’immaginario fantasy, di bassa statura, spesso verdi, tendenzialmente di brutto aspetto e poco civilizzati, mentre i gremlins sono i piccoli mostriciattoli che si trasformano in mostri incontrollabili protagonisti dell’omonima saga cinematografica.
A novembre infatti OpenAI aveva lanciato il suo modello GPT‑5.1 e alcuni utenti si erano lamentati del fatto che avesse un modo di parlare eccessivamente amichevole, e con alcuni strani tic linguistici. Facendo un controllo OpenAI aveva visto che l’uso della parola «goblin» era aumentato del 175% mentre l’uso della parola «gremlin» del 52%: nulla di preoccupante.
Quando però mesi dopo OpenAI rese disponibile il suo modello GPT‑5.4 si rese conto che queste parole avevano cominciato a ricorrere molto più spesso. «I goblin continuavano a moltiplicarsi e dovevamo capire da dove venissero».
Scoprì che il maggior uso della parola goblin (con un aumento di più del 3800% rispetto al modello GPT-5.2) lo facevano i sistemi con personalità “Nerd”. Gli utenti che usano ChatGPT e Codex possono infatti scegliere il tipo di personalità del loro chatbot, per esempio tra “Cinico”, “Amichevole”, eccetera. La personalità “Nerd” è, volendo semplificare, quella delle persone che antepongono lo studio e la ricerca alla vita sociale, che amano le materie scientifiche e l’informatica, e che si appassionano di alcune nicchie culturali tra cui i giochi da tavolo, i film e libri fantasy, eccetera.
OpenAI aveva descritto la personalità “Nerd” come «promotrice della verità, della conoscenza, della filosofia, del metodo scientifico e del pensiero critico», ma caratterizzata da un linguaggio «giocoso» e che non si prende troppo sul serio.
OpenAI ha capito che, senza che i suoi sviluppatori se ne accorgessero, avevano creato un sistema di valutazione della personalità Nerd che premiava le risposte più creative e strane, e tra queste in particolare quelle contenenti creature del mondo fantasy come i goblin e i gremlins (ma anche piccioni, procioni, troll, orchi, eccetera). Questi feedback positivi avevano incentivato il chatbot a usarle ancora e sempre di più (perché le intelligenze artificiali imparano man mano che lavorano cosa funziona e cosa no e si adattano). Questo però non aveva effetto solo sulla modalità Nerd ma anche, in maniera minore, sulle altre che sono comunque collegate tra loro in fase di addestramento. Da qui il proliferare di goblin un po’ ovunque su Codex e ChatGPT (di cui Codex fa parte).
A marzo OpenAI ha eliminato la personalità Nerd e il sistema di valutazione che premiava quelle parole. E ha dato alle altre personalità l’indicazione che scrivevamo all’inizio di questo articolo, di non usare quei riferimenti ai goblin o ad altre creature a meno che non siano strettamente necessari. L’azienda ha comunque diffuso un comando che si può dare a Codex se lo si vuole lasciare libero di parlare di goblin tutte le volte che vuole.



