La diffusione dei chatbot di AI è un problema per Wikipedia

Non tanto per il calo di traffico in sé, ma perché a meno persone che consultano l'enciclopedia corrispondono meno volontari che la fanno

Caricamento player

Lo scorso maggio la Wikimedia Foundation, l’organizzazione non profit che promuove lo sviluppo di Wikipedia, ha notato un improvviso aumento dei visitatori “umani” del sito, cioè degli accessi fatti da persone reali, e non dai bot progettati per raccogliere dati dal web. Questo picco di attività risultava sospetto per diversi motivi: innanzitutto perché proveniva perlopiù da un singolo paese, il Brasile, e poi perché era in netto contrasto con una tendenza in corso ormai da anni. A partire da quando ChatGPT è stato messo online, infatti, la diffusione dei modelli linguistici e dei chatbot di intelligenza artificiale ha fatto calare costantemente le visite di Wikipedia, come quelle di molti altri siti.

Servizi come AI Overview di Google, ad esempio, forniscono una risposta automatica prima dei tradizionali risultati di ricerca, col risultato che molti utenti si accontentano senza cliccare sui successivi link. Sempre più persone, inoltre, cercano informazioni direttamente tramite chatbot come ChatGPT, che spesso permettono di avere una risposta senza passare dai siti web.

A essere aumentato, in compenso, è un altro tipo di traffico, quello generato dai bot delle aziende di intelligenze artificiali, che hanno bisogno di interagire con siti come Wikipedia per formulare le loro risposte. Questo tipo di attività viene detta “scraping” e interessa in particolar modo Wikipedia in quanto fonte attendibile e rispettata, ragione per cui il sito viene visitato di continuo dai bot, al punto da mettere sotto pressione i suoi server.

Per tutti questi motivi, il picco di visite di maggio è risultato sospetto ed è stato indagato dalla fondazione, che ha scoperto l’attività di una serie di bot che riuscivano a eludere i sistemi di rilevamento del sito, spacciandosi per utenti umani. La notizia ha costretto l’organizzazione ad aggiornare l’algoritmo con cui analizza il traffico ricevuto, scoprendo che il numero di pagine viste quest’anno da utenti reali in realtà era calato dell’otto per cento rispetto al 2024.

Quella di Wikipedia non è un’eccezione, ovviamente: il calo in questione risulta anzi minore rispetto a quello registrato da molti siti di news, che per questo perdono entrate in inserzioni pubblicitarie. Wikipedia invece non ha davvero problemi di soldi, visto che si basa sul contributo di migliaia di volontari che scrivono, controllano e verificano le informazioni gratuitamente. Il danno causato dai chatbot di intelligenza artificiale è di tipo diverso.

– Leggi anche: Wikipedia ha meno bisogno di soldi di quanto si pensi

Questo tipo di lavoro collettivo infatti si basa su un rapporto attivo con il sito: è tra i milioni di lettori che la consultano che si rinnova la piccola ma significativa porzione di persone che, frequentando molto l’enciclopedia, si appassiona e diventa volontario. Questa dinamica però rischia di venir meno se sempre più utenti interagiscono con Wikipedia indirettamente, attraverso le risposte dei chatbot o di Google. Senza nemmeno sapere, in molti casi, che quello che stanno leggendo arriva da Wikipedia.

Secondo un post pubblicato sul sito di Wikimedia, il calo continuo di visitatori umani «potrebbe far diminuire il numero di volontari che contribuiscono ad accrescere e migliorare i contenuti, così come quello dei donatori che sostengono questo lavoro». A tal proposito Marshall Miller, responsabile del prodotto dell’organizzazione, ha chiesto alle aziende del settore di «rendere chiara la provenienza delle informazioni e promuovere le opportunità di visitare e partecipare alle relative fonti». La fondazione ha anche chiesto agli utenti e ai lettori di Wikipedia una maggiore attenzione quando interagiscono con le risposte dei chatbot, e di cliccare i link che rimandano alle fonti, anche per ottenere informazioni più complete.

Sono l’autorevolezza e la trasparenza che contraddistinguono Wikipedia a renderla un archivio di dati così importante per l’industria delle AI generative, che lo usano anche per allenare i loro modelli linguistici. Da sempre infatti i contenuti di Wikipedia sono disponibili liberamente a tutti: chiunque può usarli e pubblicarli, a patto di citare e linkare la fonte. Le aziende del settore AI, invece, sono da tempo accusate di utilizzare contenuti di ogni tipo, anche quelli protetti dal diritto d’autore, per lo sviluppo dei loro modelli linguistici.

Un altro fattore determinante nel calo di visite è la diffusione dei social media, in particolare quelli basati sui video, che sono un canale di informazione sempre più diffuso specie tra gli utenti più giovani. Per aumentare la propria copertura, Wikimedia ha aperto canali su Instagram e TikTok, oltre che sulla piattaforma di gaming Roblox, dove pubblica contenuti basati sull’archivio di Wikipedia. L’obiettivo principale dell’organizzazione, infatti, è raggiungere più persone con le informazioni contenute nell’enciclopedia, anche attraverso canali nuovi e in via di sviluppo. Per farlo, Wikipedia ha anche sviluppato delle AI in grado di riassumere i propri contenuti, ma l’esperimento è stato messo in pausa a causa delle proteste di molti suoi editor.