Lo scorso febbraio un post intitolato «Google search is dying» («Il motore di ricerca di Google sta morendo»), pubblicato su un blog dal ventiseienne ingegnere statunitense di San Francisco Dmitri Brereton, aveva ricevuto attenzioni sui media generalisti e avviato discussioni estese e molto seguite sul sito di informatica Hacker News e sul social network Reddit, tra gli altri. Affrontando questioni note nel vasto dibattito sull’evoluzione di Internet, Brereton aveva scritto di come il motore di ricerca più utilizzato al mondo – oltre il 94 per cento delle ricerche da dispositivi mobili è effettuato su Google – abbia perso nel tempo la capacità di proporre agli utenti contenuti utili all’interno di un’offerta sempre più affollata di contenuti sponsorizzati e contenuti sostanzialmente uguali tra loro.

Una parte della questione – già oggetto di numerose riflessioni e posta in termini simili anche in relazione ad altre piattaforme, editori e aziende di Internet – riguarda la crescente quota di annunci pubblicitari che siano visivamente distinguibili, anche a un occhio distratto, dai contenuti che non sono pubblicitari. E l’altra parte della questione, più complessa e dai confini più incerti, riguarda il funzionamento dell’algoritmo del motore di ricerca, le tecniche per migliorare il posizionamento dei siti nella lista dei risultati e, in generale, la qualità dell’offerta di contenuti selezionati da Google in risposta alle domande poste dagli utenti e quindi promossi come risposte migliori di altre.

Ci si chiede, in particolare, quanti dei contenuti riportati nelle prime pagine dei risultati di ricerca forniscano oggi informazioni effettivamente utili e interessanti, e quanti invece – pur essendo il più delle volte pertinenti – siano il risultato più o meno evidente di un’omologazione determinata dalla competizione tra gli autori dei contenuti per dominare una determinata ricerca semantica ottenendo maggiore visibilità e, di conseguenza, maggiori ricavi.

Sempre più spesso, come notato da molti utenti, i contenuti proposti tendono infatti a essere simili tra loro perché chi li produce cerca di assecondare il più possibile raccomandazioni tecniche di compilazione e scrittura suggerite da Google, uguali per tutti, o cerca di replicare formati che già hanno successo nelle ricerche. E tutto questo succede a scapito dell’attenzione verso altre possibili qualità dei contenuti come l’originalità o, banalmente, la sincerità degli autori. «La maggior parte del web è diventata troppo inautentica per poter fare affidamento su di essa», ha sintetizzato Brereton.

– Leggi anche: “Google” è la parola più cercata su Bing, dice Google

A marzo il giornalista del New York Times Daisuke Wakabayashi ha pubblicato su Twitter un esempio di quanto possano a volte essere scomode e inconcludenti molte ricerche su Google, e alcune in particolare. Cercando per conto di suo padre informazioni sugli apparecchi acustici, Wakabayashi si è detto «sbalordito» dalla quantità di annunci pubblicitari presenti tra i primi risultati di ricerca su Google e di sezioni che nemmeno rimandano a contenuti esterni a Google.

Per diversi tipi di ricerca, come noto, la lista di risultati è infatti intervallata da varie sezioni come «Le persone hanno chiesto anche» o quella che, sulla base della geolocalizzazione del soggetto della ricerca, segnala la presenza di negozi che vendono il prodotto ricercato nelle vicinanze. Per alcune ricerche, Google riduce inoltre la necessità di cliccare sui link fornendo nella porzione più visibile dello schermo «risposte rapide» ottenute attingendo a testi contenuti in siti esterni e considerati una risposta pertinente alla domanda posta dall’utente.

I cover Google for a living so I am obviously aware how the results page has evolved over the years. Today, I was searching for “hearing aids” for my dad on my phone and I was stunned by the number of ads, and non-link results. It’s pretty stunning pic.twitter.com/jZZzDWRzdO — Daisuke Wakabayashi (@daiwaka) March 13, 2022

Uno delle osservazioni condivise dai critici delle evoluzioni recenti del motore di ricerca di Google è che in molti ambiti – salute, recensioni di prodotti e ricette, per esempio – i primi risultati di ricerca che non siano annunci pubblicitari sono pagine di siti palesemente ottimizzati per i motori di ricerca e a loro volta pieni di annunci pubblicitari o link di affiliazione forniti da altre società. Google se la cava bene in molti casi, soprattutto quando l’obiettivo dell’utente è trovare «informazioni fattuali», aggiunge Brereton, ma per alcune ricerche le persone sanno ormai «già inconsciamente che Google non restituirà un buon risultato» e quindi evitano del tutto di farle.

L’integrazione degli annunci pubblicitari nei risultati delle ricerche è un argomento noto da molto tempo nelle analisi e nelle discussioni sugli sviluppi delle piattaforme di Internet. Nel 1998, sulla base di alcuni loro esperimenti e dell’esperienza con altri media, i fondatori di Google Larry Page e Sergey Brin descrissero come problematico per i motori di ricerca il modello di business basato sulla pubblicità, già all’epoca dominante.

L’algoritmo di analisi utilizzato da Google per le ricerche – il PageRank, oggi parte di un modello rivisto e basato su oltre 200 diversi algoritmi – serviva, secondo Page e Brin, a misurare il livello di interesse degli utenti verso i contenuti che si possono trovare online. E l’ordine con cui erano mostrati i siti nella pagina dei risultati era determinato, in buona parte, da quanti link ricevevano i loro contenuti.

– Leggi anche: Google manipola i suoi algoritmi più di quanto crediamo

Osservando le risposte fornite dal loro prototipo di motore di ricerca a una domanda sui telefoni cellulari, Page e Brin notarono che il contenuto giudicato più importante e pertinente secondo l’algoritmo del PageRank era un articolo sugli effetti dell’uso del cellulare sull’attenzione alla guida. Segnalarono quindi una certa incompatibilità tra il modello di business basato sulla pubblicità e gli interessi dell’utente. «Un motore di ricerca che prenda soldi per mostrare annunci di telefoni cellulari avrebbe difficoltà a giustificare ai suoi inserzionisti paganti la pagina restituita dal nostro sistema», scrissero Page e Brin.

Page e Brin notarono anche una contraddizione di fondo: un funzionamento ideale del motore di ricerca limiterebbe di fatto lo spazio a disposizione degli inserzionisti. «In generale, dal punto di vista del consumatore si potrebbe sostenere che migliore è il motore di ricerca, meno annunci saranno necessari al consumatore per trovare ciò che desidera», scrissero. Descrivendo il problema del modello della pubblicità applicato ai motori di ricerca come una questione di «incentivi contrastanti», Page e Brin conclusero che «le entrate pubblicitarie spesso forniscono un incentivo a fornire risultati di ricerca di scarsa qualità». Queste cautele e avvertimenti, secondo Brereton, stridono tuttavia con tutto ciò che Google realizzò e diventò successivamente.

– Leggi anche: Perché a volte ci sembra che gli smartphone ci ascoltino

Oltre al modello di business basato sugli annunci pubblicitari, un altro dei fattori che nel tempo hanno contribuito a modificare profondamente i risultati delle ricerche su Google è l’adattamento degli autori dei contenuti all’algoritmo stesso e la crescita del settore dell’ottimizzazione per i motori di ricerca (Search Engine Optimization, SEO). Applicando una serie di raccomandazioni e indicazioni formali di compilazione dei contenuti, gli autori possono infatti incrementare le possibilità che ottengano maggiore visibilità nei risultati delle ricerche generando, in teoria, maggiori profitti.

Come spiegato dall’esperto giornalista americano Charlie Warzel, che si occupa di tecnologia e media sull’Atlantic ed è autore della popolare newsletter Galaxy Brain, Google fornisce aggiornamenti frequenti agli addetti ai lavori che si occupano di SEO. Ma gli algoritmi di ricerca dell’azienda rimangono in larga parte «una scatola nera», un segreto commerciale custodito da Google per mantenere un vantaggio sulla concorrenza e impedire che gli spammer possano aggirarli per ottenere visibilità con intenzioni fraudolente.

Il risultato è che arrivare a sapere quale sia il tipo di informazioni premiate da Google è un lavoro fatto di congetture e di molti tentativi ed errori. «C’è un mucchio di gente il cui unico obiettivo è raggiungere la vetta delle ricerche su Google, quindi non dovrebbe sorprendere il peggioramento dei risultati di ricerca in termini di qualità», ha scritto Brereton. E sebbene sia un problema che qualsiasi motore di ricerca si troverebbe probabilmente a dovere affrontare, secondo Brereton, da Google ci si aspetterebbe un algoritmo più raffinato e meno facilmente manipolabile. Ci si aspetterebbe cioè una maggiore qualità e minore uniformità dei contenuti premiati come risposte più pertinenti e più utili rispetto a determinate domande.

Capita spesso invece che le ricerche su Google in merito a determinati argomenti restituiscano come risultato una serie di contenuti che offrono varie riformulazioni, sostanzialmente equivalenti, di una medesima informazione. E capita anche che a essere favoriti nelle ricerche siano contenuti di scarsa qualità, a volte prodotti con l’unico obiettivo di generare traffico e profitti attraverso la pubblicità, la sottoscrizione di servizi o la vendita di prodotti.

Brereton afferma che il motore di ricerca sia da tempo condizionato anche dai tentativi di integrare l’intelligenza artificiale e l’apprendimento automatico nell’interpretazione delle domande poste dagli utenti. Sempre più spesso, Google non restituisce risultati basati soltanto su ciò che l’utente digita: «cerca di essere “intelligente” e capire cosa “intendi davvero”, oltre a personalizzare le cose per te».

– Leggi anche: Quanto siamo prevedibili

Questa considerazione di Brereton è peraltro condivisa da Marie Haynes, una consulente SEO che studia gli algoritmi di Google dal 2008. Secondo Haynes, i progressi compiuti dall’azienda nell’integrazione dell’intelligenza artificiale stanno rendendo via via meno centrale il modello basato sul PageRank ma sono ancora in una fase primordiale. Ed è questo il motivo per cui in questa «fase di transizione» la ricerca appare effettivamente molto diversa rispetto al passato e spesso frustrante, anche a causa di una presenza di annunci pubblicitari secondo Haynes mai invadente quanto adesso.

La crescente consapevolezza degli attuali limiti di Google come motore di ricerca da parte degli utenti, secondo Brereton e secondo altri osservatori, sta condizionando anche le ricerche stesse. Molte persone che continuano a usare Google lo fanno sempre più spesso come scorciatoia per raggiungere determinate pagine su siti conosciuti e ritenuti affidabili, evitando i siti che tramite l’ottimizzazione SEO arrivano in cima ai risultati di ricerca e, generalmente, «cercano sempre di venderti qualcosa».

– Leggi anche: Quelli che ricevono prodotti gratis da Amazon

Di conseguenza, molte domande degli utenti non sono più formulate utilizzando soltanto le parole oggetto della ricerca ma anche il nome del sito, del social o dell’aggregatore di contenuti di volta in volta ritenuto più utile in merito alla domanda posta. Anziché scrivere il titolo di un film o di una serie tv per trovare una recensione o una valutazione del film o della serie su Internet, per esempio, gli utenti scrivono il titolo e aggiungono «rotten», in modo da raggiungere attraverso un solo passaggio intermedio la pagina di quel film o di quella serie all’interno del popolare aggregatore di recensioni Rotten Tomatoes.

La stessa cosa avviene per altri argomenti: nel caso di ricerche molto specifiche nel campo dell’informatica, per esempio, spesso gli utenti aggiungono alle parole della ricerca «Github», il più popolare sito per sviluppatori di software. E per molte ricerche generiche aggiungono sempre più spesso la parola «Reddit», social network americano le cui discussioni innumerevoli sono ritenute da un crescente numero di utenti una fonte di informazioni non sempre affidabili ma di valore superiore in termini di utilità, originalità e sincerità rispetto a quelle ricavate tramite Google. In altre parole, sono considerate conversazioni tra esseri umani reali e non testi generati con il solo obiettivo di dominare una ricerca semantica.

Questo tipo di qualità attribuita a Reddit risulta spesso molto utile quando gli utenti cercano informazioni e racconti individuali – di appassionati, o anche di gente comune – riguardo a un determinato prodotto: un’auto, un proiettore o una macchina per il caffè, per esempio. L’interesse di quegli utenti è trovare racconti attendibili e disinteressati su quel prodotto, ed evitare di effettuare ricerche su Google “alla cieca”, rischiando di finire su siti di recensioni a pagamento o altri il cui tacito obiettivo è incentivare l’acquisto di quel prodotto in modo da ottenere dall’azienda produttrice una commissione sui ricavi riconducibili ai link di affiliazione presenti sul sito.

– Leggi anche: Due parole sugli articoli sponsorizzati

La capacità di coordinamento online degli utenti di social network come Reddit ha dimostrato in anni recenti di poter favorire in alcune circostanze determinati mercati che ottengono popolarità tra investitori non professionisti, grazie a campagne nate e portate avanti sui forum online. E il fatto che gruppi numerosi di utenti possano mettersi d’accordo per far salire il prezzo delle azioni di imprese quotate in borsa è di per sé una dimostrazione che nemmeno social network come Reddit siano del tutto esenti dal rischio di un condizionamento delle conversazioni riconducibile a un interesse economico dei partecipanti.

Tuttavia, come affermato da un utente intervenuto nel dibattito che si è sviluppato su Reddit riguardo al post di Brereton, le conversazioni su Reddit sono in generale ritenute più autentiche di quanto lo siano i «discorsi aziendali» presenti negli articoli dei «grandi siti web» premiati da Google nei risultati di ricerca. È inoltre plausibile che sia in crescita anche la quota di utenti inclini a effettuare ricerche senza alcun motore di ricerca, utilizzando direttamente gli strumenti di ricerca presenti all’interno delle piattaforme che frequentano abitualmente.

Molte persone trovano spesso più utile effettuare su YouTube, TikTok o Instagram ricerche che un tempo facevano su Google. Per conoscere le date del tour di una certa band musicale o quelle delle presentazioni di un libro di un certo autore, per esempio, può essere molto più pratico e veloce consultare l’account Instagram ufficiale di quella band e di quell’autore anziché sbrogliare una matassa di risultati di ricerca su Google che può essere caotica e a volte incomprensibile.

people are now searching on tiktok instead of google pic.twitter.com/YTbH3Ap65t — Turner Novak 🍌🧢 (@TurnerNovak) June 21, 2022

Informazioni migliori di quelle reperibili tra i risultati delle ricerche generiche su Google si possono trovare sui social media, sui forum e sui piccoli blog personali, secondo Brereton, ma nelle ricerche su Google queste piattaforme sono svantaggiate in favore di siti web aziendali, che sono quelli che possono più facilmente permettersi le spese necessarie per l’ottimizzazione dei contenuti per i motori di ricerca. È come se il «web autentico» fosse nascosto, ha detto Brereton al New Yorker, e «gli algoritmi ci dicessero cosa leggere».

– Leggi anche: Quelli che ricevono prodotti gratis da Amazon

Secondo l’ex analista e giornalista statunitense Danny Sullivan, consulente di Google esperto di motori di ricerca, il fatto che le persone utilizzino a volte parole come «Reddit» in aggiunta al testo oggetto della ricerca è la prova del corretto funzionamento del motore di ricerca. Il punto della questione, secondo Sullivan, non è l’inefficienza del motore di ricerca di Google ma semmai la «passività» e pigrizia degli utenti, i quali potrebbero in realtà perfezionare le loro ricerche per trovare più facilmente ciò che desiderano.

Parlando con il New Yorker, Sullivan ha aggiunto che diversi utenti preferiscono effettivamente ricevere «più informazioni non commerciali, più informazioni basate sulla comunità», ma non è detto che questo sia il desiderio prevalente nel pubblico che effettua ricerche online. Alcune persone – una nicchia, secondo Sullivan – potrebbero pensare che i risultati «interessanti» siano preferibili rispetto a quelli «utili». Ma molte altre potrebbero invece apprezzare i suggerimenti relativi, per esempio, ai negozi online o fisici in cui poter acquistare un determinato prodotto. «Hacker News non rappresenta la totalità di coloro che effettuano ricerche», ha detto Sullivan.

A proposito delle alternative a Google tra i motori di ricerca, come ricordato dal New Yorker, la scelta tra quelli esistenti è sostanzialmente limitata dal fatto che tutti i principali motori funzionano sulla base di un modello stabilito dal crawler originale di Google (i crawler sono software in grado di analizzare in modo automatizzato le pagine web pubbliche e di acquisirne delle copie in memoria) e dalle tecnologie legate al PageRank.

Alcuni progetti recenti e molto laterali, con ambizioni e risorse molto diverse da quelle dei grandi motori di ricerca, si concentrano su funzioni che potrebbero essere apprezzate da un’utenza più limitata. Uno di questi, per esempio, è il motore di ricerca indipendente Marginalia, creato dallo sviluppatore svedese Viktor Lofgren con l’obiettivo di «mostrare siti di cui forse non eri a conoscenza». Utilizzando un algoritmo personalizzato e basato sulla raccolta di dati di Lofgren, Marginalia dà priorità nelle ricerche a testi privi di pubblicità e che sono sfavoriti nelle ricerche su Google, a volte per ragioni tecniche come la mancanza di supporto per i dispositivi mobili.

«I risultati di Marginalia non ti aiuteranno a scegliere un nuovo elettrodomestico ma sono uno sguardo affascinante su quanto materiale contenga Internet e quanto non arrivi mai in cima agli attuali risultati di Google», ha scritto il New Yorker.