Possiamo fidarci dei riquadri di Google?

Avete presente quei box che appaiono nei risultati e vi forniscono la risposta che cercate facendovi risparmiare un clic? Che succede se quella risposta è sbagliata?

di Caitlin Dewey - The Washington Post

(Chris Jackson/Getty Images)
(Chris Jackson/Getty Images)

I “knowledge panel” – i riquadri informativi che spesso compaiono sulla destra nella pagina dei risultati quando si fa una ricerca su Google – spuntano a caso, non riportano le fonti e sono categorici quasi fossero dei comandamenti divini. Pippo Baudo ha 79 anni e Gerusalemme è la capitale di Israele.

Se avete mai cercato su Google una persona, un posto o una cosa (e sicuramente l’avete fatto) avete già incontrato questi riquadri aggressivi che hanno i titoli in grassetto. Sono uno dei molti tentativi di Google per attirare la nostra attenzione sfuggente. Da quando sono stati introdotti in sordina nel 2012, i riquadri e altre forme di “risposte arricchite” hanno iniziato a spuntare su Google ovunque: compaiono in cima ai risultati di circa un terzo dei 100 miliardi di ricerche fatte su Google ogni mese e non rispondono solo a domande “numeriche” – come l’età di Pippo Baudo – ma anche a richieste più articolate, come qual è la capitale di Israele o la migliore pizza di Milano, per esempio.

Schermata 2016-05-13 alle 12.45.35

Per Google i riquadri informativi dimostrano l’efficacia della sua tecnologia per la ricerca semantica, mentre per gli utenti di Google sono un modo comodo per risparmiare un po’ di clic. Sempre più persone però iniziano ad avere dubbi e pensano che questi riquadri possano distorcere le nostre conoscenze: e siano più preoccupanti della notizia per cui la sezione Trending di Facebook – che in Italia non esiste ed è gestita da un algoritmo – sarebbe pesantemente modificata dall’intervento umano. «Danneggia la capacità delle persone di verificare le informazioni e, in definitiva, di farsi un’opinione informata», spiega Dario Taraborelli, capo della ricerca di Wikimedia Foundation e ricercatore di social computing che studia come nasce e si diffonde la conoscenza su Internet: «è un fenomeno che come società dobbiamo studiare ed elaborare».

Per Taraborelli il problema principale dei riquadri di Google è la loro incompletezza: forniscono informazioni ma tralasciano spesso il contesto da cui provengono. In questo modo per i lettori è difficile valutarne l’accuratezza e capire se sono l’opzione migliore e più completa tra quelle disponibili. Gli utenti possono far scorrere la pagina e cliccare sui link, ma è più scomodo farlo visto che si può ricorrere alla ricerca vocale, ai dispositivi mobili e alle sempre più numerose risposte arricchite di Google (che però non segnala da dove attinge i suoi risultati). Un esempio di queste risposte sono gli “snippet” (letteralmente “ritagli”, dall’inglese) che mostrano l’estratto di un testo preso da una pagina web per rispondere ad alcune domante (“quanti anni ha Bill Murray” per esempio), o i risultati con le indicazioni geografiche dai programmi di ricerca locale di Google, che suggeriscono ristoranti in zona se si cerca per esempio “migliore pizza Milano”.

Questi esempi sono preoccupanti perché attribuiscono un’autorevolezza immeritata ai risultati di Google stabiliti da un algoritmo (per esempio non c’è nessuna indicazione sul perché un ristorante è il migliore della zona). È molto interessante anche il Knowledge Graph (“Grafo della conoscenza”) di Google, un database tecnologicamente avanzato che utilizza come fonte soprattutto Wikipedia ed è stato sviluppato in parte sulla base degli schemi di ricerca degli utenti. Secondo un’analisi dell’ottobre 2015 della società di marketing digitale Stone Temple Consulting questi riquadri, in cui spesso non è riportata la fonte, sono tra gli strumenti di Google che stanno crescendo più velocemente. Nel 2012 il vice presidente di Google Amit Singhal annunciò sul blog ufficiale della società l’introduzione dei riquadri descrivendoli come «un passo fondamentale verso il futuro della ricerca», una tecnologia in grado di «capire il mondo in modo un po’ più simile a come fanno le persone». Una cosa fantastica, finché non ci si addentra in argomenti più complessi dell’ora locale a Timbuctù, come ha invece fatto di recente Mark Graham, un geografo dell’Oxford Internet Institute.

In uno studio pubblicato il mese scorso nel libro Code and the City, Graham ha analizzato con la sua collega Heather Ford come veniva rappresentata Gerusalemme su Wikimedia e nei riquadri informativi di Google. Mentre Wikipedia spiega approfonditamente lo status geopolitico di città contesa di Gerusalemme (la pagina italiana ha oltre 6.200 parole), queste informazioni vengono completamente tralasciate nei riquadri di Google. «Con i suoi dati e algoritmi Google controlla il modo in cui interagiamo con molti aspetti delle città in cui viviamo», ha detto Graham, «dovremmo chiederci se siamo contenti di lasciare che sia Google a decidere come vivere la nostra vita quotidiana». Graham ha analizzato altre città e paesi contesi, scoprendo che i riquadri informativi di Google spesso, seppur non intenzionalmente, prendono decisioni importanti al nostro posto: Taiwan viene descritto come una nazione indipendente, nonostante solo 22 paesi al mondo la riconoscano tale; digitando nel motore di ricerca “Londonderry”, la quarta città dell’Irlanda del Nord, i riquadri di Google correggono automaticamente il nome in “Derry”, il nomignolo con cui la chiamano i nazionalisti irlandesi.

Dato che spesso Google non cita le fonti da cui trae le informazioni (un modo per sembrare più autorevole, secondo Taraborelli), gli utenti non hanno modo di verificarle e cercare gli errori, che inevitabilmente ci sono. A settembre, per esempio, alcuni giornalisti del Washington Post avevano scritto un articolo in cui raccontavano che, stranamente, nessuno sa quanta sia alta Hillary Clinton. Persino Google fino a poco tempo riportava un’informazione sbagliata, sostenendo in uno dei suoi riquadri che fosse alta circa 1 metro e 70. Sembra che l’errore risalisse a una modifica senza fonte fatta nel 2007 su Wikipedia, che fu poi discussa e rimossa dai suoi utenti. Se oggi cercate l’altezza di Clinton nella versione in inglese di Google, sopra i risultati comparirà uno “snippet” secondo cui Clinton sarebbe alta «1 metro e 52, o forse 1,57»; il dato è sempre sbagliato ma almeno ora la fonte – il sito CelebHeights.com, che riporta l’altezza di personaggi famosi – è chiara, e si può cliccare sul link per capire con cosa si ha a che fare.

snippet hrc
Lo “snippet” che compare nella versione inglese di Google quando si cerca l’altezza di Hillary Clinton (Google)

Va detto che Google ha fatto dei cambiamenti ad alcuni tipi di riquadri informativi, a indicare che la società è consapevole del problema delle fonti. Negli Stati Uniti le ricerche di tipo medico mostrano ora dei riquadri verificati da medici di Google e della Mayo Clinic, una no-profit medica americana; quando si cerca un alimento o una ricetta il riquadro fornisce anche un link al database del Dipartimento dell’Agricoltura degli Stati Uniti sul cibo e l’alimentazione. «Il nostro obiettivo è essere utili. Siamo consapevoli che non saremo mai perfetti, esattamente come la conoscenza di una persona o di una biblioteca non è mai completa», ha detto un portavoce di Google, «lavoriamo sempre per migliorare e rendere più semplice la ricerca su Google, e fornire risultati più accurati». Finché Google avrà l’interesse commerciale ad apparire onnisciente, purtroppo, non farà molto per migliorare la trasparenza dei suoi riquadri informativi. Il compito di farlo spetterà a persone come Taraborelli, o a no-profit come Wikimedia Foundation, che sta sviluppando un database a licenza aperta che sarà in grado di fornire la fonte di tutte le sue informazioni e gestire quelle in contrasto tra loro. La speranza è che Google inizi ad attingere da questo database e a citare le sue fonti, invece di semplificare le pagine di Wikipedia.

La storia una volta veniva scritta dai vincitori, e poi dagli impallinati di informatica: ora è il turno degli algoritmi.

© 2016 – The Washington Post