Che cosa vuol dire che Google deve cedere i suoi dati alla concorrenza

In mezzo ci sono anche i nostri, con molti dubbi sulla tutela della privacy

(Cesc Maymo/Getty Images)
(Cesc Maymo/Getty Images)
Caricamento player

Oltre a non avere reso necessaria la vendita del browser Chrome, il giudice che si è occupato della grande causa contro il monopolio di Google ha accolto solo in parte le richieste del dipartimento della Giustizia statunitense per quanto riguarda la condivisione dei dati del motore di ricerca con altre società. Secondo la sentenza di martedì, Google dovrà offrire alla concorrenza parte del proprio indice di ricerca e i dati di utilizzo degli utenti, resi anonimi.

Queste richieste erano uno dei punti centrali della vicenda legale e in queste ore gli esperti stanno discutendo molto sulle implicazioni della decisione del giudice, anche per quanto riguarda la privacy degli utenti. Google potrà comunque fare appello contro la decisione e avviare altre iniziative legali, quindi è probabile che passino anni prima che siano eventualmente messe in pratica le nuove regole.

Il giudice ha valutato quattro categorie principali di dati che il dipartimento di Giustizia voleva obbligare Google a condividere con la concorrenza, in modo da ridurre la sua posizione di monopolio nelle ricerche online negli Stati Uniti (e di fatto in buona parte del resto del mondo).

1. Indice di ricerca
Google dovrà fornire alla concorrenza una “fotografia” del proprio indice di ricerca, cioè dell’enorme quantità di dati che ha raccolto nel tempo su ciò che si trova all’interno dei siti, in modo da far funzionare il suo sistema per le ricerche online. In questa fotografia dovrà comprendere gli indirizzi, i dati sulla prima e sull’ultima volta che un sito è stato letto dai sistemi automatici di Google e alcune informazioni legate all’eventuale esistenza di siti che fanno spam. La società non dovrà invece condividere altri elementi come la popolarità e la qualità che attribuisce a ogni contenuto, sulla base dei suoi algoritmi, e che servono per stabilire l’ordine dei risultati nelle pagine di ricerca.

La condivisione con la concorrenza sarà una tantum, quindi Google non dovrà fornire periodicamente una versione aggiornata della fotografia del proprio indice. Dovrà però mettere in vendita questi dati per i suoi concorrenti senza margine di guadagno.

2. Knowledge Graph
Il dipartimento di Giustizia aveva chiesto che Google condividesse anche il Knowledge Graph, cioè il sistema che usa il motore di ricerca per mettere in relazione i contenuti dei siti e gli argomenti, proponendo per esempio schede riassuntive con dati raccolti da più fonti. Il giudice ha respinto la proposta perché questi dati derivano soprattutto da fonti terze, come i siti che Google consulta, e da processi e algoritmi interni che non costituiscono di per sé un vantaggio competitivo e non danneggiano quindi la concorrenza.

3. Dati pubblicitari
Tra le richieste del dipartimento di Giustizia c’era anche la condivisione da parte di Google dei dati relativi alla pubblicità, la principale fonte di ricavo per la società. Secondo il giudice la proposta era però troppo ampia e mal definita e senza prove sufficienti per dimostrare che la condivisione di quei dati avrebbe fatto aumentare la concorrenza, in un settore dove ci sono comunque già diversi accentramenti legati alla presenza di altri forti concorrenti come Meta e Amazon. Molti dati appartengono inoltre alle società e ai soggetti che decidono di farsi pubblicità, quindi sono altamente sensibili e difficili da divulgare.

4. Dati degli utenti
Era il punto più delicato delle richieste, soprattutto in tema di protezione dei dati personali. I dati in questione sono quelli che Google raccoglie ogni volta che qualcuno usa il suo motore di ricerca: non sono il nome o l’indirizzo email, ma le tracce di utilizzo che vengono lasciate durante la consultazione del servizio. Questi comprendono le frasi che si scrivono su Google per cercare le informazioni, il tipo di risultati visualizzati, quelli su cui si è cliccato, il tempo di permanenza sul link aperto prima di tornare alla pagina dei risultati, le correzioni di parole scritte male nelle chiavi di ricerca e il modo stesso in cui si è consultata la pagina dei risultati, facendola scorrere sul proprio dispositivo.

Tutti questi dati presi in massa da miliardi di utenti sono ciò che più di tutto alimenta Google, sia per permettere ai suoi algoritmi di capire che cosa funziona di più online ed è più consultato, sia per mostrare poi annunci pubblicitari pertinenti e quindi di maggiore valore.

Il giudice ha stabilito che Google deve condividere solo una parte di questi dati con la concorrenza, ma a precise condizioni. Dovrà rendere disponibili le chiavi di ricerca usate dagli utenti, i risultati mostrati e il modo in cui gli utenti hanno interagito, comprendendo anche i dati che potrebbero essere usati per addestrare i modelli di intelligenza artificiale collegati ai sistemi di ricerca online. Tutti questi dati dovranno essere forniti in forma anonimizzata, quindi applicando tecniche per renderli generici e per rendere impossibile risalire all’identità dei singoli utenti.

In pratica il giudice vuole che i concorrenti di Google possano avere accesso ai sistemi che la società ha usato per anni per rendere sempre più preciso il proprio motore di ricerca, potendo sfruttare risorse enormi maturate grazie alla propria posizione dominante, e quindi finora inaccessibili alla concorrenza.

Privacy
La decisione riguarda gli Stati Uniti, quindi si applica alle attività di Google (e di Alphabet, la holding che lo controlla) nel mercato statunitense, ma potrà avere conseguenze anche nel resto del mondo. Nell’Unione Europea sono stati avviati diversi procedimenti che riguardano proprio Google e le grandi società tecnologiche, con vincoli legati all’interoperabilità, cioè a una maggiore condivisione dei dati in loro possesso.

Al momento non è chiaro se le tecniche per rendere anonimi i dati saranno sufficienti per rispettare il regolamento europeo per la tutela della privacy (GDPR), e Google ha segnalato i rischi legati alle pratiche di condivisione che sono state richieste.

Tempi
Google ha manifestato più volte di voler fare ricorso in appello ed è probabile che saranno avviate altre cause nei prossimi mesi, quindi potrebbero essere necessari anni prima che le richieste del giudice vengano messe in pratica. Ulteriori sentenze potrebbero inoltre modificare quelle decisioni, riducendone ulteriormente la portata e lasciando sostanzialmente la situazione invariata.

Il settore delle ricerche online è comunque in rapida evoluzione soprattutto in seguito agli sviluppi legati alle intelligenze artificiali, che stanno riducendo molti dei vantaggi competitivi di Google. La circostanza è stata riconosciuta dallo stesso giudice, che ha però segnalato l’importanza di intervenire per evitare che Google o altri soggetti instaurino un nuovo monopolio, questa volta sulle ricerche online gestite con sistemi di intelligenza artificiale.