Perché non fidarsi dei sondaggi online

Se ne è riparlato perché li cita spesso Donald Trump in suo favore, ma hanno enormi limiti di affidabilità statistica

Dopo il dibattito delle elezioni presidenziali americane di lunedì notte, il candidato Repubblicano Donald Trump si è vantato in più occasioni di aver battuto la candidata democratica Hillary Clinton, stando ai risultati di diversi sondaggi che ha citato più di una volta. La maggior parte degli analisti, tuttavia, ha un’opinione opposta e concorda sul fatto che il dibattito di Trump sia stato un disastro, e in molti hanno fatto notare che quelli citati da Trump sono tutti sondaggi effettuati online da diversi siti o sui social network, e che quelli effettuati con metodi scientifici da istituti seri hanno dato unanimemente Clinton come vincitrice. Nell’equivoco è caduto anche qualche giornale italiano, che ha descritto i sondaggi come “divisi”, mettendo sullo stesso piano cose che in realtà sono molto diverse tra loro, e trattando i sondaggi online come dei veri sondaggi. Il New York Times ha spiegato i motivi per cui ci si debba fidare poco di questo tipo di cose, a prescindere da Donald Trump e dalla politica americana.

Il New York Times spiega che i problemi dei sondaggi online fatti da siti e giornali sono soprattutto di rappresentatività del campione e di “sicurezza” del sistema informatico che permette di votare. I sondaggi sono affidabili quando il campione di persone contattate è adeguatamente variegato in relazione al corpo elettorale, o al gruppo di persone che parteciperà a una certa consultazione. Su internet, non possiamo conoscere età, sesso e inclinazione politica – per citare forse le tre più importanti – dei partecipanti a un determinato sondaggio. Inoltre, come fa notare il New York Times, «i risultati sono in larga parte un riflesso del “target” del sito e delle persone che in quel momento sono sufficientemente motivate per partecipare. Non è una sorpresa, insomma, che i lettori di siti come Breitbart NewsDrudge Report [due siti di news di destra e parecchio complottisti] considerino Trump vincitore, così come Clinton sarà messa meglio in sondaggi sui siti “di sinistra”».

Un esempio estremo della faziosità dei partecipanti è evidente in un sondaggio compiuto di recente da una rete televisiva di Philadelphia. Alla domanda su quale fosse la migliore squadra di football americano fra quelle ancora imbattute nel campionato di NFL, il 96 per cento dei partecipanti ha votato per i Philadelphia Eagles.

Altre volte il pregiudizio è più sottile: un recente sondaggio della Gazzetta dello Sport, per esempio, ha chiesto ai lettori se l’attaccante del Nizza Mario Balotelli meritasse di tornare a giocare nella Nazionale di calcio italiana, dopo un ottimo inizio di stagione con 4 gol nelle prime due partite. Quasi due terzi dei partecipanti hanno votato “no”, ma va tenuto in considerazione che la Gazzetta dello Sport è di Milano ed è il giornale di riferimento dei tifosi di Milan e Inter, due squadre in cui Balotelli non ha lasciato un grande ricordo.

balotelli

Intuitivamente, questo problema potrebbe essere risolto con un campione sufficientemente alto, magari con un sondaggio ospitato da un sito di news “tradizionale”. Fra i sondaggi citati da Trump ce n’è uno di CNBC a cui hanno partecipato 418mila persone, e che lo vede vincitore col 61 per cento delle preferenze.

Il guaio è che spesso sondaggi del genere non sono protetti a sufficienza dalle manipolazioni anche piuttosto semplici, come ad esempio il trucco di votare più volte nascondendo il proprio indirizzo IP, associato al sistema da cui si è connessi a internet. Il magazine Daily Dot, in occasione dei sondaggi dopo il dibattito fra Trump e Clinton, ha trovato traccia di diversi utenti di Reddit e 4chan che hanno incoraggiato i sostenitori di Trump a barare, linkando i sondaggi più vulnerabili dal punto di vista informatico e invitando a votare più volte per gonfiare i risultati del loro candidato.

C’è poi un terzo problema, e cioè lo sbilanciamento del campione a causa di una campagna nata online. MentalFloss ha messo insieme un elenco di sondaggi online i cui risultati sono stati pesantemente influenzati da persone che hanno votato su indicazione di altri, per far vincere una certa opzione. Nel 2012, ad esempio, la compagnia aerea norvegese Norwegian Air aveva pubblicato un sondaggio online per decidere la sua nuova mascotte: i fan della musica metal invasero il sondaggio votando in massa per Øystein Aarseth, il chitarrista della band black metal Mayhem ucciso nel 1993 dal bassista della band, Varg Vikernes (conosciuto anche col nome d’arte “Burzum“). Fu la stessa famiglia di Aarseth a chiedere a Norwegian Air di escluderlo dal sondaggio. Una cosa simile, anche se più innocua, era successa quando il Natural Environment Research Council, un’agenzia del governo del Regno Unito che si occupa di ricerca scientifica, aveva aperto un sondaggio online per decidere il nome della sua nuova nave da ricerca, costata circa 350 milioni di euro. Vinse un nome stupido e insensato per via di una campagna che nacque autonomamente online con lo scopo di fare una cosa buffa e divertente.

In Italia molti giornali online hanno progressivamente abbandonato i sondaggi online veri e propri. Dal 2014, per esempio, il Corriere della Sera ha un sistema che permette di votare con delle faccine il proprio stato d’animo dopo aver letto un certo articolo. I giornali sportivi postano spesso sondaggi piuttosto innocui – tranne i rari casi in cui succede un incidente – con le questioni più discusse del momento. Un caso a parte è quello di Libero, i cui sondaggi seguono la linea provocatoria e spesso offensiva del resto del giornale.