Quando si avvicina il momento di un’elezione, le pagine dei giornali e le puntate dei talk show televisivi si riempiono di numeri: sono i risultati dei sondaggi, che provano a dirci in anticipo chi vincerà, di quanto, in quali aree geografiche e grazie a quali gruppi demografici. Spesso le previsioni si rivelano corrette, ma capita che i sondaggi sbaglino per motivi sia statistici che sociologici. È successo molte volte anche negli Stati Uniti: alle elezioni presidenziali del 2016, per esempio, quasi tutti i principali sondaggi davano come molto probabile la vittoria della candidata democratica Hillary Clinton, che poi però perse contro il repubblicano Donald Trump. Le dimensioni di quell’errore furono oggetto di molte discussioni, perché dipendenti da molti fattori, complessi, ma la sostanza fu che quasi tutti indicarono una vittoria quasi certa della candidata sbagliata.

Questo e altri errori meno pesanti hanno indebolito nel tempo la credibilità dei sondaggi: quattro anni dopo, nel 2020, in pochi erano disposti a fidarsi del grande vantaggio di cui era accreditato Joe Biden. Più in generale ci si chiede spesso quanto i sondaggi possano essere affidabili o addirittura se abbia ancora senso farli. È un tema non facile che unisce la statistica, la politica e la sociologia: prevedere il futuro è impossibile, ma un’interpretazione corretta dei sondaggi può comunque aiutare a capire meglio le caratteristiche di una società tanto eterogenea come quella statunitense.

L’obiettivo principale dei sondaggi è quello di conoscere cosa pensa un certo gruppo di persone su un determinato tema. Si possono fare sondaggi su praticamente tutto, dall’approvazione o meno del diritto all’aborto al livello di simpatia per un personaggio televisivo. Una delle categorie più diffuse e più citate di sondaggi è proprio la politica. I sondaggi possono essere fatti prima di un’elezione per cercare di capire le intenzioni di voto e sapere quale candidata o candidato ha le maggiori possibilità di vincere, ma anche durante il corso di un mandato, per conoscere l’opinione degli elettori su determinati temi o sull’amministrazione in carica.

«Crediamo che i sondaggi abbiano un ruolo fondamentale in un sistema democratico: sono pensati per dare voce a ogni cittadino e controllano l’operato dei politici di tutti gli schieramenti, i quali altrimenti potrebbero semplicemente dire di sapere cosa pensano i loro elettori», ha spiegato nel 2018 Scott Keeter, ricercatore del Pew Research Center, un centro studi specializzato nell’analisi dell’opinione pubblica e degli andamenti demografici.

Negli Stati Uniti i sondaggi politici possono essere curati da aziende specializzate nel settore, dai centri di ricerca, dalle università o dai media, quindi dai giornali e dalle reti televisive che poi presentano i risultati al loro pubblico. Possono anche essere commissionati agli istituti demoscopici dai partiti e dai comitati elettorali dei candidati, ma in questi casi generalmente i risultati rimangono privati.

È quasi sempre impossibile intervistare tutte le persone coinvolte dal fenomeno che si vuole indagare. Per questo i sondaggi si basano su un campione, ossia un insieme di persone che fanno parte della popolazione di riferimento e sono in grado di rappresentarla nel miglior modo possibile in base a molti parametri, tra cui l’età, il genere, lo stato sociale, il reddito, l’etnia. La rappresentatività dei campioni è sempre stato un argomento fondamentale nelle discussioni tra esperti di sondaggi: un gruppo poco rappresentativo può influenzare notevolmente i risultati e compromettere la loro aderenza alla realtà.

Il metodo più comune per formare un campione rappresentativo è quello del random sampling, con cui il gruppo di riferimento viene selezionato in modo completamente casuale, spesso ricorrendo a degli algoritmi. In questo modo, tutti i componenti della popolazione in questione hanno esattamente la stessa probabilità di essere selezionati. Per comodità molte società di sondaggi hanno creato dei panels, ossia dei gruppi di riferimento con persone selezionate inizialmente in modo casuale, ma che poi si sono dette disposte a rispondere e partecipare in modo continuativo alle indagini. Un esempio di questi database è l’American Trends Panel, curato dal Pew Research Center e composto da 10mila cittadini statunitensi con un’età superiore ai 18 anni.

Oggi molti sondaggi negli Stati Uniti si basano su un campione di circa mille componenti. Può sembrare strano che un insieme così piccolo sia in grado di rappresentare le opinioni di un paese con oltre 330 milioni di abitanti, ma tutto dipende dalla composizione del gruppo, che deve assomigliare il più possibile a quella della popolazione di riferimento: per esempio devono essere presenti, in scala, lo stesso numero di persone afroamericane, di persone a basso e alto reddito, di residenti in città o in zone rurali, e così via.

Un sondaggio basato su un campione più ampio permette di ridurre il margine di errore, ossia le possibilità che i risultati del sondaggio siano sbagliati, ma comporta anche costi molto più alti. Secondo Gallup, una delle principali società sondaggistiche degli Stati Uniti, un campione di mille persone rappresenta un buon compromesso tra costi e accuratezza dei risultati.

Esistono poi varie tecniche per migliorare la rappresentatività di un campione relativamente piccolo, come quella di “pesare” l’importanza attribuita ai vari componenti in modo da assicurarsi che ogni categoria sia rappresentata in modo proporzionale. Un’altra distinzione importante da fare per ottenere una previsione accurata è quella tra registered voters, quindi le persone che hanno diritto a votare ma non è detto che lo faranno, e i likely voters, ossia gli elettori registrati e che molto probabilmente andranno davvero a votare. Per capirlo a volte è sufficiente chiederlo direttamente all’intervistato, oppure si può cercare di prevedere se quella persona parteciperà o meno a un’elezione analizzando le sue abitudini passate.

Per decenni il metodo principale usato per intervistare le persone selezionate è stato quello delle chiamate telefoniche. Negli ultimi anni però il tasso di risposta è calato drasticamente, complice la diffusione dei telefoni cellulari e soprattutto della rete internet. Di conseguenza la procedura è diventata molto dispendiosa a livello di costi, tempo e risorse impiegate per chiamare migliaia di persone al telefono. Oggi le telefonate continuano a essere usate da molti sondaggisti, ma vengono spesso affiancate da altri metodi.

I sondaggi online, per esempio, stanno diventando sempre più comuni, ma ci sono ancora alcuni dubbi riguardo alla loro accuratezza: quelli che coinvolgono un gruppo rappresentativo della popolazione generale sono considerati affidabili, mentre quelli condotti con il metodo opt-in sono più problematici. In quest’ultimo caso la possibilità di partecipare viene offerta casualmente a chiunque navighi online: è quindi probabile che il campione che si forma non sia rappresentativo. In generale, un buon sondaggio dovrebbe indicare chiaramente ai lettori alcuni elementi necessari per valutarne l’affidabilità, per esempio la grandezza del campione, il modo in cui i componenti sono stati selezionati, le date delle interviste, chi l’ha finanziato e chi l’ha svolto.

Un elemento importante dei sondaggi è la capacità di interpretare le intenzioni di voto di gruppi demografici ben precisi: si pensa per esempio che gli afroamericani votino per il partito Democratico, mentre gli uomini di mezza età che vivono in periferia siano per lo più repubblicani. Si tratta ovviamente di generalizzazioni, che però possono essere utili a capire meglio la composizione della società americana e le sue trasformazioni.

Oggi infatti stanno cambiando molti degli equilibri elettorali che fino a poco tempo fa erano considerati solidi: per esempio un sondaggio condotto a novembre del 2023 dal New York Times e dal Siena College, un’università privata nello stato di New York, ha mostrato che molti elettori afroamericani, soprattutto uomini, si stanno avvicinando alle proposte del partito Repubblicano, mentre i giovani tra i 18 e i 29 anni sono divisi sostanzialmente a metà tra Biden e Trump. In passato gli afroamericani e i giovani tendevano a votare Democratico.

Negli ultimi anni si è discusso spesso del calo di affidabilità dei sondaggi, soprattutto dopo le elezioni presidenziali del 2016. Al tempo la candidata Democratica era Hillary Clinton, dalla lunga esperienza politica: senatrice per lo stato di New York tra il 2001 e il 2009, e poi segretaria di Stato nella prima amministrazione di Barack Obama, fino al 2013. È anche la moglie dell’ex presidente Bill Clinton, e quindi fu first lady per otto anni, tra il 1993 e il 2001. Al contrario il suo sfidante, l’imprenditore Repubblicano Donald Trump, allora era conosciuto principalmente per il suo ruolo di conduttore nel reality televisivo The Apprentice, e non aveva alcuna esperienza politica.

Per mesi quasi tutte le società di sondaggi diedero Clinton in netto vantaggio su Trump. Fino al giorno dell’elezione, l’8 novembre, il sito FiveThirtyEight – un aggregatore di sondaggi generalmente considerato molto affidabile – prevedeva che Clinton avesse il 72 per cento di possibilità di vittoria, contro il 28 per cento di Trump. Lo scrutinio dei voti provò che una bassa percentuale non significa che una cosa sia impossibile: Trump vinse l’elezione e diventò presidente.

Bisogna però aggiungere un ulteriore livello di complessità. In realtà nel 2016 i sondaggi nazionali furono piuttosto accurati, mentre qualche errore ci fu soprattutto in quelli statali.

I sondaggi nazionali infatti prevedevano che Clinton avrebbe ottenuto in termini assoluti più voti rispetto a Trump, ed è andata proprio così: Clinton prese quasi 66 milioni di voti, pari al 48,2 per cento, e Trump quasi 63 milioni, il 46 per cento. Nel sistema elettorale statunitense però non diventa presidente il candidato che prende più voti, ma tutto dipende dai risultati ottenuti nei singoli stati: in base alla popolazione, ognuno attribuisce al candidato che vince in quello stato un certo numero di “grandi elettori”. Per essere eletti è necessario raggiungere la maggioranza assoluta dei grandi elettori, quindi almeno 270. Nel 2016 Clinton ottenne 227 grandi elettori, e Trump 304, risultando quindi il candidato vincente pur senza essere il più votato.

Negli anni successivi sono state fatte molte analisi per cercare di capire cosa fosse andato storto. Secondo alcuni osservatori, nel processo di composizione dei campioni i sondaggisti avevano sottovalutato l’importanza del livello di istruzione delle persone intervistate, un fattore che può influenzare molto le decisioni di voto: le persone bianche con un diploma universitario tendono a votare Democratico e sono più propense a partecipare ai sondaggi, mentre quelle con un livello di istruzione più basso sono considerate più vicine ai Repubblicani e spesso evitano di rispondere.

Tra le varie ragioni fu citato anche il fatto che molti elettori che fino all’ultimo si dicevano “indecisi” votarono infine per Trump, oppure che alcune persone intenzionate a votare per Trump si vergognassero a dirlo ai sondaggisti, a causa della sua irriverenza e della presunta mancanza di credibilità della sua candidatura.

Nel 2020 i sondaggi prevedettero la vittoria del candidato democratico Joe Biden e la sconfitta di Trump, ma attribuirono a Biden un margine molto più ampio di quello poi effettivamente ottenuto. In quell’occasione i sondaggisti avevano aggiustato i loro criteri per cercare di correggere gli errori fatti quattro anni prima, ma nel frattempo erano entrate in gioco nuove variabili che vanificarono in parte i loro sforzi.

Molto ebbe a che fare con la campagna di politicizzazione e screditamento dei media portata avanti da Trump: durante tutto il suo mandato da presidente, Trump attaccò molte volte i giornali e le reti televisive percepite come più vicine ai Democratici, tra cui CNN, il New York Times e il Washington Post. Prese di mira molti giornalisti definendoli «feccia», «corrotti» e «alcune delle persone peggiori che potreste mai incontrare», e in generale tentò di presentare il loro lavoro come inaffidabile e fazioso. Per questo, la fiducia di molti suoi sostenitori nei confronti dei risultati dei sondaggi presentati proprio dai media calò enormemente, dissuadendo molti dal partecipare.

I sondaggi riuscirono a indicare correttamente il risultato complessivo dell’elezione, e quindi la vittoria di Biden, ma finirono per sovrastimare di vari punti percentuali i suoi consensi e sottostimare invece quelli di Trump.

Il 2016 e, in misura minore, il 2020 sono stati due tra i casi più recenti in cui i sondaggi hanno sbagliato, ma nella storia delle elezioni statunitensi ci sono stati episodi ancora più eclatanti che ancora oggi vengono citati quando si parla di errori statistici. Alle elezioni del 1936 si sfidarono il democratico Franklin Delano Roosevelt, che aspirava a ottenere il suo secondo mandato, e il repubblicano Alf Landon. Tutti i sondaggi indicavano Roosevelt come favorito, con un’eccezione: la rivista settimanale Literary Digest, secondo cui il vincitore sarebbe stato Landon. La Literary Review era una pubblicazione molto rispettata, che faceva spesso sondaggi con risultati generalmente affidabili.

In occasione delle elezioni ne condusse uno basandosi su un campione di oltre 2 milioni di persone formato a partire dai suoi abbonati, dagli elenchi telefonici e dalle liste dei proprietari di automobili, lussi che al tempo pochi potevano permettersi. Le persone intervistate, insomma, non erano rappresentative della società ma erano perlopiù uomini benestanti che tendevano a votare per il partito Repubblicano. I risultati furono fuorviati anche per il fatto che molti sostenitori di Roosevelt, considerato il candidato largamente favorito, preferirono non rispondere, mentre i suoi oppositori si mostrarono più motivati a indicare l’intenzione di votare per Landon. L’ultimo numero della Literary Review fu stampato due anni dopo il clamoroso errore, nel 1938.

Intanto sempre nel 1936 la società di ricerca statistica e analisi dell’opinione pubblica Gallup condusse un sondaggio basato su un campione di 50mila persone, quindi molto più piccolo di quello usato da Literary Digest, ma composto con una selezione casuale e sistematica che garantisse la rappresentatività. I risultati si dimostrarono molto più vicini alla realtà rispetto a quelli della Literary Review: Gallup, fondata solo un anno prima, ottenne molta visibilità e ancora oggi è uno tra gli enti più rispettati nel settore.

Un caso ancora più clamoroso fu quello del 1948, quando i due candidati alle elezioni presidenziali erano il democratico Harry Truman e il repubblicano Thomas Dewey.

All’epoca praticamente tutti i sondaggi indicavano una sconfitta di Truman: i risultati erano presentati come talmente certi che il quotidiano Chicago Daily Tribune stampò in anticipo la prima pagina del 3 novembre, il giorno successivo al voto, con il titolo: “Dewey batte Truman”. Come sappiamo, le cose andarono diversamente e Truman vinse con il 49,6 per cento dei voti: la foto del presidente eletto con in mano il giornale che annuncia, erroneamente, la sua sconfitta è tra le più note nella storia dei sondaggi e della politica americana. Negli anni successivi varie analisi provarono a spiegare gli evidenti errori dei sondaggisti, tra cui soprattutto la poca attenzione attribuita ai cambiamenti nelle intenzioni di voto nelle ultime settimane della campagna elettorale.

In un’intervista con il podcast del New York Times “The Daily”, l’analista politico Nate Cohn ha detto che non necessariamente dobbiamo smettere di fidarci dei sondaggi, ma che i loro risultati possono avere effetti diversi in base al livello di accuratezza. Esistono sondaggi imprecisi ma comunque utili, oppure tanto sbagliati da risultare inutili. In alcuni casi però gli errori commessi nella previsione dei risultati elettorali possono essere non solo poco utili, ma anche fuorvianti e controproducenti: «Nel 2016 e nel 2020, alcuni sondaggi caddero in questa categoria».