La legge di Benford e il voto in Russia

Ieri ci sono state le elezioni presidenziali in Russia. Il risultato, immagino non esattamente imprevisto, è stato che Vladimir Putin ha vinto al primo turno, superando il 60% dei voti. Meno voti di otto anni fa (alle elezioni precedenti non poté presentarsi perché c’è un limite di due mandati consecutivi) ma pur sempre tanti voti. Molti avevano parlato già a priori di brogli elettorali, e sono subito stati pronti a gridare alla manomissione dei voti: beh, al Guardian hanno provato a fare un rapido test statistico, con risultato…

Le elezioni russe e la legge di Benford

Le elezioni russe e la legge di Benford (dal Guardian)

I giornalisti del Guardian hanno preso i dati relativi ai voti di circa 2150 seggi, scelti perché erano presenti degli osservatori russi che hanno subito pubblicato i dati provvisori; hanno poi verificato i voti presi da ciascun candidato in ogni seggio, considerato la prima cifra (quindi da 146 hanno preso 1), e plottato queste cifre rispetto ai valori teorici dati dalla legge di Benford. Il risultato lo potete vedere qui a fianco: c’è una grossa discrepanza. L’articolo ha anche un grafico simile per i soli voti assegnati a Putin, che è ancora meno simile al grafico a forma di iperbole predetto dalla legge di Benford, avendo un andamento a campana gaussiana.

Allora abbiamo trovato le prove dei brogli? Macché. Come afferma lo stesso giornalista del Guardian – che ha il vantaggio di avere come collega Ben Goldacre, che potrà avere un caratteraccio ma che i conti li sa fare – l’esperimento lascia il tempo che trova per una semplice ragione statistica. La legge di Benford, come avevo spiegato a suo tempo nel post citato sopra, è un’invariante di scala. Questo letteralmente significa che se si raddoppiano o dimezzano tutti i valori allora i numeri ottenuti devono conformarsi alla legge, ma ha come corollario che i valori devono essere molto variabili, e collocarsi tra svariati ordini di grandezza per fare predizioni valide. Se per esempio si hanno solo numeri compresi tra 800 e 3000, chiaramente non si potrà mai avere una distribuzione delle prime cifre a forma di iperbole, per l’ottima ragione che non ci possono essere numeri che inizino con 4, 5, 6 e 7. Questo è proprio il caso dei tipici seggi elettorali: un’analisi di questo tipo è pertanto destinata a fallire anche senza tenere in conto altri fattori come lo studio storico dei flussi elettorali e via discorrendo.

Morale della storia? I modelli matematici sono tanto belli, ma prima di fidarsi ciecamente di essi bisogna verificare se stanno davvero modellando!

Mostra commenti ( )