Perché i sondaggi sbagliano le previsioni

Molti si sono stupiti dell’abbaglio preso da vari sondaggisti sulle elezioni presidenziali americane. Sembrava che tutti, o almeno la gran parte, pronosticassero con una certa fiducia la vittoria di Hillary Clinton e invece ... Come mai? Non voglio mostrare certezze e motivazioni che non ho, ma vorrei presentare alcune osservazioni legate al sistema elettorale presidenziale americano: maggioritario secco in ogni stato (con l’eccezione di un paio) e Grandi elettori.

Immagino che i sondaggisti statunitensi scelgano i campioni in ogni stato e dividano le loro considerazioni stato per stato. Ma anche così operando è difficile ottenere stime veramente affidabili.

Voglio esemplificare con una situazione astratta e di facile comprensione.

Immaginiamo di avere 10 stati equivalenti, cioè con lo stesso numero di votanti, per esempio 1 milione ciascuno, e lo stesso numero di Grandi elettori: 10.

Se i sondaggi in 9 di questi stati danno al candidato A il 51% dei voti e nel decimo stato danno al candidato B il 70% dei voti, globalmente verranno ad assegnare (virtualmente) al candidato A 4.890.000 voti popolari e a B 5.110.000 voti popolari, vale a dire globalmente il 49% circa ad A e il 51% a B. Ma A avrebbe 90 voti di Grandi elettori, contro i 10 di B: A vince con largo margine, ha il 90% dei voti dei Grandi elettori.

Ma sappiamo bene che le stime ottenute con i sondaggi hanno per loro natura un margine di errore, che spesso viene ottimisticamente valutato del 3%. Vorrei osservare che qualche settimana fa su The New York Times è apparso un articolo di David Rothschild (economista di Microsoft Research) e Sharad Goel (professore alla School of Engineering della Stanford University) dove, con una analisi di 4221 campagne elettorali per la presidenza degli stati e per il senato, gli autori mostrano che il reale margine d’errore tra risultati reali e stime dei sondaggi è del 7%.

Mettendoci nella condizione più ottimistica del 3% di margine, vediamo cosa può capitare nel nostro esempio astratto.

Se in 5 dei 9 stati dove A è dato avere il 51% dei voti popolari c’è un errore per eccesso del 3% e negli altri 4 un errore per difetto del 3% rispetto ai dati reali, cosa accade ad A? Viene ad avere il 48% dei voti popolari in 5 stati ed il 54% negli altri 4: così avrà 40 Grandi elettori contro i 50 di B. Se nell’ultimo stato l’errore è molto alto e per eccesso, per esempio il 15%, B vince ancora ottenendo i 10 Grandi elettori. In conclusione A ottiene 5.010.000 voti popolari contro i 4.990.000 di B, ma B vince.

Che insegnamento possiamo trarre da queste semplici considerazioni? In un sistema complesso una relativamente piccola variazione dei parametri, le stime dei sondaggi rispetto alla realtà delle votazioni può far cambiare completamente una situazione che a prima vista poteva sembrare ben assestata, così ribaltando i risultati attesi.

(*) matematico, Università di Milano

Commenti

Main partner