Monde

Le triomphe de Trump a fait exploser toutes les boules de cristal

Les sondages d'opinion se sont trompés. Ceux qui les analysent aussi.

crystal ball / <a href="https://www.flickr.com/photos/eschipul/5154596724/in/photolist-8RuE2j-2jXoKY-2jXobW-oKASDK-q1ju6o-dV4wVB-da3A28-7ki5n9-da3Asi-CGf4U-fs2WHp-cCfCg-6ee5Rq-akAw78-aSPT6z-8zrXCx-sF9AZ-da3Abr-harzLG-bC3Ame-76jcmc-h1YYZK-54wa3g-GKCWhZ-dEBxxd-h1hb3G-94Bfrb-9mvmSo-akCdKQ-GxJR9w-FVtSHc-ddSwF9-pRn99w-QtqgV-7L2FFA-hNWNps-iwmBqs-nnHPrz-bVo445-mXW7Kk-jawLDg-5BH9fL-5rZNWf-7FZmQB-7b9B6Y-MYfdB-c6tCJu-5Ne8z5-HXgfoC-iM1FMn">Ed Schipul</a> via Flickr CC <a href="https://creativecommons.org/licenses/by-sa/2.0/">License by.</a>
crystal ball / Ed Schipul via Flickr CC License by.

Temps de lecture: 5 minutes

Pendant toute la campagne, Nate Silver, sans doute le prévisionniste électoral le plus réputé des États-Unis, a publié quotidiennement en temps réel les probabilités de victoire de Donald Trump et de Hillary Clinton. Soudain, le dernier week-end avant le scrutin, il a changé de registre et publié sur Twitter un autre genre de probabilité, en pastichant un discours de campagne de Michelle Obama:

«Quand vous vous abaissez, je reste digne 80% du temps, et je vous frappe dans les couilles les 20% restant.»

Dans ce tweet, Silver répondait à un article de Ryan Grim, le chef du bureau de Washington du Huffington Post, qui l'accusait de distordre les sondages pour surestimer les chances de victoire de Donald Trump, et de créer ainsi un faux suspense. La veille, le même Nate Silver s'était, dans un combat de nerds au sommet, chamaillé sur Twitter à coup de métaphores politico-sportives avec Sam Wang, un professeur de neurosciences de Princeton qualifié dans la presse de «héros de l'analyse de données» de la présidentielle. Cette fois-ci, la cause était la différence entre leurs prévisions, Silver voyant une victoire de Clinton comme probable (70% de chances environ) et Wang comme quasi-certaine (99%!).

Le même Sam Wang, lui, avait promis mi-octobre, quand la campagne du candidat républicain était au plus bas, de manger un insecte si Trump obtenait plus de 240 grands électeurs. Bon appétit!

La victoire de Trump est un échec monumental pour les prévisionnistes électoraux américains, qu'il s'agisse des sondeurs ou des analystes, dans un pays où la science de la prévision électorale semblait avoir atteint un haut degré de raffinement. Un échec qui fait de cette élection 2016 le «“Dewey bat Truman” de l'ère numérique», écrit le New York Times, en référence à la façon dont Harry S. Truman avait été réélu président des États-Unis contre toutes les prévisions en 1948. Une époque où on ne comptait que cinq instituts de sondage et où ils avaient arrêté leurs enquêtes à une semaine de l'élection...

«J'ai eu tort. Vraiment tort»

La veille de l'élection, les neuf principaux modèles listés par le New York Times donnaient tous Clinton gagnante, avec une probabilité allant de 71 à 99%. Mercredi matin, l'heure était à la gueule de bois chez leurs auteurs.

Larry J. Sabato, un chercheur de l'université de Virginie qui dirige le site Crystal Ball, a ainsi publié un article intitulé «Mea culpa, mea culpa, mea maxima culpa» en présentant ses excuses à ses lecteurs:

«Bon, qu'est-ce qu'on peut dire. On a merdé. [...] Nous avons entendu pendant des mois beaucoup d'entre vous nous dire que nous sous-estimions la taille d'un potentiel vote caché en faveur de Trump, ainsi que sa capacité à l'emporter. Nous ne l'avons pas cru, et nous avons eu tort. Notre boule de cristal est en miettes.»

Amy Walter, du Cook Political Report, tenait le même genre de discours:

«J'ai eu tort. Vraiment tort. Trump n'a pas seulement gagné, il a largement gagné. C'est vraiment la chose la plus stupéfiante que j'aie vue dans toute ma vie.»

Si ces analystes se sont trompés, c'est notamment parce que leurs «fournisseurs» de matière première, les sondeurs, se sont trompés. Selon la moyenne des sondages nationaux réalisée par le site RealClearPolitics, Hillary Clinton avait un peu plus de 3 points d'avance au matin du 8 novembre, alors qu'elle devrait finir en tête d'environ 0,2 point dans le vote national. Soit une différence de 3 points, qui finalement n'est pas si énorme puisqu'elle correspond à la marge d'erreur usuelle. En 2012, on avait constaté une erreur d'une ampleur identique, sauf qu'elle avait, grande différence, transformé une courte victoire d'Obama (1 point d'avance) en victoire plus confortable (4 points d'avance).

Pour expliquer cette «matière noire» des sondages, plusieurs hypothèses ont été avancées: un vote «caché» en faveur de Trump, une composition de l'électorat mal évaluée qui a débouché sur des échantillons erronés (l'équipe de campagne de Trump avait fait ses ultimes calculs en se basant sur un électorat âgé et sur une baisse de la participation des Afro-Américains) ou encore le nombre d'indécis, quatre fois plus élevé qu'au même point de la campagne en 2012.

Dans les dernières semaines de campagne, un seul sondeur, l'institut USC Dornsife, donnait constamment Trump devant, et le paradoxe est qu'il s'est trompé de la même façon, puisqu'il donnait 3 points d'avance au candidat républicain. Et le LA Times, qui publiait son sondage quotidiennement sur son site, avait lui annoncé une très large victoire de Clinton en se fondant sur «les sondages d'opinion, l'histoire électorale de chaque État et les reportages réalisés par [son] équipe».

«La question est de savoir comment vous vous en servez»

On en arrive au deuxième étage de la fusée: l'interprétation des sondages. «La data n'est pas morte, la data est bien en vie», a expliqué à Wired, alors que la victoire de Trump s'amorçait, son «Monsieur Données» Matt Oczkowski. «La question est juste de savoir comment vous vous en servez et comment vous pouvez rejeter des tendances politiques habituelles pour comprendre vos données.» Car la plupart des analystes ne se contentaient pas de calculer le résultat final en se fondant sur une simple moyenne arithmétique des sondages, ils y ajoutaient leur «sauce (plus ou moins secrète)»: le passé électoral de chaque État, la qualité des sondages, les erreurs de prévisions passées dans l'État, l'impact des conditions économiques, l'impact des petits candidats, le pourcentage d'électeurs indécis... Ce qui explique que certains pouvaient attribuer à l'élection de Clinton une probabilité de 99% tandis que dans le même temps, Nate Silver expliquait trois jours avant l'élection, à la télévision, que la secrétaire d'État était «à un État de perdre la présidence».

Lui-même, pourtant, lui avait donné une avance confortable. Alors qu'il s'était révélé aux yeux du grand public, en 2008 puis en 2012, en prédisant correctement 49 États sur 50 puis 50 États sur 50, il s'est cette fois-ci trompé sur cinq: le Wisconsin, le Michigan, la Pennsylvanie, la Caroline du Nord et la Floride, tous gagnés par Trump. Une particularité de la présidentielle américaine est que le sort des États est plus ou moins fortement corrélé entre eux, et qu'une variation assez faible du vote national peut transformer une confortable victoire en une incontestable défaite, le sort de plusieurs États s'inversant comme des dominos qui s'écroulent.

Beaucoup d'analystes des sondages pensaient pourtant que les bastions de Clinton pouvaient résister à une baisse de son score national, une théorie très contestée baptisée le «mur bleu». Un mur qui s'est effondré mercredi soir. Une possibilité que Nate Silver avait anticipée, tout comme il avait annoncé que si un candidat devait perdre l'élection en recueillant plus de voix que l'autre, ce serait Clinton.

Au final, Silver a eu tort, mais moins tort que les autres. Cette élection nous enseigne aussi à quel point il nous est compliqué, psychologiquement, de lire une probabilité, alors que, comme l'expliquait Fortune avant l'élection, «tout l'intérêt de l'analyse de données a toujours été de nous rendre les décisions plus faciles». C'est encore plus compliqué, sans doute, pour un événement comme une élection présidentielle. Si l'on vous dit que, demain, il y a 70% de chances qu'il fasse beau toute la journée, même si cette prévision ne se réalise pas, il est possible qu'il fasse quand même beau pendant quatre heures –et au pire, il y a toujours une autre journée le surlendemain. Une présidentielle, elle, est un choix binaire et figé: le 20 janvier 2017, ce ne sont pas 70% de Donald Trump qui feront leur entrée à la Maison-Blanche, mais bien 100%.

cover
-
/
cover

Liste de lecture