Tech & internet / France

Le nuage de fumée créé par les sondages en ligne

Même s'ils donnent parfois le même résultat que les enquêtes réalisées par les instituts, les sondages en ligne sont facilement détournables. Doit-on donc vraiment continuer à parler de «sondages»?

<a href="https://www.flickr.com/photos/saulalbert/22523323340/in/photolist-5bgFJa-apmCfB-AjiVk3-tJadb-hamUxh-a1SMyu-oUf7rb-bXLc1G-4ZgrAs-69oCuS-qG687C-9WH8a1-55WZ61-cunQLs-68V8Bk-p5whz9-8T5KHV-9qovQ2-neR16V-7mbp8X-96Ftnp-6CdRnp-PJVqM-pNq9Mg-7mfhF5-7mbpae-4BNSep-6y2FNp-8Pkt2n-6y2Gv8-4CzZA5-x94q14-rSWFqR-rNx3k5-ds4zgS-bvpCWR-psfLL-bqG2K-PuYw4M-7mboVR-5FgqWX">Internet trolling</a> | The People Speak! via Flickr CC <a href="https://creativecommons.org/licenses/by/2.0/deed.fr">License by</a>
Internet trolling | The People Speak! via Flickr CC License by

Temps de lecture: 6 minutes

Nous sommes en 2017, et certaines personnes accordent toujours de l'importance aux sondages en ligne.

Avant même la fin du débat de ce 4 avril, les sites de médias ont commencé à publier leurs sondages, et appelé les internautes à voter pour savoir quel candidat les avait le plus convaincus, ou s'en était le mieux sorti. Au choix, RTL, 20 MinutesLe Figaro, ou encore M6 ont eu la bonne idée d'en publier un sur leur site, certains précisant néanmoins, comme RTL que le sondage était «à valeur non scientifique». Dans le meilleur des cas, il donnera «un reflet», prévient de son côté 20 Minutes.

Ce genre de sondages est plutôt habituel sur les sites web. Ils permettent de faire participer le lecteur et d'accumuler les visites et l'engagement. Le problème, c'est qu'ils sont souvent pris d'assaut par les soutiens de certains candidats, ce qui en rend toute lecture impossible.

Pour nous en rendre compte, il nous a simplement fallu surveiller quelques endroits d'internet où ces militants sont actifs: les forums, des comptes Twitter, des salons de discussion Discord... Là, certains se partagent les liens vers ces sondages, appelant parfois leurs abonnés ou leurs amis à aller voter pour leur candidat. Sur internet, on appelle ça du «brigading», une pratique consiste à mobiliser une communauté pour faire pencher une discussion, un sondage... Voici, par exemple, un cas répertoriant plusieurs sondages postés sur le salon de discussion des Insoumis, le groupe de soutien de Jean-Luc Mélenchon.

En soi, il n'y a là rien de vraiment interdit (certaines tentatives de brigading en revanche peuvent aller très loin, notamment sur Reddit). Mais ce qui rend ce genre de sondages encore moins crédibles, c'est que, comme on a pu le tester de notre côté, il est possible voter à plusieurs reprises sur chacun d'entre eux. Bien loin des pratiques des instituts de sondage. Car quand un sondeur interroge une personne pour une enquête d'opinion ou une étude, celle-ci ne vote qu'une fois.

Dans le cas de ceux que nous avons testés, un même internaute peut voter à de multiples reprises pour son candidat préféré et, à chaque fois, son vote sera pris en compte. Pour cela, pas besoin de manœuvres compliqués. Il suffit simplement d'ouvrir à chaque fois une nouvelle fenêtre de navigation privée.

Nous avons ainsi pu voter pour chacun des onze candidats en quelques minutes.

Qui vote vraiment?

Le sondage RTL compte, à l'heure nous publions, un peu plus d'1,37 million de votes. De quoi s'interroger sérieusement sur l'origine de chaque clic transformé en vote.

Sur des forums et des salons de discussions, nous avons ainsi pu voir au cours de la soirée des gens accuser les autres partis d'utiliser des bots, et des scripts pour faire monter automatiquement les votes de candidats, sans même avoir besoin de clics réels. C'est de cette manière, accusent certains militants, qu'Emmanuel Macron a rattrapé rapidement son retard dans le sondage RTL, avant que Jean-Luc Mélenchon ne réapparaîsse à ses côtés. Le tout avant que Jean Lassalle ne prenne la tête en fin de soirée.

Sur le forum 18-25 de jeuxvideo.com, on assure que ce sont des membres du forum qui sont responsables du succès de ce dernier, grâce à un bot, conçu pour voter automatiquement en faveur du candidat centriste, sans que l'on ait réussi à le vérifier. Certains de ces membres accusent les pro-Mélenchon d'en avoir fait de même plus tôt dans la soirée. Sur les salons de la plateforme Discord, nous avions notamment noté un appel pour trouver une personne capable de truquer le sondage pour faire remonter Jean-Luc Mélenchon. Encore plus tôt, on avait vu des soutiens de Jean-Luc Mélenchon accuser les pro-Macron d'avoir fait la même chose.

Sans aller jusque-là, ce n'est pas la première fois qu'un tel phénomène se produit. En mars, lors du premier débat, on avait déjà remarqué des militants pro-Mélenchon partager entre eux des liens vers les sondages de 20 Minutes, de RTL, ou du Parisien. Surprise, ils ont vu leur candidat l'emporter dans nombre d'entre eux.

Et cela ne vient pas uniquement de la base militante. Lors d'un reportage, «Quotidien» avait remarqué que l'équipe numérique du candidat s'était particulièrement concentrée sur le sondage Facebook organisé par TF1: le candidat de la France Insoumise s'était finalement largement imposé. Sur les images, on peut voir une vingtaine de personnes, toutes avec un ordinateur devant elles, en train de commenter le sondage, pendant qu'une télé retransmet le débat.

«Ici, raconte le journaliste, on a un objectif: faire monter Mélenchon le plus haut possible dans les sondages sur internet, alors on passe son temps sur le sondage Facebook pour voter frénétiquement, et inciter à voter, et ça marche.»

Ces soutiens s'étaient ensuite émus de voir un autre sondage –scientifique cette fois– donner Emmanuel Macron vainqueur devant Jean-Luc Mélenchon. Seule explication possible pour quelques-uns: les médias et les instituts de sondage truquent les résultats. Pour autant, certains essayaient de trouver les raisons de cet écart. En lisant les commentaires des soutiens de Jean-Luc Mélenchon, on trouve ceci, qui résume bien la situation:

Le précédent américain

En septembre 2016, les Américains ont assisté à un phénomène similaire. Donald Trump avait remporté la grande majorité des sondages en ligne, alors qu'Hillary Clinton était l'élue des personnes interrogées par les instituts de sondage.

En fait, expliquions-nous à l'époque, la raison à cet écart était en fait facilement identifiable. Les soutiens de Donald Trump, très organisés sur le web, s'étaient partagé les liens sur des plateformes comme Reddit, 4chan, ou Twitter, appelant à voter autant que possible pour donner l'impression que leur poulain était vainqueur. Donald Trump lui-même avait donné de l'importance à cette théorie en publiant sur son compte Twitter une sorte de compilation de tous ces sondages en ligne.

De quoi se demander s'il ne faut pas finalement les surveiller plus assidûment. Les journalistes de FiveThirtyEight, spécialistes de l'analyse de sondages, avaient alors expliqué que ces questionnaires n'ont en réalité aucune valeur.

«Disons que vous vous voulez savoir qui est l'équipe préférée des fans de baseball. Vous allez faire votre sondage devant le stade New York Yankees. Voilà l'équivalent de ce genre de sondages. Et les fans des Yankees se mobilisent pour participer à votre sondage. [...] Ces sondages ne veulent absolument rien dire.»

Pour Carl Bialik, un autre journaliste du site, «chacun de ces sondages devrait être laissé de côté, en tout cas en tant qu'indicateur déterminant qui a vraiment remporté le débat».

Des communautés très puissantes

Mais s'ils servent à une chose, c'est bien à mesurer le niveau d'implication de communautés de soutien aux candidats. Et, sans grosse surprise, les soutiens de Jean-Luc Mélenchon arrivent souvent en tête. Pour autant, cela ne veut pas dire que ce soutien se traduira dans les urnes. À titre d'exemple, Nate Silver, le journaliste américain de FiveThirtyEight avait dressé une comparaison intéressante. Pour lui, si on devait se fier à de tels sondages, le libertarien Ron Paul serait président des États-Unis, et le Démocrate Bernie Sanders, vice-président.

En deux participations aux primaires républicaines, en 2008 et 2012, Ron Paul a remporté une seule primaire organiséee par le parti. C'était celle organisée aux Îles Vierges, il y a cinq ans. Quand il s'est présenté sous l'étiquette libertarienne, en 1988, il avait récolté 0,47% des suffrages. Quant à Bernie Sanders, il a été largement battu lors de la primaire démocrate 2016.

Alors oui, ces sondages permettent à des communautés de montrer leur puissance sur le web –ou de troller, pour le LOL–, mais ils n'ont aucune valeur prédictive, contrairement à ce que pensent certains.

«Si vous êtes dans un univers où vous vous vantez de ces sondages en ligne, comme de vrais sondages, alors on vous a perdus», critiquait Nate Silver, le fondateur du site FiveThirtyEight, en octobre dernier.

La Commission des sondages a finalement réagi en voyant que les Français accordent parfois à ces sondages en ligne autant de valeur qu'à ceux réalisés par les instituts de sondage –qui doivent respecter certaines règles pour publier les leurs. Elle a tenu à faire la différence entre les deux dans un communiqué publié quelques jours avant le deuxième débat.

«Comme lors des précédentes élections présidentielles, la commission des sondages constate la multiplication d’enquêtes réalisées auprès d’internautes dont les résultats, présentés comme résultant de sondages, sont accessibles en ligne. Les personnes qui répondent librement aux questions posées ne constituent pas des échantillons représentatifs et les résultats de ces enquêtes ne constituent pas des sondages au sens de la loi.»

Selon la loi, «un sondage est, quelle que soit sa dénomination, une enquête statistique visant à donner une indication quantitative, à une date déterminée, des opinions, souhaits, attitudes ou comportements d'une population par l'interrogation d'un échantillon».

Autant dire que l'on ne parle pas des des études comme celles de Brand Analytics ou de Filteris, contre lesquelles la Commission des sondages s'est également positionnée.

On peut émettre des critiques légitimes à propos des sondages, les véritables sondages, ceux réalisés par des instituts. On peut parler de leur méthodologie, de la façon dont ils présentent les résultats sans toujours accorder l'importance nécessaire aux marges d'erreur, ou critiquer leur influence sur la façon dont les médias vont ensuite suivre la campagne.

Mais, malgré tout, ils restent plus fiables et légitimes que n'importe quel sondage en ligne, que tout internaute peut s'amuser à truquer en y passant suffisamment de temps. C'est en cela qu'il ne faut pas parler de «sondage» pour ceux qui sont réalisés sur ces sites.

Pour mettre fin à cette confusion, le journaliste américain Nate Silver affirme avoir une solution:

«Je n'appelle pas ça des sondages, ou des sondages en ligne, mais des “clickers”. Ce ne sont pas des sondages, on ne devrait pas les appeler ainsi.»

Il ne reste plus qu'à trouver un équivalent français pour plaire à l'Académie française.

cover
-
/
cover

Liste de lecture