Tech & internet

Peut-on vraiment faire confiance à Twitter pour prédire les résultats d'une élection?

Repéré par Jean-Laurent Cassely, mis à jour le 16.10.2014 à 11 h 47

Repéré sur New York University / YouGov

La twittosphère n'est pas représentative de la population qui vote. Mais malgré tout, Twitter est un bon outil de prédiction...

Twitter Buttons at OSCON / Garrett Heath via Flickr CC License By

Twitter Buttons at OSCON / Garrett Heath via Flickr CC License By

De la corrélation entre l’humeur des utilisateurs et le cours de la bourse ou la météo, à la prédiction des futurs films du box-office en passant par la détection d’épidémie, l’analyse quantitative des tweets est un champ de recherche récent dont les objets semblent infinis.

Twitter étant devenu un espace public numérique sur lequel les débats politiques font rage, la prédiction de résultats d’élection, qui pourrait à terme concurrencer les sondages à partir d’échantillons représentatifs du corps électoral, est une des marrottes des spécialistes de l’analyse de tweets. Twitter est alors considéré comme le miroir fidèle des discussions de café du commerce, et plus le nombre d’utilisateurs augmente, plus son agora deviendrait un fabuleux capteur en temps réel des mouvements de l’opinion.

Or un article d’un chercheur de la New York University et d’un chercheur de l’institut de sondages YouGov, publié en ligne le 15 octobre, et réalisé sur un très large échantillon en Espagne et aux Etats-Unis, remet en cause la validité de l’hypothèse d’un Twitter reflet de la société.

Premier biais observé qui ne surprendra pas les habitués de la twittosphère politique, militante ou professionnelle: Twitter n’est pas un espace de participation égalitaire dans la mesure où au sein de l’échantillon étudié, 10% des utilisateurs ont produit 70% des tweets mentionnant un candidat. L’élite du 1% les plus actifs, elle, est responsable de 34,8% des tweets espagnols et de 44,6% des tweets américains…

1%

C'est la part des utilisateurs responsables de plus d'un tiers des tweets espagnols, et de près de la moitié des tweets américains, dans l'échantillon étudié.

La partie la plus fine de l’étude porte sur un échantillon de ces tweets politiques, publiés dans les 70 jours précédant les législatives espagnoles de 2011 (échantillon de 12.000 utilisateurs) et la présidentielle américaine (échantillon de 50.000).

Les résultats sont les suivants: les hommes occupent une place prédominante dans les débats en ligne (65% des utilisateurs en Espagne et 60% aux Etats-Unis). La géographie des tweets politiques révèle la surreprésentation des habitants des grandes agglomérations. Les Espagnols vivant dans les six plus grandes villes représentent 17% de la population et 32% du volume des tweets analysés. Les Américains qui vivent dans les neuf plus grandes villes représentent 7% de la population et 21% du volume des tweets analysés.

Enfin les discussions politiques sur Twitter sont plus polarisées, car les utilisateurs les plus marqués idéologiquement sont ceux qui participent le plus aux débats publics. La conséquence, écrivent les auteurs à la suite d’autres travaux sur le sujet, est qu’Internet fonctionne comme une «chambre d’écho dans laquelle les individus sont exposés à une information politique qui renforce leurs croyances antérieures». Ils mesurent également qu’au sein de cette frange très militante, les utilisateurs de droite sont un peu plus présents que ceux de gauche dans les discussions.

Les conclusions de cet article sont à rapprocher de la critique de l’idéologie de la Silicon Valley par la sociologue Jen Schradie, qui étudie les mouvement sociaux aux Etats-Unis et leur visibilité en ligne. Selon elle, plusieurs mythes perpétuent la croyance en un Internet qui serait espace virtuel de participation politique et citoyen plus égalitaire que l’espace physique, alors qu'il n'est souvent que le reflet fidèle de la stratification sociale dans la vraie vie.

Ajoutons à cela le caractère inhibant des réseaux sociaux: en France, une étude du Cevipof a montré que les opinions politiques était l'avant-dernière chose que les Français souhaitaient exposer en ligne (juste avant l'identité de leur conjoint). 

L'intérêt pour un candidat est plus prédictif que ce qu'on dit de lui

Faut-il pour autant considérer que l’analyse des utilisateurs de Twitter n’a aucun intérêt? Certainement pas, d’autant que plusieurs études précédentes sont parvenues à obtenir de meilleures prédictions de résultats d’élections que les sondages, malgré donc la faible représentativité du réseau social. 

Lors des élections du Congrès américain de 2010, une équipe de l’université de l’Indiana avait prédit à partir d’un échantillon de 542.969 tweets mentionnant un des candidats le résultat de 404 élections sur 435. Cependant les chercheurs ne s’attachaient pas au contenu des messages, mais simplement aux mentions. Comme il l'écrivaient alors pour expliquer cette fiabilité: 

«Si quelqu’un parle de vous, même en des termes négatifs, c’est le signe qu’un candidat est sur le point de gagner. L’attention accordée au vainqueur crée une situation dans laquelle toute publicité est une bonne publicité».

Même chose lors des primaires républicaines en 2011 pour élire le candidat à l’élection présidentielle américaine: le rythme de gain de followers donnait une prédiction fiable du rang qu’aurait le candidat à l’issue des primaires. Là encore, il s’agit de l’intérêt que suscite un candidat, de sa capacité à polariser le débat, plus que de sa côte de popularité dans l’opinion. 

En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites, vous proposer des publicités adaptées à vos centres d’intérêt et nous suivre sur les réseaux sociaux. > Paramétrer > J'accepte