Pour faire basculer une élection avec de nouvelles informations, il vaut mieux les faire circuler parmi des gens qui ont le droit de vote. Selon une nouvelle étude signée du chercheur américain en sciences de l'information Emilio Ferrara, de l'University of Southern California, les MacronLeaks qui ont marqué la dernière ligne droite du second tour de la présidentielle ont bien connu une diffusion très importante sur Twitter, mais celle-ci s'est davantage déployée dans les milieux de l'alt-right américaine que parmi les électeurs français.
Pour analyser cette «campagne de désinformation» qui a véritablement décollé le 5 mai 2017, quelques heures à peine avant l'entrée dans la période de réserve électorale, le chercheur a collecté 17 millions de tweets postés à propos de la présidentielle française entre le 27 avril et le 7 mai 2017. Il a ensuite identifié, à partir d'une série de mots-clés, 350.000 tweets relatifs aux MacronLeaks, postés par environ 100.000 abonnés. En utilisant un algorithme de définition des bots, il estime qu'environ 18.000 bots ont participé à cette campagne, soit 18% du total, chiffre comparable à celui qu'il avait déjà constaté pendant la présidentielle américaine.
Plus d'un tweet par minute pendant 24 heures, sans dormir
Dans une analyse publiée peu après l'événement, le Digital Forensic Research Lab de l'Atlantic Council, un think tank américain, pointait que «au total, les dix comptes les plus actifs utilisant le hashtag #MacronLeaks ont posté plus de 1.300 tweets en un peu plus de trois heures, signe typique de l'utilisation de bots». D'autres analystes du groupe Data for Democracy avaient évalué que 5% des utilisateurs avaient posté 40% des tweets concernés sur une période de 24 heures les 5 et 6 mai:
«Le compte le plus prolifique a tweeté 1.668 fois en environ 24 heures –soit plus d'un (re)tweet par minute pour quelqu'un qui y passerait la journée entière sans dormir. Si cela est humainement possible pour un utilisateur extrêmement motivé, nous avons observé manuellement ce compte et d'autres très prolifiques et, pour plusieurs d'entre eux, les tweets survenaient à un rythme trop rapide pour être soutenu par un individu, laissant deviner qu'ils étaient le produit d'une automatisation davantage que d'un être humain très actif.»
La plupart des plus gros bots identifiés par Emilio Ferrara ont depuis été effacés par leur auteur ou suspendus par Twitter.
L'activité liée aux MacronLeaks sur Twitter entre le 27 avril et le 7 mai 2017. En gris, l'activité humaine, en violet, l'activité des bots. Source: Emilio Ferrara.
Pendant l'élection américaine, l'activité des bots avait également été suivie de près, une équipe de chercheurs ayant par exemple évalué que, durant le premier débat, un tiers de l'activité pro-Trump et un cinquième de l'activité pro-Clinton provenait de bots ou de comptes «hautement automatisés». Certains d'entre eux se sont apparemment reconvertis: Emilio Ferrara note que, parmi les plus actifs sur les MacronLeaks, on en trouve qui avaient été créés début novembre 2016, une semaine avant la présidentielle américaine, et n'avaient pas été actif depuis la victoire de Trump, ce qui suggère l'existence d'un «marché noir de bots de désinformation politique réutilisables».
MAGA, le mot le plus courant
Ces bots ont donc réussi à «doper» la conversation autour des fuites de documents, le chercheur constatant des pics d'activité de leur part précédant les pics d'activité humaine, et un afflux de milliers de followers supplémentaires vers leurs comptes. Mais pour quel résultat?
Emilio Ferrara a mené une analyse lexicographique des tweets en question, humains ou non. Plus de 50% d'entre eux étaient en anglais et moins de 40% en français. Si les quinze mots les plus fréquemment utilisés dans les tweets sur la présidentielle étaient tous en français, dans ceux utilisés dans le cadre des MacronLeaks, on trouve de nombreux mots anglais comme French, campaign, tax, leaked... Un phénomène tout aussi visible dans les bios des comptes participant à la conversation, puisque les deux mots les plus fréquents y sont MAGA («Make America Great Again») et Trump –Marine2017 n'arrive qu'en sixième position. Quant aux URL tweetées par ces comptes, il s'agit également en grande majorité de sites américains «alternatifs» comme The Gateway Pundit ou Zero Hedge. De la même manière, l'équipe de Data for Democracy notait en mai qu'alors que la majorité des tweets sur la campagne étaient en français, les expressions les plus récurrentes concernant les deux candidats («evasion 4chan», «Macron busted»...) étaient bien plus souvent en anglais, comme si «les utilisateurs anglophones de Twitter tentaient d'organiser le récit autour de chaque candidat, ou d'introduire de nouveaux récits».
Un diagramme des réseaux de tweets sur les MacronLeaks. En violet, le réseau anglophone, en vert, le réseau francophone. Source: rapport du TrendLab de la société de sécurité informatique TrendMicro.
Si ces phénomènes ne signifient pas en soi que des électeurs français n'ont pas été exposés aux contenus en question, Emilio Ferrara y voit des indices sérieux du fait que «la campagne de désinformation MacronLeaks a été surtout limitée à un public anglophone, et a échoué à pénétrer la communauté francophone de Twitter»:
«Les principaux participants aux MacronLeaks ne faisaient pas partie de la communauté francophone, mais plutôt de la base d'utilisateurs anglophones. Cela peut constituer une explication du succès limité de cette campagne de désinformation auprès des électeurs français.»
Ce succès plus imité qu'on ne le croit de la «propagande computationnelle» et des sources d'information «alternatives» sur Twitter avait déjà été souligné pendant la campagne française par une équipe de chercheurs de l'université d'Oxford qui estimaient que «les utilisateurs français partagent des informations de meilleure qualité que les utilisateurs américains, et presque autant d’informations de qualité que les utilisateurs allemands». Sur deux semaines différentes de campagne, d'abord mi-mars puis fin avril, ils estimaient qu'entre 40% et 47% des informations partagées sur Twitter appartenaient à la catégorie des «sources d'actualité professionnelles» et 20% à 30% aux «autres sources d'information politique», catégorie hétéroclite composée pour un quart environ de junk news, soit «diverses formes de propagande et de contenus politiques idéologiquement extrêmes, ultra-partisans ou conspirationnistes».
Un constat relativement optimiste, donc, même s'il est peut-être circonstanciel: comme l'expliquait au moment de l'entrée en fonctions de Macron le site The Daily Beast, dans le cas français, «l'influence des bots sur les réseaux sociaux paraît avoir stagné pour le moment. Mais s'il y a une chose que nous savons des films de science-fiction, c'est qu'à la fin, les robots gagnent toujours».