Nous savons de source sûre que Cesar Sayoc, suspecté d’avoir envoyé des colis piégés à des personnalités politiques démocrates fin octobre aux États-Unis, n’est pas un robot russe. Sa photo d’identité judiciaire prouve qu’il s’agit d’un être humain, fait de chair et d’os, et non d’un programme informatique.
Mais si l’on se contentait de lire les messages qu’il a postés sur son compte Twitter, aujourd’hui fermé, il n’aurait pas été si évident d’en arriver à cette conclusion: on aurait très bien pu en déduire que Sayoc était en réalité un robot. Et cela pose problème.
L’existence de fausses personnes sur internet est bien antérieure à la candidature de Trump à l'élection présidentielle américaine. À l'époque, il était cependant facile de faire la différence entre une personne lambda surfant sur internet et un profil généré par ordinateur. Les robots n’étaient tout simplement pas bons pour imiter le discours et les modes de communication humains.
Avec les chatbots d’autrefois, comme Eliza, il fallait être extrêmement crédule –ou terriblement en manque d’affection– pour croire qu’une vraie personne vous répondait. Mais ce n’est plus si simple aujourd’hui, non seulement parce que les robots imitent de mieux en mieux le langage humain, mais surtout parce que les êtres humains se comportent de plus en plus comme des robots.
Sommeil troublé
Même lorsque la création des personnes virtuelles n’en était qu’à ses balbutiements, il n’existait aucun moyen sûr de savoir qu'un ou une internaute était en fait un robot. Pourtant, il y a souvent de gros indices. L’un des plus fiables est le sommeil: les êtres humains doivent dormir, pas les robots. Si vous tombez sur un compte qui tweete 24h/24, sept jours sur sept, vous pouvez être certain qu'il s'agit d'un robot –ou alors d'une sorte de cyborg permettant à un robot de poster pour lui pendant qu’il est inconscient.
Heureusement, Twitter rend assez facile le téléchargement de tweets pour vérifier si les gens dorment –ou pour réaliser d’autres analyses, d'ailleurs. Tout ce que vous avez à faire est d’écrire un programme informatique qui se connecte aux données de Twitter –d’un point de vue technique, l’API Twitter– et vous pourrez vous en donner à cœur joie. Ces derniers mois, quand j’avais du temps devant moi, j’ai fureté un peu partout et j’ai trouvé quelques comportements intéressants.
Dans les illustrations présentées ci-dessous, les heures auxquelles l’internaute poste ses tweets sont relevées sur une horloge de vingt-quatre heures (minuit en haut, midi en bas), et plus le point est éloigné du centre, plus le nombre de tweets postés à cet horaire précis est grand.
Prenons par exemple @hankarnold54, un «vétéran patriote et nationaliste» qui compte bien reprendre l’Amérique en main. Si l’on reporte les heures auxquelles ont été postés ses tweets sur l'horloge, on s’aperçoit qu’il ne dort jamais et qu’il préfère poster ses tweets à la demie de chaque heure, créant un graphique en rayons de soleil.
Je n’ai aucune difficulté à dire qu’il s’agit d’un robot. Je lui ai envoyé un tweet pour lui poser la question, mais je n’ai pas reçu de réponse, alors même que le compte continuait à émettre de la propagande de droite.
@hankarnold54 Hello, Mr. Arnold; I'm a journalist writing a story for @Slate and feel rather silly asking this... but are you a bot? If not, can you give me your coordinates so we can chat? Thanks.
— Charles Seife (@cgseife) 2 novembre 2018
«@hankarnold54 Bonjour M. Arnold. Je suis journaliste, et j'écris actuellement un article pour @Slate. Je me sens un peu bête de vous demander ça, mais... Êtes-vous un bot? Si ce n'est pas le cas, pourriez-vous me donner votre contact pour discuter? Merci.»
Comparons maintenant le graphique de @hankarnold54 à celui d’un humanoïde typique –moi, en l'occurence. On remarque une période de sept ou huit heures durant laquelle j’arrête mon activité sur internet, qui indique que mon rythme de sommeil est plutôt normal.
Sayoc, lui, ne présente apparemment pas un rythme du sommeil ordinaire. La période de pause sur son horloge journalière est assez courte et ne se trouve pas à l’endroit typique. Il semble que Sayoc ne dormait pas beaucoup. Et quand il le faisait, c’était en milieu de journée.
D’un autre côté, un robot peut prétendre qu’il dort. Et de fait, de nombreux robots présentent un rythme diurne. Dans bien des cas, ces rythmes semblent d’ailleurs plus naturels que celui de Sayoc.
Ainsi, se fonder sur les rythmes du sommeil n’est pas une méthode infaillible pour distinguer les êtres humains des robots. Parfois, les robots semblent plus humains que les êtres humains eux-mêmes. Et c'est également le cas lorsque l’on analyse d’autres variables.
Tweets en rafale
La plupart des internautes ne passent pas la majeure partie de leur temps à envoyer des salves très rapides de tweets, en observant seulement une à deux secondes de pause entre chaque message.
Voici un graphique du laps de temps que j’ai tendance à attendre entre chaque tweet. L’axe des abscisses (horizontal) représente le temps de pause en secondes, tandis que l’axe des ordonnées (vertical) représente la fréquence à laquelle une pause de cette durée est marquée.
Durée de pause entre chaque tweet de @cgseife
Maintenant, intéressons-nous à ce twitto, que l’on peut sans crainte considérer comme un robot, même si son profil ne le mentionne pas:
Durée de pause entre chaque tweet de @chug_soylent
On remarque à quel point il est commun pour les robots de poster des tweets à intervalles très rapprochés –moins de huit secondes, voire quatre ou même deux secondes.
Si les véritables internautes ne tweetent pas aussi rapidement, une petite portion d’entre nous n’en est pas loin. Cesar Sayoc, par exemple, postait également des messages en rafale:
Durée de pause entre chaque tweet de @hardrockinLent
Le cas de Cesar Sayoc est loin d’être atypique. Sur ce plan, son comportement sur le réseau social est même plus humain que celui de bien d’autres twittos.
Les dernières semaines avant son arrestation, Sayoc ne postait plus qu’entre dix et quinze tweets par jour, alors qu'il n’est pas rare de voir de véritables internautes tweeter au rythme effréné de cinquante à cent posts par jour, si ce n’est plus –chose insignifiante pour un robot, mais qui semble assez incroyable pour quelqu’un ayant un travail à côté. Incontestablement, les personnes qui peuvent suivre un tel rythme quotidien se comportent davantage comme des machines que comme des personnes faites de chair et d'os.
À LIRE AUSSI Twitter, paradis des «bots»?
Conversations reproductibles
Cette tendance des êtres humains à reproduire le comportement des robots est encore plus nette et plus alarmante lorsqu’il s’agit d’analyser le contenu et la nature des communications.
Fake news et propagande sont diffusées aussi bien par de véritables personnes que par des robots. Il existe des preuves que les robots ont été en grande partie responsables de la diffusion de fausses informations. Mais les êtres humains agissent aussi comme des machines de désinformation très efficaces.
Durant l’été, j’ai suivi quelques sites internet publiant des fausses nouvelles et j’ai remarqué que les rumeurs qui prenaient vraiment de l’ampleur dans la twittosphère étaient en général celles qu’une personne réelle –souvent un compte vérifié– relayait et amplifiait, avec l’aide de robots en arrière-plan.
Un important fil défendant l’idée ridicule que «rejoindre les antifa est désormais illégal, passible d’une peine de quinze ans de prison» peut ainsi être attribué à une personnalité d’internet, Jacob Wohl (qui serait à l’origine de la campagne de diffamation ratée contre Robert Mueller), qui tiendrait lui-même la fausse info d’un site de fake news bien connu.
L’étude approfondie des messages que postent les internautes sur les réseaux sociaux montre qu’il existe un mode de convergence encore plus fondamental entre comportements humains et automatisés. Twitter, Facebook et les autres réseaux sociaux sont conçus pour faciliter les communications avec les autres: il suffit de cliquer sur un bouton pour liker ou retweeter.
Même quand les gens veulent s’exprimer en ligne de façon moins superficielle, ils ont souvent recours à une myriade d’émoticônes, de hashtags, de liens et de références–une succession simple de symboles, qui ne nécessite pas forcément de connaître la grammaire et la syntaxe du discours humain. Et c’est précisément cette grammaire et cette syntaxe qui posaient problème aux chatbots d’autrefois. En se dispensant de ces règles, on se met à parler un langage beaucoup plus adapté aux machines.
Autrement dit, ce ne sont pas les robots qui deviennent beaucoup plus sophistiqués et mieux programmés pour imiter les communications humaines; ce sont les conversations humaines qui, grâce aux réseaux sociaux, changent au point qu’elles deviennent plus faciles à reproduire.
Les ordinateurs commencent enfin à passer le test de Turing pour une raison qu’Alan Turing lui-même n’aurait pu imaginer: c’est nous qui ressemblons de plus en plus à des robots.