Life

Un super ordinateur pour prédire les révolutions

Joshua Keating, mis à jour le 29.09.2011 à 5 h 15

Il n'existe pas encore. Mais une étude suggère que ça sera un jour possible.

Au Gamescom 2011 à Cologne. Ina Fassbender / REUTERS

Au Gamescom 2011 à Cologne. Ina Fassbender / REUTERS

Le 6 décembre 1941, le Foreign Broadcast Information Service (FBIS) («service d’information des diffusions étrangères»), un service chargé de l’écoute des radios étrangères, mis en place par la communauté américaine du renseignement et une des premières expérimentations de ce qu’on appelle aujourd’hui le renseignement en «source ouverte», livra son premier rapport: une analyse sur le sentiment des médias japonais vis-à-vis des Etats-Unis. Le rapport nota que les chaînes de radio japonaises avaient vu leurs critiques sur les Etats-Unis monter en flèche et avaient cessé leurs appels à la paix.  Le lendemain, Pearl Harbor fut bombardé.

Evidemment, aucune écoute des médias n’aurait pu révéler quand et où l’attaque aurait lieu (c’est pour ça qu’on a des espions), mais il est probable qu’avec une meilleure compréhension de ces signaux préparatoires à une attaque, les forces américaines n’auraient pas été aussi surprises. 70 ans plus tard, un spécialiste en informatique croit même qu’une version un peu plus ambitieuse de ce même type d’analyse des infos pourra bientôt prévoir des perturbations sociales et des conflits – comme les récentes révolutions dans le monde arabe – avec un degré remarquable d’exactitude.

Kalev Leetaru, le directeur adjoint pour les analyses textuelles et digitales à l’Institut pour l’Informatique appliquées aux Arts, aux Lettres et aux Sciences humaines de l’Université d’Illinois est un des chercheurs en pointe dans un domaine émergeant, la prédiction des conflits. Dans une étude publiée ce mois dans un journal technologique en ligne, dont les articles sont évalués de manière anonyme par un panel de spécialistes, First Monday, Leetaru prétend que «l’analyse quantitative de larges séquences de texte peut donner de nouveaux éclairages sur le fonctionnement de la société.»

L’étude de Leetaru transporte la recherche récente dans le domaine économique et examine la manière dont l’analyse du ton des infos et des média sociaux permet de prévoir certains événements économiques.  Une étude récente, par exemple, a démontré que l’analyse du sentiment général sur Twitter permet d’anticiper les mouvements de l’indice Dow Jones. Leetaru était curieux de savoir si ce même type d’analyse pouvait aussi prédire des événements sociaux. 

Des logiciels d'analyse des sentiments

Leetaru a utilisé plusieurs bases de données d’articles d’information des 30 dernières années, dont le «Summary of World Broadcasts» – des traductions anglaises de radios étrangères réalisées par l’équivalent britannique du FBIS – les archives digitales complètes du New York Times, et une analyse des sites d’infos en ligne pour créer une banque de données de presque 100 million d’articles d’information remontant jusqu’à 1979. 

Puis il a fait entré ce matériel brut dans un des superordinateurs les plus puissants du monde, le «Nautilus» de l’Université de Tennessee, et il a commencé à chercher des corrélations.

Ces dernières années, les sociétés déploient de plus en plus de logiciels d’«analyse des sentiments» qui prennent le pouls des médias. Considérez-les comme une forme hyper-sophistiquée de Google Alerts: ces logiciels scannent des articles de presse et ressortent des mots positifs et négatifs et peuvent ainsi distinguer la nature du sentiment exprimé, en faisant la différence entre «détester» et «ne pas aimer» par exemple.

Les logiciels ne perçoivent pas bien les nuances et peuvent être trompés par le sarcasme, mais étant donné l’ampleur des données avec lesquelles a travaillé Leetaru, ils donnent une assez bonne indication du sentiment global des médias sur un sujet donné.

Prenons l’Egypte.  En analysant le ton des médias du pays lors des trois dernières décennies, Leetaru a noté qu’au début de cette année, il était à son point le plus négatif depuis 20 ans:

En particulier, le sentiment bascule de manière abrupte dans la négativité pendant la première semaine de 2011, suite à l’attaque d’une église copte à Alexandrie. Et c’était quelques semaines avant le début des manifestations qui ont conduit à la chute de Moubarak le 11 février :

«La violence sociale est provoquée par la frustration», dit Leetaru. « Nous ne sommes pas à un point où nous pouvons dire “Dans deux semaines il y aura une émeute dans telle ou telle rue.” L’objectif plus raisonnable est de mesurer l’arrière fond.»

Leetaru note que pendant cette période, le PNB de l’Egypte, une mesure plus traditionnelle de la stabilité sociale, montait. Mais, argumente-t-il, le Président Hosni Moubarak avait perdu la confiance du peuple égyptien dans sa «capacité à assurer la sécurité» et le changement de sentiment indique une perte de «légitimité globale.»

Quelles sont les implications pratiques? Leetaru prend comme exemple les remarques publiques prudentes du président américain Barack Obama lors des premiers jours des manifestations. «D’après les évaluations faites au plus haut niveau, il y avait une forte suspicion que Moubarak resterait au pouvoir». Mais si la Maison Blanche avait eu accès à l’analyseur d’infos superpuissant Nautilus de Leetaru? Peut-être Obama aurait-il vu plus tôt la gravité de la situation de Moubarak.

La prédiction en temps réel est un objectif toujours lointain bien sûr. Regarder un événement qui s’est déjà passé et trouver des pré-indicateurs est un exercice très différent que de détecter ces indicateurs – sans véritable certitude – avant que l’événement ait lieu.  Il faut noter aussi que l’outil est loin d’être sans faille quand il s’agit des événements passés.

Etant donné le manque relatif de couverture médiatique, les indicateurs précédents les révolutions en Tunisie et en Libye n’étaient pas si clairs. Mais l’objectif actuel de Leetaru est de rendre les résultats consultables en temps réel. Mais même avec les 1024 processeurs du Nautilus -  le top de la ligne Mac en a 12, fournir et interpréter les résultats au moment où ils se passent n’est pas chose triviale. Mais le jour où ça sera possible, la technologie deviendra un agent de transformation du réel. 

Découvrir les planques de ben Laden et de Kadhafi

«Disons que le maire de Londres, une semaine avant les émeutes, aurait pu voir que sa ville était en train de plonger dans le chaos et que sa politique sociale avait atteint le point de rupture», suggère Leetaru. «S’il avait eu cette information, peut-être aurait-il mis en place des politiques d’urgence pour apaiser ces questions sociales, ou déployer la police plus rapidement avant que la violence ne se répande?»

Et Leetaru voit des applications pour ce type d’analyse non seulement dans le temps réel mais aussi dans l’espace.  Son analyse de la couverture médiatique sur Oussama ben Laden qui court de la fin des années 1990 jusqu’à son élimination en mai montre que 49% des articles faisant mention du chef d’ al Qaïda contenaient aussi une référence à une ville du Pakistan.

 Leetaru en tire la conclusion que l’analyse de la masse des contenus d’information «aurait suggéré que sa localisation la plus probable était au nord du Pakistan dans un rayon de 200 km autour de Islamabad et Peshawar.» (Google et les U.S. Centers for Disease Control and Prevention ont développé un projet assez similaire qui utilise l’analyse des résultats de recherche pour suivre les éruptions de pandémies de grippe).

Les médias ont porté une certaine attention à cette partie de l’étude de Leetaru cette semaine, mais elle est sans doute la moins convaincante.  S’il était généralement «connu» que Ben Laden se cachait au Pakistan, est-il vraiment utile de savoir que 100 millions d’articles de presse partageaient cet avis? (Une autre tentative largement rapportée menée par un professeur de l’UCLA pour trouver ben Laden en se servant de données biogéographiques a aussi abouti à la conclusion que partageaient la plupart des gens.) Et ne restez pas la langue pendante en attendant qu’on vous trouve le dirigeant en fuite de la Libye.  «Nous ne sommes pas encore au stade où je peux m’asseoir devant un ordinateur, taper 'Kadhafi' et le trouver», admet Leetaru.

Mais malgré ces limitations, le travail de Leetaru suggère qu’un moment viendra, dans un proche avenir, où cette exploitation des données fera parti des outils quotidiens des chercheurs en sciences politiques, tout comme la modélisation mathématique l’est déjà pour les prédictions sur les marchés. 

 La communauté américaine du renseignement semble déjà parier dessus, si on en juge l’invitation récente faite aux chercheurs par le Directeur de l’«Intelligence Advanced Research Projects Activity» (soit l’agence pour les projets de recherche avancée en matière de renseignement), appelant à développer des méthodes pour «détecter des événements inattendus en fusionnant des données publiques disponibles provenant de sources multiples.»

«On parle de l’océan des renseignements», dit Leetaru. «Nous avons passé les dernières décennies à regarder les vagues. Si vous regardez sous la surface,  il y a tout un monde de renseignements latents que nous commençons seulement à essayer de comprendre.»

Joshua E. Keating

Traduit par Holly Pouquet

Joshua Keating
Joshua Keating (148 articles)
Journaliste
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites, vous proposer des publicités adaptées à vos centres d’intérêt et nous suivre sur les réseaux sociaux. > Paramétrer > J'accepte