Tech & internet / Life

L'algorithme qui décode les sarcasmes est arrivé, et il est français

<a href="http://www.flickr.com/photos/nnova/2966643687">lol brb :-) @</a>/ Nicolas Nova via FlickrCC <a href="http://creativecommons.org/licenses/by/2.0/deed.fr">License by</a>
lol brb :-) @/ Nicolas Nova via FlickrCC License by

Temps de lecture: 2 minutes

«Merci à la RATP pour ce retard de deux heures.» Ce type de message n'est pas rare sur Internet mais est très problématique pour les entreprises qui cherchent à évaluer leur réputation en ligne. En effet, comment un programme peut-il déterminer, à partir d'une analyse littérale des mots, si le message est positif ou négatif? Autrement dit, comment percevoir le sarcasme?

L'entreprise française Spotter aurait trouvé la solution selon la BBC: un algorithme capable de repérer les sarcasmes avec 80% d'exactitude. Le directeur commercial de l'entreprise au Royaume-Uni, Richard May, précise:

«Rien n'est infaillible lorsque l'on parle de systèmes automatisés. Mais il y a cinq ans on ne pouvait pas avoir ce niveau de précision, on avait une limite de 50%.»

L'algorithme de Spotter associe des analyses linguistiques (étude des langues), sémantiques (étude du sens des mots) et heuristiques (science qui analyse la découverte des faits) –dans 29 langues– pour évaluer au mieux la e-reputation de ses clients. Richard May explique: 

«On doit être très spécifiques selon les industries. Le mot "virus" est généralement connoté négativement. Mais si vous parlez de virus dans un contexte médical, ça peut ne pas l'être.»

Notons que pour bénéficier de ce service, les entreprises clientes –parmi lesquelles Air France par exemple– doivent débourser autour de 1.150 euros par mois (1.000 livres sterling). 

Certains restent cependant sceptiques. Parmi eux, Simon Collister, professeur au London College of Communication, qui formule des réserves quant à la capacité des programmes à analyser le ton des messages postés en ligne:

«Ces outils sont souvent inutiles –quand il s'agit de comprendre le ton, le sarcasme, ça dépend trop du contexte et des langues. Ce sont des réseaux sociaux et ce qui les rend intéressants c'est le côté social –les machines ne peuvent tout simplement pas comprendre cet aspect à mon avis.»

En 2010, une équipe de chercheurs israéliens affirmait déjà avoir programmé un détecteur de sarcasmes:

«SASI, un algortihme semi-supervisé d'identification de sarcasme ("Semi-supervised Algorithm for Sarcasm Identification"), peut reconnaître des phrases sarcastiques dans les avis postés sur Internet avec une précision plutôt impressionante de 77%. Pour créer un tel algorithme, l'équipe a scanné 66.000 avis postés sur Amazon avec trois annotateurs référençant les phrases en prenant en compte les sarcasmes.»

C. S-G

Note: Nous avons contacté Spotter pour avoir plus d'information au sujet de l'algorithme. Nous n'avons pas pu avoir leur réponse au moment de la publication de cet article mais nous ferons une mise à jour dès que possible. 

Mise à jour: Les méthodes heuristiques (du grec ancien eurisko, «je trouve») consistent à faire découvrir les faits. Une hypothèse heuristique par exemple est une hypothèse adoptée de façon provisoire comme fil conducteur d'une recherche, indépendamment de sa vérité absolue.  

cover
-
/
cover

Liste de lecture