Tech & internet / Life

L'algorithme qui décode les sarcasmes est arrivé, et il est français

Temps de lecture : 2 min

lol brb :-) @/ Nicolas Nova via FlickrCC License by
lol brb :-) @/ Nicolas Nova via FlickrCC License by

«Merci à la RATP pour ce retard de deux heures.» Ce type de message n'est pas rare sur Internet mais est très problématique pour les entreprises qui cherchent à évaluer leur réputation en ligne. En effet, comment un programme peut-il déterminer, à partir d'une analyse littérale des mots, si le message est positif ou négatif? Autrement dit, comment percevoir le sarcasme?

L'entreprise française Spotter aurait trouvé la solution selon la BBC: un algorithme capable de repérer les sarcasmes avec 80% d'exactitude. Le directeur commercial de l'entreprise au Royaume-Uni, Richard May, précise:

«Rien n'est infaillible lorsque l'on parle de systèmes automatisés. Mais il y a cinq ans on ne pouvait pas avoir ce niveau de précision, on avait une limite de 50%.»

L'algorithme de Spotter associe des analyses linguistiques (étude des langues), sémantiques (étude du sens des mots) et heuristiques (science qui analyse la découverte des faits) –dans 29 langues– pour évaluer au mieux la e-reputation de ses clients. Richard May explique:

«On doit être très spécifiques selon les industries. Le mot "virus" est généralement connoté négativement. Mais si vous parlez de virus dans un contexte médical, ça peut ne pas l'être.»

Notons que pour bénéficier de ce service, les entreprises clientes –parmi lesquelles Air France par exemple– doivent débourser autour de 1.150 euros par mois (1.000 livres sterling).

Certains restent cependant sceptiques. Parmi eux, Simon Collister, professeur au London College of Communication, qui formule des réserves quant à la capacité des programmes à analyser le ton des messages postés en ligne:

«Ces outils sont souvent inutiles –quand il s'agit de comprendre le ton, le sarcasme, ça dépend trop du contexte et des langues. Ce sont des réseaux sociaux et ce qui les rend intéressants c'est le côté social –les machines ne peuvent tout simplement pas comprendre cet aspect à mon avis.»

En 2010, une équipe de chercheurs israéliens affirmait déjà avoir programmé un détecteur de sarcasmes:

«SASI, un algortihme semi-supervisé d'identification de sarcasme ("Semi-supervised Algorithm for Sarcasm Identification"), peut reconnaître des phrases sarcastiques dans les avis postés sur Internet avec une précision plutôt impressionante de 77%. Pour créer un tel algorithme, l'équipe a scanné 66.000 avis postés sur Amazon avec trois annotateurs référençant les phrases en prenant en compte les sarcasmes.»

C. S-G

Note: Nous avons contacté Spotter pour avoir plus d'information au sujet de l'algorithme. Nous n'avons pas pu avoir leur réponse au moment de la publication de cet article mais nous ferons une mise à jour dès que possible.

Mise à jour: Les méthodes heuristiques (du grec ancien eurisko, «je trouve») consistent à faire découvrir les faits. Une hypothèse heuristique par exemple est une hypothèse adoptée de façon provisoire comme fil conducteur d'une recherche, indépendamment de sa vérité absolue.

Cécile Schilis-Gallego

Newsletters

La Brigade de répression des incivilités en ligne

La Brigade de répression des incivilités en ligne

Chaque troll devrait se méfier.

De nouvelles publicités pro-Brexit sur Facebook, financées par un mystérieux site d'«informations»

De nouvelles publicités pro-Brexit sur Facebook, financées par un mystérieux site d'«informations»

Ces publicités invitent les utilisateurs à écrire à leurs députés afin de les inciter à rejeter le plan Chequers, qui régule les futures relations entre le Royaume-Uni et l'Union européenne.

Les fausses statistiques de Facebook sur les vidéos ont causé des centaines de licenciements

Les fausses statistiques de Facebook sur les vidéos ont causé des centaines de licenciements

Des journalistes de The Atlantic estiment que plus de 350 journalistes ont perdu leur emploi en partie en raison des statistiques données par Facebook.

Newsletters