Science & santé

Journalisme-robot: le soulèvement des machines à écrire

Will Oremus, traduit par Peggy Sastre, mis à jour le 27.07.2014 à 9 h 45

Les «robots» sont étonnamment bons quand il s'agit de rédiger certains articles de presse, mais les humains ont toujours une belle longueur d'avance.

2001, Odyssée de l'espace

2001, Odyssée de l'espace

Voici les premiers paragraphes de deux dépêches économiques. L'une a été écrite par un humain, et l'autre par un ordinateur. Êtes-vous capable de faire la différence?

Article n°1:

BURBANK, Calif. (AP) — La Walt Disney Company (DIS) vient d'annoncer une augmentation de 33% de son bénéfice net pour son premier trimestre d'exercice, ce qui dépasse les estimations des analystes.

Disney, dont le siège est à Burbank, en Californie, a gagné 1,84 milliards de dollars lors de ce trimestre, contre 1,38 milliards de dollars l'an dernier à la même période. Le bénéfice par action a grimpé à 1,03$, il était de 77 cents l'an dernier.

L'estimation moyenne des analystes référencés par Zacks s'élevait à 92 cents par action.

Son chiffre d'affaire a augmenté de 7%, de 11,34 milliards à 12,31 milliards. Les analystes prévoyaient 11,8 milliards.

Article n°2:

LOS ANGELES (AP) — Disney a publié mardi ses statistiques du second trimestre, des résultats qui pulvérisent les prévisions de Wall Street, boostés par les recettes vidéo des films «La reine des neiges» et «Thor: le monde des ténèbres».

Deux blockbusters qui traduisent toute la puissance d'une politique de rachat de marques de contenu chiffrant à plusieurs milliards de dollars. «Thor» est la conséquence des quatre milliards déboursés par Disney pour Marvel Entertainment en 2009. Quant à «La reine des neiges», le film est le résultat direct d'une réinjection de talents créatifs au sein de Pixar, après son rachat par Disney en 2006, pour 7,4 milliards de dollars.

La différence saute aux yeux, n'est-ce pas? La seconde dépêche a été rédigée par un journaliste économique d'AP, Ryan Nakashima. La première, par un robot. Écrite de main d'homme, cette histoire de gros sous a l'air plus naturelle et ménage une place au «pourquoi», tandis que la version rédigée par le robot se borne au «qui-quoi-quand-où».

Pour autant, l'une des agences de presse les plus colossales du monde a décidé de laisser champ libre aux robots, du moins pour certains types d'articles. Le mois dernier, Associated Press annonçait que «la majorité des dépêches concernant les résultats financiers d'entreprises américaines seront désormais générées grâce à une technologie automatisée».

Dans les prochaines semaines, les premiers articles écrits par une machine –en l'espèce, un logiciel conçu par Automated Insights, une start-up basée à Durham, en Caroline du Nord, et traitant des données collectées par Zacks Investment Research– seront intégrés en direct au fil international d'AP.

La plateforme logicielle d'Automated Insights, Wordsmith, est d'ores et déjà en service chez Edmunds pour générer des descriptions de voitures et chez Yahoo, pour les récapitulatifs personnalisés de Fantasy Football, destinés à des millions d'utilisateurs. Forbes publie pour sa part des prévisions financières grâce au logiciel d'une entreprise concurrente, Narrative Science, basée à Chicago.

Les journalistes ont peur des «robots»

L'avènement d'un journalisme automatisé a été accueilli par certains professionnels avec horreur et dégoût. Ils ont peur que les «robots» leur volent leur boulot ou fassent baisser leur salaire. D'autres, soulignant la qualité d'expression assez sèche et, de fait, robotique, des articles, ont préféré hausser les épaules face à cette histoire de presse automatisée et la considérer comme une lubie absurde. 

Les deux camps ont tort. En journalisme, comme ailleurs, les «robots» –la pertinence voudrait d'ailleurs qu'on parle plutôt de progiciels– ne peuvent concurrencer les humains là où les humains sont les meilleurs. Mais ils sont bien plus rapides et plus efficaces sur certaines tâches de base. En temps voulu, ils pourraient même détecter des logiques qu'un Pulitzer aguerri serait capable de négliger. Et, parallèlement, pour des raisons que je m'apprête à détailler, ils sont condamnés à méconnaître des éléments que le plus débutant des reporters considérera comme évidents.  

Tout d'abord, voyons sur quoi les humains sont les meilleurs. Nous sommes bons pour raconter des histoires, pour choisir des anecdotes intéressantes, formuler des analogies, créer des connexions. Nous sommes bons pour donner un cadre à l'info: pour trier la masse informe de données qui entoure un événement d'actualité et y détecter une forme familière. Et, intuitivement, nous savons ce que nos homologues humains auront le plus de chance de trouver pertinent et intéressant. Aucune de ces compétences n'est naturelle pour les machines.

En théorie, avec suffisamment de données, de sophistication, d'apprentissage et de puissance de calcul, de bons progiciels pourraient acquérir une telle finesse. Mais apprendre à des machines à penser comme des humains est l'une des gageures technologiques – exception faite d'Eugene Goostsman et de sa pâle imitation d'un garçon de 13 ans – dont nous sommes le plus loin. Si nous y parvenons, son impact sur le journalisme ne sera pas vraiment l'une des premières préoccupations de l’humanité. 

Et, encore une fois: même par rapport à tout ce que pourront faire les ordinateurs, quand il s'agit de penser comme un humain, les humains sont d'ores et déjà ceux qui y arrivent le mieux.

9,5 articles écrits par seconde

Les supports informatiques sont, à l'évidence, bien meilleurs en termes d'informatisation – c'est-à-dire pour balayer de grands ensembles de données, y trouver des schémas cohérents et les traiter. Et ils sont aussi plus fiables. Ils ne seront pas aux toilettes, au restaurant ou à dormir comme une masse au moment d'un gros événement d'actualité. 

Et ils sont aussi bien plus rapides. Avec les bons algorithmes, ils peuvent transformer des inputs (les données brutes d'un tableur de 40 pages, par exemple) en outputs (une dépêche de 150 mots) en moins de temps qu'il faudra à un journaliste pour dire «et si j'écrivais là-dessus?» à son rédacteur en chef. En outre, une fois que vous avez conçu votre logiciel, la stricte rédaction des articles représente un coût marginal proche de zéro. C'est ainsi qu'Automated Insights a réussi à pondre 300 millions de textes l'an dernier pour ses différents clients – à un rythme moyen de 9,5 articles par seconde. Un bilan qu'ils espèrent tripler cette année.

L'un dans l'autre, comparés aux humains, les logiciels possèdent donc un avantage majeur en termes de rapidité quand il s'agit de synthétiser les données essentielles d'un rapport financier. Et ils sont aussi l'outil idéal pour rédiger des articles auxquels les humains n'auraient autrement pas accès, comme les récapitulatifs de matchs de la Little League et autres rencontres de Fantasy Football mentionnées ci-dessus.   

Ou, comme l'écrit Kevin Roose, du New York «les articles que les robots sont aujourd’hui capables d'écrire sont, franchement, le genre de textes que les humains détestent de toute façon rédiger». J'avais soulevé un argument similaire dans mon article sur Quakebot, le programme qu'utilise le Los Angeles Times pour pondre des dépêches à chaque tremblement de terre. Et Robbie Allen, le PDG d'Automated Insights, est du même avis: «L'automatisation est une augmentation du travail des journalistes, m'a-t-il dit. Quand vous n'avez plus besoin de journalistes ayant en permanence l’œil rivé sur le moindre bilan financier, vous pouvez les orienter sur d'autres tâches». 

Mais que se passera-t-il quand les machines gagneront en intelligence? Qu'est-ce qui les empêchera de marcher sur les plates-bandes des journalistes?

Les machines ont-elles un style?

Vous pourriez penser que ce qui sépare l'écriture humaine du robot-journalisme est la capacité d'écrire avec un certain style. En fait, les machines d'Automated Insights n'ont pas trop de mal à rédiger des articles empreints d'ironie, si c'est ce que demande le client. Voici, par exemple, quelques lignes extraites des récapitulatifs de Fantasy Football pour Yahoo.

«Bonne nouvelle, mauvaise nouvelle: la bonne, c'est que l'équipe Boss Team de Benjamin a été tout à fait cohérente. La mauvaise, c'est qu'elle a été de manière tout aussi cohérente la pire du championnat en termes de points projetés (en première, comme en seconde période).

«Fantasy Fútbol: On est dans la version américaine, les gars. La Boss Team de Benjamin a préférer tabler sur deux attaquants, plutôt que de gagner en profondeur sur ses autres positions»

Le sarcasme n'est ici qu'une variable parmi d'autres du logiciel, que vous pouvez moduler selon vos propres préférences et besoins.

Dans un avenir plus ou moins proche, ce qui empêchera les robots-journalistes de manger le pain des humains, ce n'est pas la qualité d'écriture des machines. Aussi étrange que cela puisse paraître, ce sera surtout la qualité de leurs données.

Voyez comment, dans l'article d'Automated Insights sur Disney, il n'est fait aucune mention de la Reine des Neiges ou de Thor, des films récents que les lecteurs peuvent tout de suite associer à l'entreprise. La raison en est que le logiciel, qui se fonde exclusivement sur les données financières de Zacks, n'a aucun moyen de savoir que ces films sont liés aux rachats de Pixar et de Marvel effectués par Disney et à leur l'importance stratégique. Et même s'il le savait, il n'aurait pas pu mettre tout cela dans une perspective plus générale, comme l'a fait Nakashima, le journaliste d'AP, en disant que ces films «traduisent toute la puissance d'une politique de rachat de marques de contenu chiffrant à plusieurs milliards de dollars».

Dans un bilan financier de Disney, sélectionner ce qui est le plus susceptible d'intéresser les lecteurs d'articles économiques n'est pas une affaire de puissance de calcul. L'important, c'est de disposer des bonnes données. Un bon article sur Disney nécessite d'avoir un journaliste qui sait déjà dans quel mouvement s'insère l'entreprise, quels sont ses projets et quelle est leur importance dans une perspective plus large. L'article de Nakashima offre aussi un semblant d'éclairage sur l'une des questions économiques les plus primordiales du XXie siècle: est-ce qu'en général, les gigantesques acquisitions de marques de contenu méritent tout l'argent déboursé? Le bilan de Disney laisse entendre un oui, du moins dans certaines circonstances.

Les progiciels peuvent analyser l'intégralité d'un tableur en une fraction de seconde. Ils peuvent rapidement comparer tous les chiffres présents avec d'autres ensembles de données, issues de bilans antérieurs, de moyennes historiques, ou des performances récentes d'entreprises concurrentes appartenant à un même secteur. En temps voulu, ils pourront repérer des tendances qu'un journaliste humain serait susceptible d'ignorer.

Par exemple, selon Allen, les logiciels d'Automated Insights peuvent remarquer que le chiffre d'affaire de telle ou telle entreprise a systématiquement dépassé les estimations des analystes à chaque troisième trimestre et ce depuis cinq ans. «On passe constamment à côté de certains types d'analyses parce que les humains ne sont pas bien adaptés pour ce genre de trucs».

Nous n'avons pas à choisir entre des dépêches automatisées et du vrai journalisme

Mais il faut encore un humain pour situer ces trucs dans un contexte, dans des tendances plus générales, dans des débats ou des logiques actuelles. Au final, les données d'un bilan financier ne veulent pas dire grand chose si elles ne sont pas combinées à toutes les données que les gens ont déjà à l'esprit et qui se sont accumulées via des années d'expérience – une expérience qui ne se limite pas à la lecture de résultats financiers, mais qui demande aussi de regarder des films de Disney, d'aller à Disneyland, et de faire cadrer tout ça avec l'influence que des entreprises peuvent avoir sur la vie des enfants ou avec les forces culturelles qui ont pu façonner un type comme Walt Disney. En bref, les données que les gens peuvent avoir à l'esprit ne viennent pas simplement de tableurs. Elles viennent d'années d'expérience, d'un vécu proprement humain.

Heureusement, nous n'avons pas à choisir entre des dépêches automatisées et du vrai journalisme. Les exemples ci-dessus prouvent parfaitement que nous pouvons avoir les deux. Pour des entreprises plus modestes, dont le bilan financier n'aurait de toute façon mérité qu'un petit entrefilet, l'automatisation peut tout à fait supplanter l'écriture humaine. Pour des entreprises plus conséquentes, à l'instar de Disney, AP continuera fournir les deux types d'articles.

La dépêche automatisée arrivera en premier sur le flux et donnera les faits essentiels à ceux qui veulent les connaître le plus vite possible. Ensuite, les humains prendront le relais, en donnant à ces faits un contexte, en mettant les choses en perspective et en effectuant toutes les connexions qui font d'un texte factuel un véritable article.

La vérité, c'est que les robots journalistes ne sont ni des robots, ni des journalistes. Ils sont un énième outil permettant de présenter des données dans une forme utile aux humains, pour faire ce dont seuls les humains sont capables – donner du sens au monde.

Will Oremus
Will Oremus (151 articles)
Journaliste
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites, vous proposer des publicités adaptées à vos centres d’intérêt et nous suivre sur les réseaux sociaux. > Paramétrer > J'accepte