Mardi 29 août, le président américain Donald Trump a dit tout le mal qu’il pensait de Google, accusant le moteur de recherche de faire la part belle aux «médias bidons» (notamment CNN), de «censurer les voix conservatrices» et de «cacher les informations positives» le concernant:

Google search results for “Trump News” shows only the viewing/reporting of Fake News Media. In other words, they have it RIGGED, for me & others, so that almost all stories & news is BAD. Fake CNN is prominent. Republican/Conservative & Fair Media is shut out. Illegal? 96% of.... — Donald J. Trump (@realDonaldTrump) 28 août 2018

....results on “Trump News” are from National Left-Wing Media, very dangerous. Google & others are suppressing voices of Conservatives and hiding information and news that is good. They are controlling what we can & cannot see. This is a very serious situation-will be addressed! — Donald J. Trump (@realDonaldTrump) 28 août 2018

Les résultats de Google pour "Trump news" montre seulement la vision et les articles des médias à fake news. En d'autres termes, ils les ont TRUQUÉS, pour moi et les autres, afin que tous les articles soient MAUVAIS. Fake CNN est particulièrement représenté. Les médias républicains, conservateurs et équitables sont censurés. Illégal? 96% des résultats sur Trump News proviennet de médias nationaux de gauche, très dangereux. Google et les autres suppriment les voix des conservateurs et cachent des informations, ce qui n'est pas bon. Ils contrôlent ce que vous pouvez et ne pouvez pas voir. C'est une situation très grave, il va falloir y remédier!

CNN s’est empressé de démentir ces affirmations; incluant un éditorial de leur commentateur politique Chris Cillizza, expliquant qu’il s’agissait là d’une «théorie du complot», et que les résultats de recherche de Google n’étaient «que très peu liés à l’idéologie». Comme d’autres commentateurs des tweets du président, Cillizza cite Google, qui a réitéré son habituelle position: le moteur de recherche est conçu pour offrir les résultats les plus utiles possibles à ses utilisateurs et utilisatrices.

Mais à l’instar du personnage de Walter dans The Big Lebowski, il se trouve que dans ce cas précis, le président a raison. Google est biaisé. Et c'est ainsi qu'il a été conçu.

Le biais, principale fonction d'un moteur de recherche

Le biais constitue la principale fonction d’un moteur de recherche –et ce dans la mesure où il met en avant certaines sources d’information tout en plongeant les autres dans les oubliettes. C’est d’ailleurs là un processus utilisé par tous les organes de presse: choisir ses sources en fonction de critères que le lectorat ne connaît ni ne comprend pleinement. Le fait que j’ignore comment tel ou tel journaliste choisit ses sources ne me permet pas à lui seul d’affirmer que ses articles sont influencés par une quelconque idéologie –pas plus qu’il ne me permet d’affirmer que ses papiers sont incorrects et inutiles.

J’estime généralement qu’au vu de sa formation professionnelle et des processus de contrôle internes de son organe de presse, le ou la journaliste en question pourra me fournir une vision utile de l’actualité. Le biais potentiel d’un article ou d’un tweet n’est pas dérangeant en soi: je suis toujours libre de lui trouver des contrepoids via d’autres sources d’informations en ligne. De la même manière, je ne suis pas climatologue, mais je fais confiance aux spécialistes de la question ainsi qu’aux structures qui les emploient, j’estime qu’ils me fournissent des réponses utiles, et je suis toujours libre de trouver des contrepoids à leurs conclusions dans d’autres articles de recherche examinés par des pairs. Au centre de ces processus, deux concepts-clés: l’utilité et la confiance.

L’utilité d’une source d’information se mesure à l’aune de son contexte. L’autre jour, mon horloge a cessé de fonctionner; j’ai donc googlé «réparer horloge murale». Google m’a fourni des vidéos et des liens utiles qui m'ont guidé pas à pas pendant la réparation. Toute personne ayant effectué une recherche identique trouverait certainement ces résultats utiles. Mais lorsque l’objet –et les motivations– de la recherche sont plus complexes, les choses se compliquent.

À LIRE AUSSI Google sait peut-être tout de vous, mais il ne comprend rien à vos goûts

Un exemple: on ne s’attend pas à ce qu’un moteur de recherche parvienne à deviner nos envies en matière de cinéma. Une personne débordant d’envie de voir Keanu Reeves défourailler à dos de canasson dans John Wick 3 ne sera sans doute guère intéressée par le casting de l’adaptation des Quatre filles du Docteur March par Greta Gerwig –l’actrice jouant le rôle principal vient d’être remplacée. (Donald Trump finira-t-il par s’en prendre à l’agrégateur de critiques de cinéma Rotten Tomatoes? J’attends ses tweets avec impatience). S’il est impossible de prédire les préférences cinématographiques des utilisateurs et utilisatrices, comment s’attendre à ce que des résultats de recherche identiques conviennent à des personnes différentes lorsque ces dernières souhaitent s’informer sur l’immigration ou la politique monétaire?

Critères de crédibilité

On pourrait certainement répondre qu’il s’agit, dans un cas, de préférences personnelles, et d’informations factuelles dans l’autre. Les détracteurs des médias le répètent à qui veut l’entendre: les organes de presse devraient se contenter de rapporter les faits, rien que les faits. Mais il est particulièrement complexe de choisir les faits qui méritent d’être rapportés, de les organiser pour produire un récit cohérent et de les hiérarchiser par ordre d’importance. Il s’agit là d’un art à part entière –un art qui a été perfectionné au fil des décennies par de nombreux rédacteurs et rédactrices en chef. Comment l’algorithme de Google pourrait-il l’avoir déjà maîtrisé?

Il ne le maîtrise pas –et nous le savons de source sûre. Cet algorithme ne cesse de changer –à petite comme à grande échelle– et c’est bien là, précisément, la meilleure preuve de son imperfection. S’il change, ce n’est pas seulement parce qu’il détermine –d’une façon ou d’une autre– que ses résultats de recherche manquent d’utilité: ces modifications sont parfois dues à des critiques extérieures.

À LIRE AUSSI Les «raters», ces employés mal aimés qui travaillent à améliorer l’algorithme de Google

Il y a dix ans, lorsqu’un site créé par des suprémacistes blancs s’est hissé en tête des résultats de recherche sur Martin Luther King Jr., Google a considéré qu’il s’agissait d’une faille dans son algorithme. Il a alors modifié l’évaluation des critères de crédibilité –et le site n’a plus figuré en première place (même s’il a continué à apparaître plus bas dans la liste pendant quelque temps). Les informations présentes sur ce site n’étaient pas entièrement factuelles; par ailleurs, et de manière plus importante, les positions qu’il mettait en avant n’étaient partagées que par une petite minorité d’utilisateurs et utilisatrices de Google. Grâce à la modification de l’algorithme de hiérarchisation (un algorithme conçu par des humains), ce site ne figure plus en tête des résultats de recherche.

Scepticisme raisonnable

Il faut alors déterminer dans quelle mesure un algorithme déjà modifié sous la pression de l’opinion publique mérite notre confiance. Et il est vrai qu’un trait idéologique se cache bel et bien au cœur de l’algorithme de recherche: l’idée selon laquelle Google propose un processus neutre, naturel et mathématique nous permettant d’atteindre les «meilleurs» résultats possibles. Il est tout simplement impossible d’élaborer une sélection neutre et naturelle de sources d’informations susceptible de satisfaire l’ensemble des utilisateurs et utilisatrices. On peut se méfier du concept de hiérarchie naturelle de l’information (surtout lorsque la hiérarchisation est confiée à la boîte noire sibylline qu’est l’algorithme de hiérarchisation de Google), cela ne revient pas à pas céder à la théorie du complot –c’est, bien au contraire, faire preuve d’un scepticisme tout à fait raisonnable.

Une démocratie doit garantir à ses citoyens et citoyennes un accès à l’information; il s’agit là d’un sujet d’intérêt public. C’est la raison d’être de la Bibliothèque du Congrès et des aides à la presse. Trump n’a pas complètement tort –mais ses tweets n’en sont pas moins dérangeants, notamment du fait de leur conclusion: «cette situation est très grave – nous nous en occuperons!». Aux États-Unis, la protection de la liberté d’expression est inscrite dans la Constitution, ce qui a jusqu’ici découragé les tentatives de réglementation des sources d’information. Si le président trouve à redire aux informations qu’il trouve sur Google, Facebook ou Wikipédia (qu’il ne consulte que rarement, n’étant pas féru d’informatique), il est libre –tout comme ses électeurs et électrices– de voter avec ses clics et de fréquenter des sites faisant la part belle aux «faits alternatifs».

Monopole naturel

Seulement voilà: Google est le moteur de recherche le plus populaire des États-Unis, et de loin, cela va sans dire –ses concurrents sont à la peine, car la création d’un moteur d’une qualité équivalente requiert une infrastructure impressionnante. Il s’agit, en un sens, d’une situation de monopole naturel. Certains pays considèrent que ce moteur de recherche international basé en Amérique est une menace pour leur culture et leur gouvernement; ils ont donc financé des projets de moteurs alternatifs. L’initiative chinoise s’est avérée particulièrement efficace: les utilisatrices et utilisateurs de Baidu sont de plus en plus nombreux, à domicile comme à l’étranger. Pour l’heure, toutefois, aucun n’arrive à la cheville de Google; selon une étude, plus de 90% des recherches mondiales passent par le moteur américain.

Il est vrai qu’aucun monopole de ce type n’existe dans la presse. Les personnes qui n’adhèrent pas à la ligne éditoriale du Washington Post, ou qui n’aiment pas les «médias traditionnels» dans leur ensemble, peuvent se tourner vers d’autres sources d’information soutenues par le président en personne, depuis Fox News jusqu’à Infowars. Il est plus facile que jamais de consulter ces sources alternatives. Côté moteurs de recherche, en revanche, les choix sont beaucoup plus limités. Lorsqu’il s’agit de filtrer les contenus, les situations de monoculture sont dangereuses, et ce notamment parce que les risques d’abus (intentionnels ou non) sont beaucoup plus élevés.

Comme l’a dit le juge à la Cour suprême américaine Louis Brandeis (c’était il y a près d’un siècle): «Les maux nés des processus d’éducation ne peuvent être soignés que par un supplément d’expression, pas par un silence imposé». Le président Donald Trump dispose d’un puissant outil pour stimuler le marché des moteurs de recherche: il pourrait obtenir une augmentation des budgets de la recherche. Les géants de l’industrie (Microsoft, Facebook, Amazon…) et les États étrangers comptent parmi les seules entités capables de rivaliser avec les algorithmes de recherche de Google. Si la National science foundation américaine décidait d’allouer des fonds substantiels aux travaux visant à améliorer les algorithmes de recherche, le secteur verrait fleurir mille et une initiatives alternatives. L’une d’entre elles serait sans doute un peu plus conforme aux goûts du président –et lui donnerait à voir ce qu’il considère aujourd’hui comme réellement important.