Partager cet article

Terrorisme, internet et pizzas aux anchois: bienvenue dans les sociétés du profilage

REUTERS/Pawel Kopczynski.

REUTERS/Pawel Kopczynski.

Description en cinq actes de l'avenir possible que nous dessine une société de surveillance généralisée.

L’état d’urgence instauré le 13 novembre a été prolongé jusqu'au 26 février et une lecture, même cursive, de la presse indique qu’un débat sur la sécurité et la surveillance souhaitables en France suite aux attaques terroristes est désormais en cours, d’autant que le premier bilan de cet état d’urgence s’avère très controversé.

Au mois d’octobre, l’ONG Freedom House estimait que la France est l’un des pays où la liberté sur Internet a le plus reculé cette année. En cause, les «lois surveillance», formulées après les attentats du 7, 8 et 9 janvier, et qui autorisent, après aval du Premier ministre, à exploiter des données de connexion de façon non individualisée, non ciblée, sans contrainte sur le type de technique utilisée pour analyser les données recueillies (l'ensemble des communications internationales pouvant être collecté). À suivre l’analyse de l’ONG, pareilles lois ne constituent pas un anodin ajout à la législation, mais pourraient inaugurer un nouveau régime de libertés publiques.

Après la tragédie qui nous a frappés, il n’est peut-être pas inopportun de revenir sur ce point, puisque très probablement, ces lois vont bénéficier maintenant d’un plus lourd soutien, voire être renforcées, ce qui serait bien compréhensible après ce que nous venons de vivre. On rappellera toutefois que même quelqu’un d’aussi peu suspect de complaisance vis à vis du terrorisme islamiste que le juge Marc Trévidic les estimait dangereuses et inutiles. (Inutiles en premier lieu parce que de telles lois ne modifient nullement la manière dont les usagers d’internet sont exposés à des contenus pro-terroristes via les algorithmes qui définissent les flux sur leurs réseaux sociaux, ce qui relève ultimement de la bonne volonté des grosses entreprises du web, comme Twitter ou Facebook). Je souhaiterais donc ici, en faisant quelque peu abstraction du contexte actuel, proposer une analyse de ce qui me paraît à la fois nouveau, problématique et sous-évalué dans de telles mesures.

Les débats qu’ont suscités celles-ci lors de leur formulation et de leur vote furent généralement d’une forme convenue: «Cela porte atteinte à la vie privée», dit l’un; «Oui, certes, mais si vous n’êtes ni terroriste ni pédophile ni Illuminati, vous n’avez rien à cacher, donc où est le problème?», répond l’autre; «Certes, mais on ne sait jamais, et la vie privée est une question de principe (d’ailleurs vous n’aimez pas qu’on vous espionne aux toilettes alors que vous n’y faites rien de mal).» Reste que formulé ainsi, ce débat ignore la nouveauté de ce qui se joue avec la surveillance de l’internet, comme la radicalité des risques que cela représente –bien différents d’une simple question de pudeur ou d’indiscrétion.

Ces risques émergent de la confluence de dynamiques neuves et souvent intrinsèquement liées à l’internet que je vais successivement retracer. Tout en nous rapprochant de la science-fiction, chaque tour d’écrou supplémentaire de ce drame en cinq actes concrétise davantage un cauchemar, mais l’ensemble dessine un avenir bel et bien possible.

1.Nous sommes sortis des sociétés de surveillance: où entrons-nous?

Michel Foucault avait longuement analysé ce qu’il appelait les sociétés de surveillance, soit le régime de gouvernance et de savoir dans lequel l’Etat s’investit dans la surveillance continue des populations, en termes par exemple de santé, d’éducation, de statut professionnel, etc. Cette surveillance était coûteuse; or, de nos jours, via tous les systèmes technologiques qui nous entourent, elle devient incomparablement plus facile, rapide et bon marché.

Une sorte de traçabilité généralisée caractérise en effet désormais la vie privée: cartes de crédits, téléphones portables, etc., tous ces objets techniques ne cessent de laisser des indices de nos comportements et de nos mouvements. Ces traces sont éparses (dans les téléphones, dans les relevés bancaires, dans les terminaux qui accumulent les images des caméras de vidéosurveillance, etc), mais elles sont centralisables sur demande (par exemple étatique). Toutefois, celles que je laisse sur Internet sont déjà plus facilement centralisées (par exemple, dans Google, dans Facebook, etc). Là où un détective devait par exemple croiser des centaines de récits de témoins pour retracer dix années de la vie d’un individu, un examen rapide de ses relevés divers lui permettrait de tout savoir en dix minutes. Nous sommes sortis des sociétés de surveillance: où entrons-nous?

2.De nouvelles et fascinantes techniques de détection

Là intervient la nouveauté inouïe de l’internet concernant l’échange et la production de l’information. Chacun sait qu’à l’ère du Web, l’information est quasi-instantanée, quasi-gratuite, quasi-universelle.[1] Mais on souligne moins une spécificité fondamentale du Grand Réseau Mondial, à savoir que lorsque que je vais chercher une information sur internet, je génère simultanément une information sur moi (au moins). Si je tape «huîtres Sarkozy» sur Google, je produis l’information qu’il existe (au moins) un individu intéressé à la fois par Sarkozy et par les huîtres. Si nous sommes beaucoup à le faire, l’idée qu’il existe une corrélation d’un certain ordre entre Sarkozy et les huîtres devient formulable –et la localisation géographique de cette corrélation est décelable elle aussi (peut-être que les Berrichons aiment imaginer un Sarkozy amateur d’huîtres, par exemple).

Cet aspect constitue le ressort de nouvelles et fascinantes techniques de détection: ainsi, suivre l’évolution géographique de requêtes concernant les tremblements de terre sur Google permet de retracer en temps réel les risques sismiques; inventorier les usages de hashtags liés à la gastro-entérite ou au choléra sur Twitter met en lumière la propagation d’une épidémie... Et un article vient de montrer qu’à partir d’une analyse statistique sophistiquée des mentions de tous les événements sur les réseaux sociaux, on peut prédire parmi ceux-ci lesquels vont devenir historiquement importants... C’est là une infime part de ce qui est possible à l’ère de ce qu’on nomme communément le big data.

Internet fait donc en sorte que je ne cesse d’y fournir des informations sur moi-même, exploitables par d’autres –même si au départ j’existe sous la simple forme d’une adresse IP. Par mes recherches, mes contacts, mes achats, mes visionnages, j’informe sur moi-même en naviguant sur internet et je contribue à informer au sujet de populations dont je fais partie. Bien entendu, avec les nouvelles lois surveillance, ces informations sur moi-même qui existent virtuellement dans l’Internet, un peu moins virtuellement dans Google, Facebook, etc. (car elles sont stockées quelque part, traitées, commercialisées), seront centralisées en un lieu accessible immédiatement au gouvernement et à ses représentants (police, justice, renseignement…). C’est là où, en quelque sorte, que les inquiétudes pour la vie privée suscitées par ces lois s’avèrent absolument fondées: le fait que toutes les informations que je donne sur moi-même simplement en me connectant à l’internet –sans compter, en plus, celles qui sont à l'intérieur de mes emails, de mes échanges Facebook, etc– soient lisibles et exploitables par l’Etat signe tout simplement l’arrêt de mort de toute vie privée.

Cependant, les données que le citoyen produit sur lui-même deviennent des informations riches à partir du moment où elles sont rassemblées et comparées. Là, les informations que je transmets dépassent ce que je sais sur moi-même. Si un individu a l’habitude de consommer des pizzas aux anchois et de jouer tout aussi régulièrement à des jeux en réseaux où son avatar est un dragon, cette régularité devient une information sur son éventuel comportement futur; il existe quelque part dans un serveur l’information que ce garçon qui vient de manger une pizza aux anchois va bientôt se changer en dragon. Plus généralement, pareilles informations dessinent un ensemble de corrélations qui constituent un profil individuel, lequel m’est souvent inconnu à moi-même.

La puissance du profilage s’atteste déjà avec le commerce et les publicités en ligne: en fonction de cette logique, à peine revêtu de son dragon, notre individu va se voir proposer une pizza aux anchois sur son compte Facebook ou Gmail. Ce profil devient donc lisible pour d’autres que moi –même si, dans l’état actuel des choses, le nom qui correspond à un tel profil, mon nom, reste inaccessible sinon à certaines instances (opérateurs internet, Facebook, etc) qui en principe ne communiquent pas entre elles. La loi surveillance lève immédiatement une telle réserve: le propriétaire du profil a un nom et les divers aspects de ce profil (mails, achats, visionnages, etc) sont fondus en un seul, à son nom –le profil est intégralement lisible par le gouvernement (pour dire vite), qui par là même connaît de moi ce que je ne connais pas et prédira ou anticipera facilement mes actes.

3.D'immenses fabriques de profils populationnels

Le problème ne s’arrête pas là. La richesse des informations ainsi générées peut être exploitée de telle sorte que de nouvelles corrélations deviennent décelables, qui n’étaient pas encore incluses dans le profil de notre amateur de pizzas aux anchois et dragons. Car dès qu’on passe du niveau de l’individu à celui des populations, les perspectives offertes par le traitement de l’information accumulée en ligne changent d’échelle. L’information sur les pizzas aux anchois devient en effet autrement signifiante si on l’agrège avec toutes les informations sur tous les mangeurs de pizza aux anchois. En effet, on peut alors constituer un profil populationnel de l’amateur de pizza aux anchois, fait de toutes les corrélations lisibles sur internet à partir des comportements de ces individus.

Si, par exemple, la plupart d’entre eux aiment plutôt les jouets en bois et consultent plutôt des journaux de droite, on pourra enrichir les profils individuels de chacun de ces individus en insérant des informations issues du profil populationnel. Il s’agit là certes de corrélations et non de causalité –et les scientifiques généralement dépensent beaucoup d’énergie à distinguer les deux pour trier, parmi les corrélations, celles qui recouvrent des relations causales. Néanmoins, pour ce qui nous intéresse –le profilage des populations–, la distinction n’a pas d’intérêt: une corrélation bien établie est aussi prédictive qu’une relation de causalité puisque pour prédire, il suffit de savoir si, lorsqu’un terme de la corrélation advient, on peut raisonnablement s’attendre à l’autre, quelle que soit la nature réelle du lien entre les deux.

Or, le flot d’informations généré continûment sur Internet, couplé aux capacités de calcul disponibles aujourd’hui, permet de saisir d’innombrables corrélations, en particulier dans le domaine humain et social. Tout ceci implique alors que même si je n’ai jamais regardé les jouets en bois, on va sans doute m’en proposer sur ma page Facebook, simplement parce que le traitement de l’information produite sur internet par moi-même et mes semblables a révélé qu’en tant que mangeur de pizza aux anchois, j’ai une probabilité plus élevée que la moyenne d’aimer ces jouets (et d’être de droite). Comme on dit sur Amazon ou Spotify: «Ceux qui ont aimé Justin Bieber ont aussi aimé Wolfgang Amadeus Mozart.» Tous les sites de ce genre, qu’il s’agisse de musique, de livres, de cinéma, etc, sont d’immenses fabriques de profils populationnels générés grâce à nos activités sur Internet –en particulier nos activités d’achat ou nos comportements de lecture ou d’écoute. Et les profils ainsi constitués sont monnayables, devenant ainsi une source majeure de profit pour l’économie digitale –des profits qui sont l’envers de la gratuité informationnelle pour le public. (La notion de profil est, soulignons-le, bien plus générale que ce qui est simplement constructible à partir des recherches sur Google. De fait, ces dernières sont plus anonymes –elles renvoient à l’IP–, alors que celles-là –achat, écoute, etc– sont souvent nominales, via parfois un pseudo.)

Je suis resté ici dans le domaine du commerce et de ce qui existe déjà. Bien entendu, le fait qu’à partir des données centralisées sur les individus, l’Etat puisse disposer ainsi d’indications sur les choix politiques (entre autres) de chacun semble en soi assez effrayant. Mais surtout, ces profils populationnel permettent de définir ce que seraient des «catégories à risque» de manière radicalement plus puissante que ce qui était tenté artisanalement avec les données récupérées sur demande par l'Insee ou les questionnaires sociologiques. Si l’abus de teen-movies combinés à la lecture de Tony Duvert et à l’écoute de Lorie est un bon indicateur de fréquence élevée de pédophilie, alors effectivement il devient assez facile de définir et cibler à l’insu des individus ce qu’on nomme médicalement ou pénalement des «groupes à risque». On pourra aussi du même coup les traiter –j’y viens à l’instant.

4.L'émergence du «paternalisme soft»

Nous sommes entrés dans les sociétés du profilage. Mais les vrais problèmes commencent lorsqu’on se tourne vers une tendance neuve dans les démocraties occidentales, qui fait débat sous le nom de paternalisme soft. Défendue entre autres dans leur livre Nudge par le prix Nobel d'économie Robert Thaler et le juriste Cass Sunstein, aujourd’hui conseiller d’Obama, et depuis lors objet de fréquent débats, en particulier outre-Atlantique, le paternalisme soft signifie l’ensemble des techniques destinées à modifier par de tous petits changements, souvent indétectables, le comportement des individus dans le sens de leur bien et du bien-être commun.

Cela inclut des manipulations quasiment triviales, fondées sur les acquis des sciences cognitives. Un exemple: il n’est pas équivalent de proposer de recevoir leurs factures par email à des gens qui les reçoivent déjà par la poste –ou inversement, d’envoyer toutes les factures par email en leur proposant de recevoir une copie papier s’ils le désirent (ceux qui opteront pour le papier seront beaucoup moins nombreux que ceux qui, dans le premier cas, préféreront en rester au papier). Comme les psychologues cognitifs l’ont établi, la détermination du «choix par défaut» entraîne d’énormes différences alors même que tout est gratuit et que les préférences des gens restent les mêmes. Et si en outre, on indique le pourcentage de ceux qui préfèrent le papier –et que ce pourcentage est très faible–, on fera encore davantage baisser la fréquence des individus soucieux ne pas gâcher de papier. Par une simple modification de forme, on aura donc infléchi le comportement des usagers dans un sens plus eco-friendly. (Les paquets de cigarettes ornés d’affreuses photos d’organes dévastés sont une autre illustration du paternalisme soft.)

Vu comme cela, on pourrait trouver sympathique ce paternalisme qui vise à améliorer la santé des populations et éventuellement leur rapport à l’environnement. Seulement, dès qu’on se représente la quantité d’informations disponibles sur les profils individuels et populationnels telle qu’elle est générée par Internet et serait centralisée par les lois surveillance, la tournure des choses change radicalement. Car on a maintenant des moyens massifs de prévoir les réactions d’individus nominalement identifiés –prévoir en moyenne, évidemment, puisqu’on reste dans des critères populationnels; mais ce «en moyenne» signifie que dans la plupart des cas, ça marche, et c’est cela qui intéresse les gouvernements comme les commerçants (la question de l’absolue liberté/imprédictibilité de l’individu, pris en lui-même, n’a absolument aucune importance ici, elle est une simple affaire de métaphysiciens). On peut ainsi prévoir leurs réactions individuelles à des petits changements, et donc opérer des interventions ciblées via les algorithmes appropriés: si notre data-mining nous informe qu’une population particulière est spécialement sensible aux souffrances des animaux, certains contenus visuels ou autres montrant des petits agneaux ou veaux mis à mort industriellement pourront être introduits plus fréquemment dans leurs écrans (selon les mêmes techniques qui inspirent les Google Ads ou les annonces Facebook) –ceci dans un but estimé a priori plutôt bon, soit inciter à moins manger d’animaux issus d’élevages aux conditions inhumaines…

Néanmoins, même si je peux souscrire à certaines visées politiques –comme dans l’exemple que je viens de donner–, j’estimerais moralement et politiquement problématique le fait qu’on agisse sur mon comportement à mon insu, sans même que je sois informé du fait qu’existent ces stratégies d’inflexion subtile des comportements. Le paternalisme soft n’est pas forcément à rejeter, mais s’il se généralise grâce à l’établissement de profils permis par les informations internet accessibles grâce aux lois surveillance, alors il faudrait qu’il soit discuté et que son adoption ne se fasse pas dans le dos des sujets, alors que la collecte de métadonnées est déjà une pratique au statut juridiquement et éthiquement flou puisque souvent les citoyens n’y consentent pas explicitement, ou bien (comme dans le cas des réseaux sociaux, amplement discuté) ne savent pas à quoi au juste ils consentent.

Accepter le paternalisme soft dans ces conditions est d’autant plus problématique que, comme toujours, on suppose que le sens du bien commun ne fait pas débat et que le gouvernement règle sur lui son action; mais qu’arriverait-il si un groupe imposait sa définition idiosyncratique du bien commun en arrivant au pouvoir? S’il opérait, par petites touches cognitives imperceptibles, un infléchissement général de la population vers des comportements hyperconsuméristes ou xénophobes, ou bouddhistes?

5.Une société qui sera gérée sans nous

Quoiqu’il en soit de leur valeur éthique ou politique, les lois surveillance offrent ainsi au paternalisme soft des perspectives inouïes. Cependant, les horizons du cauchemar ne s’achèvent pas avec l’idée d’un gouvernement qui utiliserait les ressources issues du traitement de milliards de téraoctets de données pour établir des profils d'individus, puis des techniques d’action sur ces profils, afin d’organiser tout en douceur et sans même qu’aucun vote n’ait lieu à ce sujet une société intégralement végétalienne.

Non, les choses prennent toute leur ampleur si on examine au final ce qu’est l’intelligence artificielle. Car évidemment, si paternalisme soft il y a, il ne sera pas mis en œuvre au cas par cas par des agents spécialement formés pour cela, lesquels examineraient à la loupe des millions de profils individuels. Il s’agit d’une tâche qui doit être confiée à l’ordinateur. Un algorithme établira les profils (le mien; celui d’une population à laquelle j’appartiens), puis les stratégies possibles pour infléchir les choix du membre de la sous-population ainsi définie –puis il mettra en œuvre les objectifs paternalistes voulus par les instances dirigeantes idoines.

Or, pour ce faire, il faut qu’il puisse aussi contrôler et modifier sa propre action en fonction des résultats. Il lui faut donc une sorte d’intelligence (artificielle) lui permettant alors de modifier quelque peu les stratégies implémentées en lui pour obtenir un meilleur résultat –ce qui est l’horizon de ce qu’on appelle le machine learning, soit les algorithmes améliorant constamment leurs stratégies sur la base des données nouvelles qu’ils rencontrent, y compris leurs propres résultats précédents. Ce type d’algorithme détermine déjà les suggestions Amazon, la gestion des contenus présentés sur Google, Facebook, Twitter ou sur les sites de rencontre: à partir d’une visée générale de départ, il formule des hypothèses pour mieux la satisfaire et les raffine en prenant en compte des trillions de data, ce qu’aucun humain ne pourrait faire.

Sur cette base, évidemment l’intelligence artificielle pourra induire des changements pour laquelle elle n’est pas directement programmée mais qui sont en quelque sorte évalués comme meilleurs par ses logiciels: si l’algorithme peut perfectionner notre consommation de viande et d’eau, pourquoi ne perfectionnerait-il pas aussi notre consommation de poisson, de lait, d’oxygène, et aussi notre relation aux autres, et ainsi de suite? Ultimement, la gestion du paternalisme se fera donc par cette intelligence elle-même et sans nous. Nous serons tous paternellement pris en charge, la société du profilage réalisant ainsi ce que Rousseau, dans l’Emile, parlant de son élève imaginaire, définissait comme la relation éducative réussie: «Il ne fera que ce qu’il veut, mais il ne voudra que ce que vous voudrez bien qu’il veuille.»

C’est là évidemment un scénario de science-fiction, assez proche de ceux que rêvent certains transhumanistes quand ils se demandent comment échapper à la révolte de robots qui se trame dès aujourd’hui.[2] Je voulais juste indiquer qu’un tel scénario n’est qu’une combinaison d’un ensemble de possibilités techniques ou politiques qui existent déjà. Les lois surveillance mises en œuvre aujourd’hui, quelle que soit leur légitimation pragmatique, ouvrent très grandement la porte à toutes les variations possibles et plus ou moins catastrophiques autour de ce scénario. Il s’agit de perspectives à long terme, et on comprend bien que dans l’urgence elles ne sauraient peser lourd pour motiver des décisions politiques, mais j’ai estimé toujours utile qu’elles soient quelque peu analysées.

1 — Avec évidemment les réserves d’usage: l’accès est plus facile dans les pays du Nord et la gratuité est souvent compensée par la revente des métadonnées ou par le matraquage publicitaire (pensons au saucissonnage des journaux par des vidéos absurdes). Cette collecte et revente de métadonnées est précisément la ressource du profilage abordée plus bas. Retourner à l'article

2 — C’est très sérieusement l’objet du Center for Existential Risks de Cambridge, fondé entre autres par le créateur de Skype. Retourner à l'article

En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites, vous proposer des publicités adaptées à vos centres d’intérêt et nous suivre sur les réseaux sociaux. > Paramétrer > J'accepte