Life

Google, ne t'arrête pas de collecter mes données!

Farhad Manjoo, mis à jour le 23.04.2011 à 18 h 24

Beaucoup d’entre vous voudraient que les sites web cessent d’utiliser les informations personnelles. Mais le respect de votre vie privée sur Internet vous compliquerait l'existence.

Some Questions Can't Be Answered by Google, Mykl Roventine via Flickr, CC-Licence-by

Some Questions Can't Be Answered by Google, Mykl Roventine via Flickr, CC-Licence-by

Fin mars, la Federal Trade Commission (la principale agence américaine de défense des droits des consommateurs, qui sanctionne aussi les pratiques commerciales anticoncurrentielles) et Google ont signé un grand accord sur la confidentialité et la protection de la vie privée au titre duquel le géant de la recherche sur Internet devra se soumettre à des «audits de confidentialité» tous les deux ans.

Cet accord vient régler un conflit qui avait éclaté l’an dernier après le lancement de Google Buzz, le malheureux système de messagerie sociale intégré à Gmail.

Selon la FTC, Buzz était bourré de caractéristiques contraires aux règles de confidentialité de base. Google avait fait en sorte que les internautes soient d’office inscrits à ce nouvel outil ou qu’ils aient du mal à résilier leur compte (le bouton «Désactiver Buzz» ne le désactivait pas vraiment).

Même si vous y étiez totalement favorable, il n’était pas clairement expliqué comment protéger certaines de vos informations privées (la toute première version de Buzz rendait publique une liste des personnes à qui vous écrivez fréquemment des e-mails). Pire, la FTC estime que Buzz était même contraire à la propre politique de confidentialité de Google.

Dans cette dernière, Google promet de demander l’autorisation des internautes lorsque la société utilise des informations privées acquises dans le cadre du fonctionnement d’un outil/service dans le but d’en développer un nouveau. En l’occurrence, la FTC fait valoir que Google a utilisé des informations liées à Gmail pour ouvrir un service de réseau social sans lien avec la messagerie. Or, la société n’a jamais demandé à qui que ce soit l’autorisation de le faire.

Google soumis à des audits de confidentialité

Reconnaissant ses fautes, Google a accepté de se soumettre à une procédure qu’aucun de ses concurrents n’aura à endurer: des examens réguliers de ses pratiques en matière de confidentialité et de collecte de données par des consultants indépendants.

Ces inspections seront effectuées pendant 20 ans (c’est-à-dire plus longtemps que la durée de vie de nombreux géants informatiques). On peut en effet se demander si, en 2030, il y aura encore un «Web» sur lequel faire des recherches.

Il ne fait pas de doute que, du point de vue de la confidentialité, Buzz était une mauvaise affaire pour Google. Une tache qui a quelque peu terni l’image d’une société voulant à tout prix soigner cette image pour s’imposer comme le bon élève face au cancre Facebook.

Je suis d’accord avec l’analyse de la FTC: Google doit réparer ses erreurs (la société a fait amende honorable et affirme avoir rétabli des procédures de confidentialité dignes de ce nom pour prévenir un autre imbroglio.) Si c’est vraiment le cas, ces audits de confidentialité pourraient au final servir l’objectif de Google d’asseoir sa place de leader de l’Internet.

Mais voici ce qui m’inquiète: ces audits seront-ils menés judicieusement? Il y a de fortes chances que les inspecteurs chargés de vérifier si Google respecte les règles de confidentialité —aiguillonnés par des internautes qui ne savent pas vraiment ce qu’ils veulent ou ne veulent pas en matière de confidentialité des données sur Internet— aillent trop loin.

Ils risqueraient d’empêcher Google de collecter et d’analyser des données concernant ses utilisateurs. Et ce serait absolument terrible. Car, si par réflexe, nous détestons tous l’idée qu’une entreprise analyse notre vie numérique, nous bénéficions de cette pratique, souvent sans le savoir et sans en apprécier la mesure.

Je sais que mon propos semble naïf, comme ça, à première vue. Mais accordez-moi quelques instants d’attention. Il est vrai que Google recueille tout un tas d’informations à propos de nous tous. L’entreprise le fait délibérément et pour diverses raisons.

Nous avons certaines de ces raisons en horreur: Google, comme tous les géants du Web, vend de la pub. Et plus la pub qu’elle vend est adaptée à vos besoins, plus la société fait des profits. C’est ainsi que le Web est financé, et c’est pour cela que vous n’avez pas à payer de frais pour effectuer une recherche sur Google.

Je comprends que les gens se méfient de la collecte de données en ligne, mais je dois dire que c’est aussi parce que la plupart des conversations que nous menons sur la protection de la vie privée s’arrêtent là.

L’analyse de votre «vie sur le Net» a aussi du bon

Dans les grandes lignes, les données personnelles que les sociétés du Web conservent se divisent en deux catégories: des informations qui permettent de vous identifier en tant qu’individus (par exemple, votre nom ou votre liste d’amis) et des informations qui ne peuvent pas être associées à vous. Généralement, quand on parle des problèmes de confidentialité, on ne prend pas la peine de faire cette distinction pourtant essentielle.

Alors que nous nous focalisons sur les inconvénients liés au fait que des sociétés collectent des informations personnelles, nous ne nous intéressons que rarement aux innovations qui n’auraient pas été possibles autrement. C’est particulièrement vrai dans le cas des données anonymes, des informations ne pouvant pas être utilisées pour vous identifier, mais qui constituent la base de produits ou services extraordinaires.

En effet, certains des produits de Google parmi les plus plébiscités n’auraient pas vu le jour sans nos données. Par exemple, le correcteur orthographique. Comment se fait-il que le moteur de recherche de Google sache que vous vouliez dire «Rebecca Black» alors que vous avez tapé «Rebeca Blacke»?

C’est d’ailleurs une prouesse dont ne serait capable aucun correcteur orthographique ordinaire, basé sur un dictionnaire. Puisque, dans le cas présent, il s’agit d’un nom propre et d’une célébrité sans doute éphémère. Mais ayant stocké des recherches d’un grand nombre d’internautes sur le nom «Black», Google sait que vous recherchez la starlette qui chante Friday.

Ce principe peut être appliqué plus largement. En étudiant les collocations (c’est-à-dire les mots souvent accompagnés d’autres mots) au niveau des termes clés utilisés pour une recherche —par exemple, des internautes peuvent taper «taux de meurtres à Los Angeles» ou «taux d’homicides à Los Angeles»—, Google est capable de comprendre que ces deux mots totalement différents peuvent avoir le même sens.

Et les conséquences de ce système pour le futur de l’informatique sont énormes: l’exploration des termes saisis pour effectuer une recherche sur Google permet d’apprendre aux ordinateurs à comprendre la langue (et pas uniquement l’anglais). Si on forçait le moteur de recherche à oublier chaque mot clé d’une recherche après avoir renvoyé des résultats, rien de tout cela ne serait possible.

Bien d'autres avantages

Le correcteur orthographique n’est qu’un exemple mineur de ce que l’exploration des données à grande échelle est capable d’offrir. Dans une de mes  chroniques, j’ai pris l’exemple de la reconnaissance vocale. Cette technique repose sur des milliards d’enregistrements audio et des recherches effectuées sur le Web qui permettent d’apprendre aux machines à comprendre le langage humain.

Autre exemple: Google analyse les journaux de recherches pour détecter les menaces informatiques de grande ampleur: lorsque le moteur constate des séries de recherches anormales (on sait que les virus font ce type de recherches en quête de serveurs web vulnérables), il peut faire obstacle à l’activité de ces virus.

Par ailleurs, divers smartphones offrent une fonction de Google Maps intitulée «Ma position», qui retransmet des données anonymes sur la situation géographique de votre téléphone à un instant «t». Google collecte ces données et les analyse pour créer des rapports sur la circulation en temps réel sur les routes et autoroutes.

Les recherches sur Google ont donné lieu un nouveau domaine qui présente un grand intérêt: celui des prédictions. En étudiant ce que les gens recherchent aujourd’hui, Google est capable de prévoir ce qui se passera demain ou le mois prochain.

En 2008, Google a lancé Suivi de la grippe (Flu Trends), un site qui suit l’augmentation du nombre de recherches relatives à la santé dans différentes régions du monde. L’équipe qui dirige ce système a publié un article de recherche scientifique qui démontre qu’elle est capable de prévoir avec précision l’arrivée d’une épidémie de grippe dans une région donnée avant les autorités sanitaires publiques.

En 2009, Hal Varian, économiste en chef chez Google, a publié un article (PDF) selon lequel les recherches sur Google peuvent également être exploitées pour anticiper tout un tas de données économiques, y compris les ventes au détail et les demandes d’allocation chômage.

À propos du correcteur orthographique, du site Flu Trends, de la fonction de reconnaissance vocale et des autres produits de Google dont le fonctionnement est tributaire des données collectées, il convient de souligner un point: ce n’était pas prévu.

Google ne s’est pas mis à sauvegarder toutes les recherches faites par les internautes pour mettre au point un outil de vérification de l’orthographe. C’est dans l’autre sens que cela s’est passé: après avoir conservé les recherches sans but précis, le correcteur orthographique a pu voir le jour. Ce n’est qu’après que la société s’est rendu compte que cette base de données était très utile. L’économiste en chef de Google, Hal Varian, me l’a assuré:

«Même si on n’y pense pas tout de suite, les données finissent souvent par donner naissance à de nouvelles possibilités. Au fil des années, nous avons constamment trouvé des nouveaux moyens d’analyser les données pour améliorer nos produits et services»

Nos attitudes maximalistes à l’égard de la confidentialité sur la Toile comportent des risques. Nous aimerions tous que les sociétés sur le Web conservent moins de données personnelles sur nous et qu’elles nous offrent une protection de la vie privée maximale si elles veulent en stocker plus.

Aux États-Unis, les membres du Congrès font actuellement pression pour renforcer la législation sur les «contrôles de confidentialité» des sociétés de l’Internet; une initiative vise même étendre l’accord conclu entre Google et la FTC à toutes les entreprises du Web.

Des mesures, oui, mais avec débats

Je ne suis pas contre un élargissement des mesures de protection de la confidentialité, à condition qu’elles soient le fruit d’un débat honnête. Le problème est que les débats à propos de la confidentialité expriment rarement des points de vue rationnels, comme en témoigne la fureur annuelle à propos de Facebook. À peu près chaque année, les médias et les militants fustigent longuement une nouvelle initiative alarmante de Facebook.

Pourtant, nos actes et nos inquiétudes sont contradictoires. Nous râlons pour affirmer notre aversion pour Facebook, mais nous ne nous résilions pas notre compte. Et pendant ce temps, des milliers d’internautes s’inscrivent sur le site.

Nous devons être plus honnêtes sur ce que nous entendons par «protéger davantage notre vie privée» sur Internet. Cela signifie-t-il que nous voulons être capables de contrôler la moindre miette de pain que nous laissons derrière nous après avoir dévoré des contenus web?

De nombreux militants craignent que la distinction entre les données anonymes et celles d’identification personnelle ne s’efface (et que l’exploration des données à grande échelle permette à des sociétés du Net de nous identifier en analysant des données prétendument anonymes). Pour répondre à ces préoccupations, certains organismes de contrôle ont proposé des restrictions sur les données anonymes stockées par les sociétés (PDF).

Mais si c’est vraiment ce que vous voulez, soyez bien conscients des inconvénients que cela suppose. Oui, il y a le risque que les sociétés du Web «sachent des choses sur nous» en examinant les recherches que nous faisons via notre navigateur.

Mais la prochaine fois que vous faites une faute d’orthographe lors d’une recherche sur le Web, que vous êtes pris dans un énorme bouchon ou que votre ordinateur plante à cause d’un méchant virus, dites-vous bien que les traces laissées par vos activités sur le Web vous auraient facilité la vie.

Farhad Manjoo

Traduit par Micha Cziffra

Farhad Manjoo
Farhad Manjoo (191 articles)
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites, vous proposer des publicités adaptées à vos centres d’intérêt et nous suivre sur les réseaux sociaux. > Paramétrer > J'accepte