Google est ton dictionnaire, ton encyclopédie, ton guide, ton meilleur ami, ton défouloir, ton psy et parfois ton dernier recours. C'est la conclusion qu'on peut tirer en auscultant les suggestions données par le moteur de recherche quand on commence à taper un mot ou une phrase.
Le service «Google Suggest», rebaptisé «saisie semi-automatique», est expérimenté depuis 2004 et a été généralisé à l'été 2008. Impossible d'y échapper, les suggestions s'affichent automatiquement dès que l'on fait une requête sur Google, et le système est d'autant plus visible depuis le lancement récent de Google Instant, la recherche instantanée qui affiche automatiquement les résultats suggérés pendant la frappe des mots.
Comment marche cet algorithme qui anticipe nos requêtes? Voilà la réponse officielle de Google:
«Ces recherches sont déterminées, par le biais d'un algorithme, en fonction d'un certain nombre de facteurs purement objectifs (dont la popularité des termes de recherche), sans intervention humaine. Toutes les requêtes de prédiction affichées ont déjà été saisies par le passé par d'autres utilisateurs de Google.»
Mais comme toujours avec les algorithmes Google, il ne sert à rien de poser la question à Google qui protège jalousement ses règles de calcul, aussi bien gardées que la recette du Coca-Cola. Et c'est bien normal: si les secrets de l'algorithme Google étaient connus, tout le monde pourrait le pervertir et les résultats ne seraient plus pertinents. Il existe néanmoins un métier dont l'objectif est d'essayer de percer les secrets du moteur de recherche, le référencement.
«Principalement liées aux habitudes des internautes»
Ces consultants, qui vendent chèrement leur savoir aux entreprises, sont un peu l'équivalent des marques distributeurs qui essayent d'imiter le Coca: on n'est pas loin de la vérité, mais par définition ce n'est jamais tout à fait ça. Olivier Duffez, consultant en référencement et créateur de WebRankInfo.com, nous donne son analyse de l'algorithme de Google Suggest:
«Les suggestions sont principalement liées aux habitudes des internautes, c'est-à-dire aux requêtes les plus populaires. Il me semble que ces requêtes sont renforcées s'il existe effectivement des pages traitant des sujets évoqués dans les requêtes. D'après les données que j'ai pu récolter, Google met à jour ses suggestions toutes les 6 à 10 semaines. Cependant, l'actualité chaude provoque parfois la mise à jour accélérée de Google Suggest.»
Les suggestions frappent souvent par leur côté incongru, pour ne pas dire choquant. L'agence AFP s'en était émue en septembre dernier, découvrant (avec 2 ans de retard) que les propositions racistes étaient monnaie courante:
«L'outil [...] réserve des surprises. Par exemple écrire "les noir", sans attendre le "s", et la réponse fuse: "les noirs puent". Autres propositions automatiques, observées lors d'un test dimanche sur google.fr: "les noirs sont moches", "les noirs sont racistes", mais aussi "les noirs dans l'équipe de France", "les noirs au Japon".»
Depuis, Google a joué au bon éléve en enlevant la suggestion «les noirs puent», comme le veut sa doctrine qui interdit toute intervention manuelle sur l'algorithme, sauf quand il s'agit de «contenus pornographiques, violents ou incitant à la haine». Mais l'Internet est malicieux et les noirs continuent à puer (avec un synonyme ou une faute d'orthographe):
Par contre, «les arabes» ont eu le droit à un traitement spécial: l'outil Suggest se bloque carrément quand on tape l'expression, de la même manière que si l'on tape «sexe» ou «chatte».
Les propositions racistes ou insultantes sont-elles favorisées par rapport aux autres? On peut penser que les internautes voyant une suggestion à sensation cliquent plus facilement dessus, renforçant ainsi la prédominance de cette expression dans l'algorithme de Google Suggest. Olivier Duffez estime que le moteur de recherche doit prendre en considération ce problème:
«J'ose espérer que les nombreux ingénieurs talentueux chez Google ont pensé à ne pas tenir compte des requêtes faites en cliquant sur les suggestions. Sinon effectivement c'est le serpent qui se mort la queue! J'ai travaillé pour un client qui était victime de plusieurs suggestions négatives: il a fallu près d'un an pour faire disparaître ces suggestions. C'est très difficile d'évaluer si le fait que les internautes cliquaient sur les suggestions négatives renforçait ces suggestions.»
L'anonymat de Google
Tout porte donc à croire que les suggestions de Google correspondent bien à ce qui est tapé par les internautes. On peut ainsi s'amuser à y lire une forme d'inconscient de l'Internet, ou tout du moins de non-dit. Google est un outil où l'on se sent anonyme (même si on ne l'est pas vraiment, Google archivant les requêtes pour servir des résultats personnalisés) et où on peut donc tout écrire sans crainte d'être jugé. Par exemple, il peut être difficile de parler d'un souci intime à sa famille, ses amis ou son médecin. Pas à Google:
Cet anonymat relatif autorise quelques requêtes assez inquiétantes:
Nicolas Sarkozy juif?
Il y a quelques grandes constantes sur Google Suggest, qui reflètent les soucis des internautes:
- les personnalités (surtout politiques) sont souvent affublées du mot «juif», comme l'avait remarqué Télérama
- les personnalités féminines sont souvent affublées du mot «nu» (et bien sûr «juive»)
- les films sont quasiment toujours suivis par les mots «megaupload», «torrent» ou «streaming», afin de les trouver en téléchargement illégal
- les problématiques liées au ramadan reviennent souvent
- les problématiques amoureuses sont également très présentes
- et enfin Secret Story semble être la première source de questionnement des internautes (relevé effectué le 11 novembre, les résultats doivent être liés à la diffusion récente du programme)
Toutes ces requêtes expriment un questionnement: «Nicolas Sarkozy est-il juif?» ou «Où puis-je trouver une photo de Rachida Dati nue?». Mais Suggest montre également une pratique plus surprenante de Google: le moteur de recherche vu comme un confident ou un dernier recours à qui on s'adresse directement, comme si Google se confondait avec l'Internet.
En parcourant ces suggestions qui transpirent la vie quotidienne (ou les dérapages d'un dîner de famille un peu trop alcoolisé), on comprend que l'Internet démocratisé n'a plus grand-chose à voir avec le «virtuel». Et comme dans la vraie vie, les lois de la République s'appliquent quand cela va trop loin. La France est en pointe en la matière avec deux décisions très commentées à l'étranger qui ont condamné Google pour des résultats jugés diffamants: «arnaque» pour l'entreprise Direct Energie et «viol», «condamné», «violeur», «sataniste», «prison» pour un particulier condamné à une peine non définitive.
Vincent Glad