Tech & internet

Le secret de Google pour réussir: piller les sites qu'il référence

Le moteur de recherche publie allègrement leurs contenus et limite vos recherches à sa page.

Le logo de Google sur les bureaux de l'entreprise à New York le 3 juin 2019. | Drew Angererer/Getty Images/AFP 
Le logo de Google sur les bureaux de l'entreprise à New York le 3 juin 2019. | Drew Angererer/Getty Images/AFP 

Temps de lecture: 5 minutes

Y a-t-il quelque chose que Google ne sache pas? Quand je ne suis pas sûre de l'orthographe d'un mot, je vais sur Google et je tape un truc qui s'en approche vaguement. Quand j'oublie la recette du vodka Martini, Google me dépanne. Quand je n'arrive plus à me souvenir des paroles d'une chanson, hop, Google. Dans tous ces cas, de plus en plus souvent je ne quitte même pas le moteur de recherche pour trouver ce que j'ai besoin de savoir. Au fil des ans, ce qui avait pour vocation d'orienter les internautes vers d'autres sites est ouvertement devenu le lieu où trouver une foule de réponses. Lorsque la première chose qui apparaît sur une page de recherches Google c'est une recette de vodka martini super pratique, tirée d'un site de cocktails quelconque, c'est ce que Google appelle un «featured snippet». Qui est l'objet du courroux de tout un tas d'autres sites.

 

Y compris d'un certain Genius. Dimanche 16 juin, le Wall Street Journal a révélé que ce site avait publiquement dénoncé Google pour s'être approprié des paroles qu'il avait publiées et les avoir postées dans ses propres résultats de recherches. Pour le prouver, Genius a usé d'un stratagème plutôt malin. L'entreprise a expliqué qu'elle utilisait plusieurs styles d'apostrophes dans ses publications –et qu'elle avait retrouvé ce même format dans les paroles proposées par les pages de recherches de Google.

Conséquence, s'indigne Genius, son site subit une baisse de fréquentation. Cette plainte arrive juste au moment où le ministère de la Justice américain serait en train de préparer une enquête sur les possibles pratiques anticoncurrentielles du moteur de recherche. Google dit utiliser un autre site tiers, LyricFind, pour trouver les paroles de chansons qu'il publie. Celui-ci a affirmé au Wall Street Journal ne pas prendre ses paroles de chansons chez Genius. Or, Genius explique qu'il a placé les différentes formes d'apostrophes de ses textes de manière à ce qu'il suffise de les décoder en points et en tirets pour qu'elles écrivent les mots «red handed» en morse. Soit, en français: «La main dans le sac.»

«La main dans le sac»

Genius n'est pas la seule entreprise à se plaindre que Google lui pompe ses contenus. En 2017, Yelp a déposé une plainte auprès du gouvernement américain, reprochant au géant des recherches de lui avoir piqué plus de 385.000 photos pour les mettre sur ses propres listings d'entreprises. En 2012, la Federal Trade Commission a découvert que Google se servait dans les contenus de sites comme Yelp, TripAdvisor et Amazon et noté que lorsque ses concurrents lui demandaient d'arrêter, Google menaçait de les supprimer de ses résultats de recherche.

Le Wall Street Journal cite des données de l'entreprise de web analytique Jumpshot qui révèlent qu'en mars dernier, 62% des recherches sur téléphones mobiles sur Google étaient des recherches «no click», c'est-à-dire durant lesquelles l'internaute ne visite aucun autre site à l'issue de sa recherche.

Audition du PDG de Google Sundar Pichai. | WSJ

Il y a une bonne raison de s'en inquiéter, même si tout cela a l'air d'une simple histoire de trafic internet marginal. Au lieu d'avoir un internet où les sites mènent des uns aux autres, créant un vaste réseau mondial d'informations, on assiste à une aspiration par Google d'un volume toujours croissant de web sur son propre terrain. S'il peut être pratique de taper ce que vous cherchez sur Google et d'avoir la réponse juste sous votre nez, ces résultats en «position zéro» ne sont pas toujours si fantastiques (il n'est pas rare que l'encadré de haut de page de Google explique avec insistance que quelqu'un est mort alors qu'il n'en est rien). Le moteur a le potentiel suffisant pour aspirer toute la vie d'internet, supposé être au départ le royaume de la diversité –c'est-à-dire un lieu où n'importe qui peut créer un site fondé sur ses centres d'intérêt ou son idée commerciale, et où tout le monde a les moyens de le trouver.

Têtes de gondole

Aujourd'hui, internet se limite de plus en plus à Google plus Facebook, Amazon, Netflix et une poignée d'autres plateformes et de commerces qui dominent la très grande majorité du trafic –dans de nombreux cas, la publicité aussi. Il est bien rare de naviguer sur un site qui ne soit pas une plateforme sans passer d'abord par Google. C'est devenu si commun que le moteur de recherche vous laisse même faire des recherches dans d'autres sites à partir de Google.

Le vendeur de meubles Wayfair, par exemple, peut être exploré à partir de Google.com. Tout comme Target, Walmart, Craigslist et eBay.

Lorsque Google décourage les internautes de se rendre sur d'autres sites, ce n'est pas seulement la diversité des expériences sur internet que nous perdons; nous renonçons aussi à tout ce qu'il y a autour. Quand Google pique des réponses à Wikipedia pour les mettre dans ses petits encadrés, cela veut dire que nous avons moins besoin de nous rendre sur Wikipedia.

Mais quand nous n'allons plus sur Wikipedia, nous ne voyons pas les citations que les contributeurs bénévoles utilisent pour mettre des liens vers leurs sources. Nous ne voyons pas non plus que nous pouvons contribuer à Wikipedia. Ni les boutons pour faire des dons, dont le site dépend pour continuer à vivre.

C'est pareil pour les recettes. J'ai beau trouver agaçante cette tendance des recettes de cuisine en ligne à débuter comme la préface d'un journal intime, les dépouiller de ce contexte et se contenter de montrer la liste des ingrédients, comme le fait Google quand je cherche «recette de pain de maïs», signifie que je rate aussi les tuyaux de l'auteur de la recette et les commentaires sur la manière de jouer avec pour obtenir des résultats différents.

Enquête anti-trust

Les législateurs des deux principaux partis américains ont commencé à s'en apercevoir. Début juin, des député·es de la Chambre des représentants ont lancé des enquêtes sur Apple, Google, Facebook et Amazon, conduites par David Cicilline, représentant démocrate du Rhode Island qui préside le sous-comité judiciaire de la Chambre sur l'anti-trust, qui va probablement chercher à savoir si, oui ou non, Google utilise intentionnellement sa position dominante dans le domaine des recherches pour garder les gens sur son site et les empêcher d'en visiter d'autres, pratique relativement anticoncurrentielle, pour le dire gentiment.

On vient d'apprendre que des représentant·es nommé·es par Trump au ministère de la Justice et à la Federal Trade Commission s'étaient mis d'accord pour se répartir la surveillance des quatre grosses entreprises du net. De hauts fonctionnaires de la Maison Blanche «soutiendraient» la surveillance rapprochée pour une éventuelle action anti-trust.

Quand on tape «moteur de recherche» sur Google, il ne propose que lui. Je me demande bien pourquoi.

En attendant, Google peut décider de faire marche arrière de son propre chef et de réduire l'utilisation de ses featured snippet afin d'éviter un examen trop rapproché. Le problème quand Google fait quelque chose tout seul, c'est qu'il est fort peu probable que cela menace réellement sa position dominante.

Ce n'est pas comme si les solutions alternatives se bousculaient au portillon –je doute que la plupart des internautes qui utilisent Google se préparent à basculer vers Bing à court terme. En outre, quand on tape «moteur de recherche» sur Google, il ne propose aucun autre moteur de recherche que lui. Je me demande bien pourquoi.

cover
-
/
cover

Liste de lecture