Life

Pourquoi il est difficile de créer un moteur de recherche pour les enfants

Michael Agger

Google Kids n'est pas pour demain...

A Los Angeles, en 2011. REUTERS/Lucy Nicholson

A Los Angeles, en 2011. REUTERS/Lucy Nicholson

Après avoir publié ma modeste proposition pour un «Google Kids», un moteur de recherche à destination des enfants, j'ai rapidement compris que j'avais donné un coup de pied dans la fourmilière. Le Web présente toutes sortes de nouveaux risques pour le jeune internaute, et toutes sortes de débouchés pour qui concevra des moyens de garantir sa sécurité.

Par exemple, je n'avais jamais entendu parler de typosquatting. Cette activité illégale consiste à acheter un nom de domaine basé sur une faute de frappe ou d'orthographe d'un site pour enfants très connu, par exemple boblebricoluer.com, et de le faire pointer vers un site pornographique. Un type a dû rembourser les 164.000 dollars qu’il avait gagnés ainsi.

Le typosquatting montre bien les problèmes que soulève la création d'un moteur de recherche pour les enfants. Ce sont de petits êtres curieux, inventifs et plein de ressources. Ils vont taper ce qu'ils cherchent, que ce soit Scoup, Ben et Tourneboule ou «justin bieber embrassant selena gomez». La capacité infinie des enfants à tester les limites m’avait fait me tourner vers un navigateur dédié, comme KidZui (que des lecteurs m'ont présenté comme une solution possible). Tous les sites accessibles sont approuvés. Pourtant, en pratique, je trouve KidZui déprimant. Il met tellement en avant les jeux, les films des gros studios et les contenus sponsorisés que j'ai un peu l'impression d’abandonner mon gamin au centre commercial d'Internet.

De plus, je veux que mes enfants apprennent les bases de l'informatique. KidZui et consorts ont leur propres boutons de navigation et des interfaces avec tout plein de smileys, mais l'intérêt de faire des recherches sur Internet, c'est aussi d'apprendre à se servir d'un ordinateur: utiliser une barre de défilement, un champ de recherche, fermer une fenêtre, etc. De toute façon, les gamins sont malins. Ils savent qu'il y a un «vrai» Internet.

Aucun filtre ni navigateur dédié ne peut rivaliser avec la nouveauté et la diversité du Web. Et puis, il y a beaucoup de choses sur les sites «adultes» comme les journaux ou Flickr susceptibles d’intéresser des enfants. Alors, comment découper le Web par tranche d'âge? L'étude publique la plus intéressante que j'aie lue a été réalisée par le consortium européen PuppyIR.

Je n'aime pas laisser mon fils seul devant YouTube, parce qu’on peut tomber très bas en quelques clics. Carsten Eickhoff et Arjen P. de Vries, chercheurs à l’Université de technologie de Delft aux Pays-Bas, ont examiné des vidéos sur YouTube pour voir si un algorithme pouvait identifier celles qui convenaient aux enfants. Ils se sont intéressés en particulier aux commentaires, qui brillent pourtant rarement par leur intelligence.

Cependant, une étude précédente a prouvé qu’ils sont plus utiles que le titre de la vidéo ou les tags (mots-clés) pour se faire une idée de son véritable contenu. Les chercheurs ont également examiné la fréquence des commentaires et leur ton (une technique appelée «analyse de tonalité») pour voir s’ils contenaient des éléments de «controverse». Le postulat étant qu’une vidéo de Hello Kitty attire en général peu de trolls prêts à en découdre.

Les cinq indicateurs les plus significatifs pour trouver des vidéos convenant aux enfants sont: le nombre de vues, la note moyenne, le nombre de fois que la vidéo a été ajoutée aux favoris, le nombre de vues des autres vidéos de l’utilisateur YouTube et un faible taux de «controverse» dans les commentaires. Les chercheurs ont été surpris de découvrir que l’indicateur le plus significatif est le nombre de vues, mais mon expérience personnelle m’avait déjà prouvé que c’est un moyen efficace de distinguer les bonnes vidéos pour enfants. L’épisode de Thomas et ses amis en haute définition est en général plus regardé que les mash-ups, hommages et autres parodies de la série. 

Principale implication de cette expérience, l’apport de la communauté peut être très utile dans la classification des vidéos. D’après le quatrième meilleur indicateur, si un utilisateur YouTube a posté plusieurs vidéos très regardées, il est considéré comme une source fiable de contenus intéressants. De fait, en laissant des commentaires et des notes, nous exerçons déjà une forme de contrôle, donnant ainsi aux créateurs d’algorithmes des indices sur lesquels se baser. YouTube teste actuellement des «boutons de réaction» (LOL, OMG, CUTE, WTF, NUL), qui pourraient être utilisés pour signaler les vidéos pour enfants.

Mais pour le reste du web? Karl Gyllstrom et Marie-Francine Moens, de la Katholieke Universiteit Leuven en Belgique, ont écrit une étude fascinante où ils tentent de définir le «Web des enfants». Leur hypothèse de départ est qu’une «page créée pour les enfants est plus susceptible de citer, ou d’être citée par, des sites pour enfants que des sites pour adultes.» Ils ont baptisé leur système AgeRank, d’après le fameux PageRank qui a fait le succès et la fortune de Google.

Ils ont découvert que le Web pour enfants présente effectivement un haut degré de «voisinage», c’est-à-dire que les sites pour enfants pointent bien l’un vers l’autre, ou qu’«ils sont plus susceptibles de faire des liens vers des pages qui sont elles-mêmes plus susceptibles de pointer vers des pages pour enfants». Pour simplifier radicalement leur travail: la limite de PageRank, c’est qu’il met en avant les pages utiles au plus grand nombre, alors que nous voulons les pages les plus utiles aux enfants. D’après Gyllstrom et Moens, AgeRank pourrait suppléer PageRank en indiquant quand un site semble appartenir à un environnement de sites pour enfants ou qu’il a un niveau de lecture plus adéquat.* 

Cela ne résout pas tout, bien sûr. Mais ce genre d’étude ouvre la voie à des recherches plus spécialisées. Piffany, un moteur de recherche pour enfants aujourd’hui abandonné, avait un slogan qui résumait joliment le dilemme: «Pourquoi un enfant de 9 ans et un adulte de 29 ans faisant une même recherche devraient obtenir les mêmes résultats?» J’imagine que c’est là que les avocats entrent en jeu. Une entreprise qui a comme cœur de cible «les enfants» doit s’attendre aux critiques et aux poursuites judiciaires. Il suffit d’un seul résultat inadéquat sortant au moment inadéquat à la personne inadéquate. Mon collègue Farhad Manjoo m’a appris qu’au début des années 2000, Google est allé jusqu’à créer une version d’essai de Google Kids, avec une image de dinosaure sur la page d’accueil.

Mais l’expérience a tourné court, et la quête continue.

Michael Agger

Traduit par Florence Curet

* J’ai découvert un site très utile aux enfants grâce à cette étude. Il y a une version de Wikipedia en anglais simplifié qui n’utilise que des phrases courtes et des mots simples. L’autre jour, je regardais l’article sur les trilobites avec mon fils. La page normale de Wikipedia était trop détaillée pour lui, alors que l’article en anglais simplifié contenait juste ce qu’il lui fallait.

Michael Agger
Michael Agger (21 articles)
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites, vous proposer des publicités adaptées à vos centres d’intérêt et nous suivre sur les réseaux sociaux. > Paramétrer > J'accepte