Un réseau de mille ordinateurs agencé par Google vient de franchir une étape décisive en informatique: ce gigantesque cerveau électronique a appris par lui-même à reconnaître les chats sur les photos. En terme de capacité à identifier les images, les ordinateurs restent loin derrière les humains, mais par rapport aux autres animaux, qu’en est-il ? Les chats reconnaissent-ils les chats en photo?
C’est probable. Plusieurs races d’animaux semblent attirées par les représentations de membre de leur espèce. Si, par exemple, on confie à un macaque japonais le contrôle de la durée d’affichage d’une image sur un écran d’ordinateur, il passera plus de temps à admirer d’autres macaques japonais que des singes rhésus ou des macaques à bonnet.
De leur côté, placés dans un labyrinthe et sans entraînement préalable, des moutons suivront plus souvent les chemins balisés par des images d’autres moutons que s’il s’agissait de visages humains. Les chiens, installés devant un écran de télévision où se succèdent des photos de chiens, d’humains, de jouets et de lettres de l’alphabet, fixent les images de chiens plus longtemps et ont tendance à regarder vers le centre de l’image.
L’Explication n’a pas connaissance de recherches similaires portant sur les chats — du fait, probablement de leur caractère fâcheusement apathique dans le cadre des expériences en laboratoire. Mais rien dans la neurobiologie des félins ne suggère un autre comportement.
La nécessité d'un entrainement pour les animaux
La capacité à catégoriser les images semble s’étendre au-delà des mammifères. Les pigeons, l’un des animaux les plus étudiés au monde, ont fait la preuve de leur capacité à faire la différence entre les images de paysages urbains ou campagnards, les lettres de l’alphabet, les personnages de dessins animés et les tableaux de Monet ou de Picasso.
En revanche, il est difficile de savoir si les pigeons, comme les humains et l’ordinateur assemblé par Google, créent des conceptions mentales distinctes pour chaque catégorie d’objet qu’ils regardent, ou s’ils se reposent sur un repère visuel de plus bas niveau (dans l’une des expériences, les pigeons avaient piégé les chercheurs en se fondant sur des caractéristiques sans rapport de l’arrière-plan pour repérer les images comportant ou non des humains).
La comparaison entre l’ordinateur de Google et les animaux pose un autre problème. La capacité à reconnaître les chats de l’ordinateur de Google est remarquable en ce qu’il a appris à repérer la présence de chats sans y avoir été entraîné par un humain. Si l’on ne soumet pas les animaux à un entraînement, en contraste, il est impossible de savoir ce que pensent nos petites bêtes.
De la même façon, il est difficile de savoir si les animaux comprennent que les images en deux dimensions sont des représentations d’objets existant réellement, ou s’ils pensent que les images sont les objets eux-mêmes. On a démontré que la fréquence cardiaque d’un chimpanzé augmente lorsqu’il est confronté à des images d’individus qu’il connaît, à l’inverse d’images de singes inconnus.
On ne sait pas exactement si le chimpanzé confond l’image avec son congénère de chair et d’os, ou si la seule représentation d’un ami fait trembler son cœur (pour mémoire, le cœur d’un nouveau-né humain bat plus vite quand on lui montre des photos de ses parents).
Le problème de la vidéo sur ordinateur
La façon dont les animaux perçoivent le signal vidéo ajoute une couche de complexité supplémentaire. La vidéo n’est pas une représentation continue du mouvement, mais une série d’images qui s’enchaînent assez vite pour que l’œil humain ne puisse le déceler. Toutefois, la fréquence des images au cinéma et à la télévision n’est pas suffisante pour abuser un chien. Pour la race canine, la télévision doit ressembler à une série d’images fixes, ou à un mouvement chaotique.
Les chats se placent probablement entre l’homme et le chien dans les tests de fréquence de fusion, leur perception de la télévision dépend donc probablement de l’éclairage de la pièce (il est plus difficile de distinguer le scintillement dans l’obscurité, raison pour laquelle on éteint les lumières au cinéma).
Brian Palmer
Traduit par David Korn
L’explication remercie Robert Cook de l’université de Tufts, rédacteur-en-chef de l’ouvrage en ligne Avian Visual Cognition.
Retrouvez tous nos articles de la rubrique L'explication ici. Vous vous posez une question sur l'actualité? Envoyez un mail à explication @ slate.fr.