CultureLife

Pourquoi Shazam est si magique

Farhad Manjoo, mis à jour le 23.10.2009 à 16 h 27

Technologie, business... Comment fonctionne l'application vedette.

CC FLickr ryoichitanaka

CC FLickr ryoichitanaka

Avec Shazam, les téléphones portables se transforment presque en baguettes magiques. Imaginez: vous êtes au restaurant. Une chanson vous interpelle, mais vous n'arrivez plus à vous souvenir de son titre. Avant, vous ne pouviez rien y faire - sinon demander à votre époux(se) ou au serveur, mais cela revenait à admettre votre propre ignorance. («Mais c'est "Sex Machine", imbécile!».) Avec Shazam (service téléphonique lancé en 2002 et application iPhone extrêmement populaire depuis l'an dernier), en revanche, vous pouvez régler le problème en quelques clics. Appuyez sur une touche de votre téléphone, et quelques secondes plus tard, vous recevez le nom de l'artiste et le titre de la chanson. Les jeux vidéo mis à part, voilà bien chose la plus utile qui nous soit donnée de faire avec nos téléphones portables.

La semaine dernière, Shazam a annoncé que plus de 50 millions de personnes dans le monde avaient utilisé leur service; le nombre total d'utilisateurs était de 35 millions au début de l'année. La société a également annoncé que KPCB, la mythique firme de capital-risque de la Silicon Valley, avait décidé d'investir chez eux (le montant de l'investissement n'a pas été communiqué). Le succès de Shazam semble justifié - quand un fan d'iPhone veut convaincre un récalcitrant d'adopter la machine, c'est toujours cette application qu'il montre en premier (notez que Shazam est également disponible sur Android, BlackBerry, Windows Mobile, ainsi que sur la plupart des autres téléphones). Mais si tous les utilisateurs couvrent de louanges la société (et son application), bien peu peuvent se targuer de comprendre leur fonctionnement. Comment font-ils pour identifier les chansons? Comment gagnent-ils de l'argent (indice: les utilisateurs d'iPhones pourraient bien voir apparaître une version payante de l'application, et ce très bientôt)? Et comment une société comme Shazam (qui répond à un besoin précis et tout à fait occasionnel) voit-elle son propre avenir?

Expliquons tout d'abord comment Shazam fonctionne. La société dispose d'une discothèque de plus de 8 millions de titres; elle a aussi élaboré une technique permettant de définir la signature numérique de chaque titre - en bref, dans leur base de données, chaque chanson a un code qui lui est propre. «L'idée, c'était de créer l'"empreinte digitale'' de chaque morceau», avait expliqué Andrew Fisher, le PDG de Shazam. Quand vous demandez à Shazam de reconnaître une chanson via votre téléphone, l'application décompose le son et le transforme en code en employant la même méthode. Ensuite, il lui suffit de comparer ce code à ceux de la discothèque numérique, et de trouver celui auquel il correspond.

D'accord, mais comment s'y prennent-ils pour élaborer ces «empreintes»? Comme l'expliquait Avery Wang (expert scientifique en chef et co-fondateur de Shazam) au Scientific American en 2003, on a longtemps considéré que l'approche de la société était computationnellement peu réalisable: les chansons contiennent tellement de données qu'il semblait impossible de les réduire à l'état de simples signatures. C'est alors que Wang eut une idée de génie: laisser de côté la majeure partie de la chanson, pour se concentrer uniquement sur les passages «intenses». Shazam a ainsi créé un spectrogramme pour chacune des chansons présentes dans sa base de données, qui prend la forme d'un graphique permettant de visualiser trois dimensions musicales (la fréquence, l'amplitude et le temps). L'algorithme repère alors les points représentant les sommets du graphique — les notes disposant d'une «teneur en énergie plus élevée» que celles qui les entourent, comme l'explique Wang dans un compte rendu de recherche [PDF] décrivant le fonctionnement de Shazam. En pratique, l'algorithme semble pouvoir repérer trois points d'intensité par seconde par chanson.

De prime abord, cet étrange parti pris (mettre de côté l'essentiel de la chanson, ne s'intéresser qu'aux moments d'intensité) pourrait sembler être la porte ouverte aux erreurs d'identification, mais il n'en est rien; fort de sa technique de «prise d'empreinte», Shazam est capable reconnaître une chanson quelle que soit les conditions (environnement bruyant, mauvaise connexion). Selon Fisher, Shazam peut en outre depuis peu reconnaître des morceaux ayant été imperceptiblement accélérés (les DJs de boîtes de nuit utilisent cette technique lorsqu'ils veulent coller à un tempo en particulier; à la radio, on y a parfois recours pour pouvoir caser un titre avant une coupure publicitaire). Et il peut reconnaître plusieurs versions de la même chanson. Je viens de faire test en passant trois versions différentes de «Landslide» (l'originale de Fleetwood Mac et les reprises des Smashing Pumpkins et des Dixie Chicks): Shazam a fait mouche à chaque fois.

Fisher a refusé de me communiquer le taux de réussite de Shazam; à l'en croire, la meilleur preuve de qualité demeure la fidélisation des consommateurs (elle est manifeste: l'utilisateur moyen sollicite le service huit fois par mois). Quand Shazam échoue, c'est généralement parce qu'il n'a pas eu le temps de collecter assez de données — le système doit analyser au moins cinq secondes de musique pour reconnaître un morceau, et il arrive que les gens ne lancent l'application qu'à la fin de la chanson. De la même manière, il ne peut reconnaître un morceau joué en live: si vous demandez à Shazam d'identifier une chanson interprétée lors de l'émission Saturday Night Live, par exemple, il fera certainement chou blanc. (S'il parvient à identifier le titre, c'est probablement que vous regardez cet épisode de 2004, où Ashlee Simpson chante en playback: Shazam n'a pas son pareil pour prendre les simulateurs la main dans le sac.) Fisher m'assure que Shazam est capable de reconnaître les chansons interprétées en live, mais qu'ils ont désactivé cette option pour des «raisons commerciales»: «Notre marque de fabrique, c'est la fiabilité ; les gens nous font confiance. Si nous proposions l'identification de chansons live, le taux de réussite serait moindre».  (Si vous avez une chanson en tête sans parvenir à vous souvenir de son titre, vous pouvez utiliser Midomi, rival de Shazam : il vous suffit de fredonner ou de chanter l'air, et il l'identifie).

La version iPhone de Shazam fait un carton, mais seuls 20% des utilisateurs réguliers du service l'utilisent; Shazam est présent dans plus de 150 pays, et la plupart des opérateurs de téléphonie mobile du monde le propose. L'application iPhone a également marqué un tournant pour l'entreprise: c'était la première fois que Shazam proposait une version gratuite. Une décision risquée, mais qui s'est vite avérée profitable, selon Fisher: grâce à l'iPhone, leur service est devenu célèbre du jour au lendemain; la clientèle de la société s'est considérablement étoffée, ce qui lui permet de dégager des bénéfices en intégrant des publicités à l'application (elle reçoit également un pourcentage à chaque fois qu'un utilisateur achète une chanson via l'application). Mais Fisher explique aussi que la gratuité à ses limites, et qu'il leur faudra changer de modèle tôt ou tard. La société a récemment dévoilé une version Windows Mobile de son application. Son principe : le «freemium» — les utilisateurs qui téléchargeront la version gratuite pourront identifier cinq chansons par mois; ceux qui opteront pour la version premium (qui coûtera 5 dollars en tout et pour tout) pourront effectuer autant de recherches qu'ils le voudront, indéfiniment.

La société prévoit également d'étoffer ses applications en y ajoutant de nouvelles options — un moteur de recommandations, un outil vous permettant de partager vos goûts musicaux avec des amis, et un hit-parade des chansons les plus recherchées. Chaque lundi, Shazam envoie son hit-parade aux maisons de disques, qui s'en servent parfois pour dénicher de nouveaux talents. Conséquence : les artistes ont découvert un nouveau moyen de percer - la publicité télévisée. En 2005, par exemple, le groupe Mint Royale a élaboré une version remixée de «Singin' in the Rain» pour illustrer une publicitéVolkswagen (Golf GTI) diffusée en Europe. Un grand nombre de personnes ont identifié le titre avec Shazam; la maison de disque du groupe a donc décidé d'en faire un single, qui s'est vite retrouvé en tête du hit-parade européen. Et ce n'est pas un scénario isolé; selon Fisher, «ce genre d'histoire arrive au moins une fois par mois de part le monde».

Ainsi donc, Shazam ne fait pas qu'aider les auditeurs à trouver un morceau : parfois, il va jusqu'à aider un morceau à trouver des auditeurs...

Farhad Manjoo

Image de une: CC Flickr ryoichitanaka

Farhad Manjoo
Farhad Manjoo (191 articles)
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites, vous proposer des publicités adaptées à vos centres d’intérêt et nous suivre sur les réseaux sociaux. > Paramétrer > J'accepte