Tech & internetEconomie

Big Data: ce n’est pas la taille qui compte

Jean-Laurent Cassely, mis à jour le 13.05.2013 à 14 h 10

Buzzword Bingo: Big data / planeta via Flickr CC Licence By

Buzzword Bingo: Big data / planeta via Flickr CC Licence By

Si votre data est trop petite, votre concurrent va vous écraser et vous piquer votre petite copine. Voilà, résume avec humour Christopher Mims sur le site Quartz, le message sous-jacent qui tourne en boucle chez les consultants spécialisés qui veulent faire du fameux Big data la prochaine poule aux oeufs d’or de leur activité.

Plus une conférence sérieuse de business, marketing ou management ne pourrait se tenir sans son volet «Big data» sur le thème «Comment la data va révolutionner votre business» (et vous permettre de garder votre copine).

Il ne fait aucun doute que le monde produit, stocke, amasse beaucoup, beaucoup, beaucoup de données de nature très variées. Ainsi comme le note le site spécialisé IT Partners, «de nombreuses têtes se tournent effectivement vers le marché naissant du "big data", qui s’est fait un nom en 2012 mais qui va se concrétiser en 2013 avec le lancement de nouvelles solutions de stockage (matériels et logiciels) et de services associés, dédiés à la gestion de cette gigantesque masse de données.»

Partout, on voit fleurir ces powerpoints d'entreprises illustrant comment les bases de données, les modèles statistiques et le «cloud» vont permettre aux entreprises de gagner plus d’argent en analysant leurs ventes, leurs stocks, leurs stratégies marketing. Des articles enthousiastes, illustrés neuf fois sur dix par des suites de «0» et de «1», s’accumulent pour nous vanter la révolution Big data.

Une conférence de «Big data», ça finit souvent comme ça... IMG_1262.jpg / GraemeThickins via Flickr CC Licence By

Le Big data a fait élire le président des Etats-Unis, va sauver l'industrie du cinéma et prévoir la météo quarante jours à l'avance. On ne sait pas encore si le Big data va nous offrir la vie éternelle, une villa avec piscine sur la côte et nous servir le café, mais on sent que ça ne saurait tarder...

Trop de données tue les données (et coûte cher)

D’abord, pointe le magazine qui a décidé de se faire de nouveaux amis chez les géants IT, acheter des tas de serveurs n’est pas forcément la solution miracle à tous les problèmes. Pour le «small business» que ciblent à présent les fournisseurs de «Big data», Google Doc ou Excel devraient suffire, affirme l'auteur.

Surtout, la course à la quantité n’a pas de sens. Selon le spécialiste du secteur Michael Wu, passé un certain point, le bénéfice de l’ajout de nouvelles quantités de données diminue drastiquement en comparaison du coût induit et du temps passé à les collecter. Un peu de données est utile à la connaissance, trop de données finit pas la noyer. Le problème étant que les corrélations qu’on peut extraire d’un jeu de données qui ne comprendrait que 1.000 items sont déjà très nombreuses. Parmi ces relations identifiées entre elles, seulement un petit pourcentage sera signifiant…

Dans un article récent, le chercheur Vincent Granville donne l’exemple suivant: si vous essayez de trouver une corrélation entre le cours de bourse d’IBM un jour J et celui de Google deux jours plus tôt, vous pouvez rapidement vous retrouvez avec des millions de corrélations. «Si vous utilisez de telles corrélations pour un modèle prédictif, vous perdez», prévient-il.

Small data, la donnée pour tous!

C’est aussi ce qu’affirme Rufus Pollock, fondateur de l’Open knowledge fondation, promoteur de l’idée de «small data». Qu’est-ce?

«Le small data est la quantité de données que vous pouvez aisément stocker et utiliser sur une seule machine et plus précisément sur un seul ordinateur portable ou serveur de haute qualité.»

«Ca n’est pas la taille qui compte, écrit-il. Ce qui importe c’est d’avoir des données —peu importe leur taille— qui nous permettent de résoudre notre problème ou de répondre à la question que nous nous posons».

Sur le blog de l’Open knowledge fondation, Rufus Pollock considère que le «big data» est une fausse priorité.

«Les discussions à propos du big data passent à côté d’une notion plus importante: la réelle opportunité n’est pas le big data, mais le small data. Non pas le grand cercle de données centralisé, mais les données éparses.»

Et le chercheur assène le coup de grâce, dans un emprunt à Tolkien qui ne laissera aucun geek indifférent:

«Non pas un anneau pour les gouverner tous, mais des petites parties liées entre elles d’une manière lâche.»

Non pas, pourrait-on poursuivre, «un Anneau pour les amener tous et dans les ténèbres les lier». Les géants du Big data sont-ils les nouveaux orques du Mordor numérique?

J-L.C

Jean-Laurent Cassely
Jean-Laurent Cassely (990 articles)
Journaliste
En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour réaliser des statistiques de visites, vous proposer des publicités adaptées à vos centres d’intérêt et nous suivre sur les réseaux sociaux. > Paramétrer > J'accepte