L'open data pour sauver le service public

Carte d'un exercice militaire en Ukraine, en 2008. REUTERS/Gleb Garanich

Carte d'un exercice militaire en Ukraine, en 2008. REUTERS/Gleb Garanich

Lecteurs, je vais tenter de tenir cette promesse: dans 5 minutes, vous saurez comment l'Etat peut réduire ses dépenses publiques tout en améliorant la vie de ses concitoyens par l’exploitation des données.

Automne 2012, en encourageant l'ouverture et l'exploitation des données publiques, le gouvernement américain a permis à IBM de créer un logiciel de médecine prédictive: Patient Care and Insights. Le logiciel puise dans l'historique du système de santé en analysant et en recoupant des centaines de milliers de données –traitement, résultats, procédures, morphologies, géographies, climats, etc.– pour permettre aux médecins d'anticiper les futures pathologies de leur patients en détectant certaines similitudes, et ainsi assurer une prise en charge préventive. Un patient qui guérit plus vite est un patient plus heureux et moins coûteux.

Plus proche de nous, l'application Tranquillien est capable de prédire le taux de remplissage des Transiliens d'Ile de France pour aider les voyageurs à éviter les pics d'affluence. Là aussi les bénéfices sont doubles: d'une part l'amélioration de la qualité et du confort des transports pour les voyageurs, et d'autre part une meilleure efficacité du fonctionnement de ses activités pour la SNCF.

Les données publiques, une véritable opportunité pour l'Etat

La matière première de ces services reposant sur des modèles prédictifs sont les données publiques. Des efforts conséquents ont été consentis ces dernières années par les gouvernements successifs pour les libérer, faciliter leur accessibilité et leur exploitation. L'Etat gagnerait à intensifier cette dynamique car les données représentent pour lui une véritable opportunité.

Ses missions de service public pour assurer la santé, la sécurité, le transport, la culture et l'éducation de ses citoyens sont par endroit extrêmement coûteuses –139 milliards d'euros rien que pour l'éducation en 2012– et l'issue ne peut seulement se réduire à de larges coupes budgétaires. Un investissement massif dans des solutions prédictives capables de rationaliser l'activité humaine, d'anticiper ses besoins et d'offrir des services sur-mesure, serait, in fine, à même de réduire ses coûts et d'améliorer l'expérience des usagers. 

Pour l'éducation, il serait possible, en utilisant des informations provenant de sources diverses comme, parmi d’autres, les données sociodémographiques, le taux d’absentéisme et les résultats des enfants scolarisés, d’analyser efficacement  les performances des différents établissements pour gommer les déséquilibres en déployant des moyens adaptés à des besoins spécifiques.

Pour mettre en place ces solutions, il est fondamental de s'assurer que les données –la matière première– soient nombreuses, variées et exploitables. Or, le site de l'Open Knowledge Foundation, Open Data Census, qui évalue l'état des données gouvernementales ouvertes, classe la France en sixième position, distancée par le quinté de tête. En juin dernier, l'OKF appelait les membres du G8 et notamment la France à accentuer l'ouverture des données dans 10 domaines clés afin de développer les services publics.

«En France des progrès restent à faire concernant les données sur les dépenses publiques ou les émissions de polluants tandis que des données essentielles comme celles de la loi ou les codes postaux (ndlr : primordiaux pour les applications qui utilisent la géolocalisation) restent encore hors du giron de l’open data. Un débat est actuellement en cours sur le maintien de redevances sur les données de l’IGN ou du prix des carburants ou encore sur les données de santé.»

Trop de freins

La mission Etalab et la ministre Fleur Pellerin travaillent et s'engagent pour favoriser une meilleure diffusion des données mais de nombreux freins persistent, sur l'ouverture certes mais pas seulement, la qualité et la structuration de ces données sont aussi des points primordiaux. 

Le jeudi 3 Octobre dernier, le rapport sur la gouvernance et l'utilisation des données de santé a été remis à la ministre Marisol Touraine et d'après les premières indications, bien que l'immense base de données présente un «intérêt collectif important», elle comporte «des limitations nombreuses au regard des usages possibles»: les données géographiques sont parcellaires, les données socio-économiques sont quasi absentes, les causes des décès sont inconnues –ce qui empêche notamment de mesurer une mortalité liée à un facteur de risque.

Pire, les données du fichier de police STIC, une gabegie sans nom, devront encore attendre un bon moment avant d'être disponibles et exploitables sur data.gouv.fr car seulement 17% étaient exactes en 2009 –et les erreurs persistent selon la CNIL. Par ailleurs, en 2012, une étude comparative des données déjà disponibles sur les plateformes d'open-data américaine, britannique et française montrait qu'en France seulement 5% (contre 33% aux Etats-Unis) des données sont structurées, c'est à dire utilisables sans délais et que 48% ne sont pas à jour (contre 20% en Grande-Bretagne). Antidot, qui participait au co-design de data.gouv.fr lancé par Etalab en Juin dernier, propose en détails des solutions concrètes pour améliorer leur réutilisation et leur exploitation.

La peur des responsables publics

Certains responsables publics voient l’orage poindre à l’horizon. Ils craignent que les données soient utilisées pour exposer de possibles défaillances, par exemple l'analyse de la pollution dans une ville X pourrait remettre en question l'aménagement urbain effectué par un maire Y. Dernier point, et non des moindres: les inquiétudes liées à la vie privée et la publication des données personnelles.

Ce sujet est un non-débat aujourd’hui, le cadre légal existe déjà, il s'agit de la loi Informatique et libertés du 6 juin 1978, selon laquelle «les données personnelles sont exclues de l'open-data» affirmait, en avril dernier, la Gazette des Communes, écartant d'un revers de plume les exhortations de Gaëtan Gorce. Toutefois, et c'est le devoir de toutes les parties-prenantes, il est absolument nécessaire de mettre en place des garde-fous puissants et indépendants pour garantir la stricte application de cette loi et éviter tout détournement voire contournement dans une société dont la portée de l'ancrage démocratique semble de plus en plus incertaine.

Pour venir à bout de ces obstacles, il s'agit d'amener l'Etat à cette prise de conscience: la libération des données publiques et leur bonne exploitation est d'abord une faveur qu'il se fait à lui-même.

L'optimisation de ses services publics par la data revêt des enjeux macro-économiques trop importants pour qu'il n'envisage pas de renforcer son action et de trancher une bonne fois pour toutes les questions techniques, juridiques, éthiques et politiques qui ralentissent le processus.

C'est en créant une dynamique permanente et quasi-industrielle que le service public pourra véritablement se métamorphoser grâce aux données publiques; les concours DataConnexions –aussi sensés et innovants soient-ils– sont ponctuels et manquent d'amplitude. Pour engager l'exécutif sur cette voie, il faudrait changer de paradigme et présenter l'open data non plus seulement comme un gain démocratique ou social mais avant tout comme un apport économique considérable. 

Renaud Loubert-Aledo

Pour poursuivre la discussion, n’hésitez pas à me contacter via mon compte Twitter.

A LIRE AUSSI