L’Administrateur général des données présente son premier rapport et ses chantiers à venir
Un chief et des lettres
Le 21 janvier 2016 à 14h59
6 min
Droit
Droit
Considérant plus d’un an après sa prise de fonction que de nombreux freins continuent d’entraver la circulation des données au sein de l’État, l’Administrateur général des données (AGD) Henri Verdier prévoit de lancer plusieurs chantiers d’envergure. Au programme : un projet de cartographie collaborative des données de l’État, la conception de systèmes informatiques prévoyant « l’extractibilité » de leurs données, etc.
Remis fin décembre au gouvernement, le premier rapport de l’Administrateur général des données n’a été rendu public que jeudi 21 janvier (PDF) – ce qui fait mauvaise figure dès lors qu’il est question d’ouverture des données publiques... Une fois passé ce détail, rappelons que l’AGD est chargé depuis sa nomination, en septembre 2014, de coordonner « l'action des administrations en matière d'inventaire, de gouvernance, de production, de circulation et d'exploitation des données par les administrations ».
En instituant cette nouvelle fonction au sein de l’État, le gouvernement se donnait pour ambition d’améliorer l’efficacité des politiques publiques, la qualité des services rendus aux citoyens, et espérait même pouvoir réaliser quelques économies. Comment ? Grâce aux données et aux techniques d’analyse prédictive – parfois appelées datasciences. Le rapport d’Henri Verdier nous apprend que tout cela s’est notamment concrétisé par :
- Le développement d’un modèle de prédiction des vols de voiture à l’échelle d’un département (en l’occurrence celui de l’Oise), constitué « de plus de 600 variables géographiques et socio-économiques ainsi que d’autres indicateurs tels que la météo et l’occurrence de vols les jours précédents ». L’objectif de cet outil élaboré en lien avec les services de sécurité intérieure est d’arriver à une « allocation optimale » des patrouilles de police et de gendarmerie.
- « La bonne boîte », un service en ligne qui permet aux demandeurs d’emploi d’envoyer des candidatures spontanées dans des entreprises qui n’ont pas encore publié d’annonce, mais dont il est fort probable qu’elles recrutent prochainement. « En utilisant des données économiques décrivant l’entreprise et notamment l’historique des embauches, le modèle permet de prédire dans chaque secteur et dans chaque département la probabilité qu’une entreprise embauche dans les six prochains mois », explique l’AGD. Fonctionnant pour l’instant pour les seuls départements de l'Ile-de-France, de Lorraine et des Pays de la Loire, cet outil est accessible gratuitement sur l’Emploi Store de Pôle Emploi (voir ici).
- Une analyse détaillée de la consommation d’électricité des bâtiments publics, dans l’optique d’optimiser la stratégie d’achat de l’État.
Ces premiers résultats sont jugés « encourageants » par Henri Verdier et son équipe, constituée de quatre « datascientists ». Ils devraient être plus conséquents l’année prochaine puisque l’Administrateur général des données a lancé l’été dernier un appel d’offres en direction des entreprises spécialisées dans les datasciences, et qui auront vocation à intervenir en fonction des besoins des ministères.
Outre ces réalisations pratiques, l’AGD revient longuement dans son rapport sur les freins à la circulation des données au sein de l’administration. « Focalisé sur la fiabilité, la sécurité et la maîtrise des coûts, [l’État] a négligé l’interopérabilité, l’accessibilité et la capacité d’usage, et a donc toléré une culture de silos, des divergences de formats avec des qualités excessives ou au contraire dégradées, une sous-traitance excessive et une perte globale de souveraineté et d’autonomie sur ses propres données » affirme sans ambages Henri Verdier.
Les barrières sont multiples : méconnaissance des données publiques disponibles, systèmes d’information inadaptés, administrations peu favorables aux logiques de coopération et de partage des données, etc. L’Administrateur général des données en arrive à la conclusion que l’État « n’est pas encore prêt à saisir tout le potentiel [des] données ».
L’AGD ouvre les chantiers pour les mois et années à venir
Celui qui est également le nouveau numéro un de la Direction interministérielle au numérique (DINSIC) propose dès lors d’ouvrir « de premiers chantiers permettant de premières et substantielles améliorations de cette situation ».
Henri Verdier annonce tout d’abord qu’il lancera dans le courant de l’année 2016 « un projet de cartographie collaborative ouvert à toutes les administrations qui souhaiteront y participer et en bénéficier ». Ce travail de recensement ne se limitera pas aux seuls documents administratifs détenus par les acteurs publics (rapports, études...), puisqu’il vise à établir une liste complète des données disponibles dans les systèmes d’information de l’État.
Deuxièmement, la DINSIC va « intégrer la capacité à extraire et utiliser les données dans les critères d’examen des projets informatiques de l’État ». Le rapport explique qu’il s’agit de préparer « l’extractibilité » des données de l’administration « by design ». Ce vaste chantier sera mené en lien avec les projets existants, et notamment ceux liés à la stratégie dite d’État plateforme (France Connect, APIentreprises...).
Pour faciliter la fastidieuse suppression des informations personnelles contenues dans des données publiques (tout du moins quand cette anonymisation est possible), un pôle d’expertise sera mis en place. Il aura notamment pour mission de fournir aux administrations un « kit d’anonymisation » open source. « Ce pôle devra inclure une meilleure maîtrise des questions liées à l’anonymisation des données, non pas uniquement sous l’angle juridique, mais également sous l’angle technique (capacité d’automatiser l’anonymisation à grande échelle). Il assurerait une veille technologique sur les questions d’anonymisation relatives aux différents types de données (tables données de réseau, données géolocalisées, etc.). » L’AGD envisage d’autre part l’élaboration d’un « pack de conformité » avec la CNIL.
Le 21 janvier 2016 à 14h59
L’Administrateur général des données présente son premier rapport et ses chantiers à venir
-
L’AGD ouvre les chantiers pour les mois et années à venir
Commentaires (1)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 21/01/2016 à 16h07
#1
Ah ! La bonne boîte est en ligne ! Hâte de voir les retours, mais en phase de test ça s’annonçait prometteur.