L'Administrateur général des données présente son premier rapport et ses chantiers à venir

L’Administrateur général des données présente son premier rapport et ses chantiers à venir

Un chief et des lettres

Avatar de l'auteur

Xavier Berne

Publié dansDroit

21/01/2016
1
L'Administrateur général des données présente son premier rapport et ses chantiers à venir

Considérant plus d’un an après sa prise de fonction que de nombreux freins continuent d’entraver la circulation des données au sein de l’État, l’Administrateur général des données (AGD) Henri Verdier prévoit de lancer plusieurs chantiers d’envergure. Au programme : un projet de cartographie collaborative des données de l’État, la conception de systèmes informatiques prévoyant « l’extractibilité » de leurs données, etc.

Remis fin décembre au gouvernement, le premier rapport de l’Administrateur général des données n’a été rendu public que jeudi 21 janvier (PDF) – ce qui fait mauvaise figure dès lors qu’il est question d’ouverture des données publiques... Une fois passé ce détail, rappelons que l’AGD est chargé depuis sa nomination, en septembre 2014, de coordonner « l'action des administrations en matière d'inventaire, de gouvernance, de production, de circulation et d'exploitation des données par les administrations ».

En instituant cette nouvelle fonction au sein de l’État, le gouvernement se donnait pour ambition d’améliorer l’efficacité des politiques publiques, la qualité des services rendus aux citoyens, et espérait même pouvoir réaliser quelques économies. Comment ? Grâce aux données et aux techniques d’analyse prédictive – parfois appelées datasciences. Le rapport d’Henri Verdier nous apprend que tout cela s’est notamment concrétisé par :

  • Le développement d’un modèle de prédiction des vols de voiture à l’échelle d’un département (en l’occurrence celui de l’Oise), constitué « de plus de 600 variables géographiques et socio-économiques ainsi que d’autres indicateurs tels que la météo et l’occurrence de vols les jours précédents ». L’objectif de cet outil élaboré en lien avec les services de sécurité intérieure est d’arriver à une « allocation optimale » des patrouilles de police et de gendarmerie.
  • « La bonne boîte », un service en ligne qui permet aux demandeurs d’emploi d’envoyer des candidatures spontanées dans des entreprises qui n’ont pas encore publié d’annonce, mais dont il est fort probable qu’elles recrutent prochainement. « En utilisant des données économiques décrivant l’entreprise et notamment l’historique des embauches, le modèle permet de prédire dans chaque secteur et dans chaque département la probabilité qu’une entreprise embauche dans les six prochains mois », explique l’AGD. Fonctionnant pour l’instant pour les seuls départements de l'Ile-de-France, de Lorraine et des Pays de la Loire, cet outil est accessible gratuitement sur l’Emploi Store de Pôle Emploi (voir ici).
  • Une analyse détaillée de la consommation d’électricité des bâtiments publics, dans l’optique d’optimiser la stratégie d’achat de l’État.

Ces premiers résultats sont jugés « encourageants » par Henri Verdier et son équipe, constituée de quatre « datascientists ». Ils devraient être plus conséquents l’année prochaine puisque l’Administrateur général des données a lancé l’été dernier un appel d’offres en direction des entreprises spécialisées dans les datasciences, et qui auront vocation à intervenir en fonction des besoins des ministères.

Outre ces réalisations pratiques, l’AGD revient longuement dans son rapport sur les freins à la circulation des données au sein de l’administration. « Focalisé sur la fiabilité, la sécurité et la maîtrise des coûts, [l’État] a négligé l’interopérabilité, l’accessibilité et la capacité d’usage, et a donc toléré une culture de silos, des divergences de formats avec des qualités excessives ou au contraire dégradées, une sous-traitance excessive et une perte globale de souveraineté et d’autonomie sur ses propres données » affirme sans ambages Henri Verdier.

Les barrières sont multiples : méconnaissance des données publiques disponibles, systèmes d’information inadaptés, administrations peu favorables aux logiques de coopération et de partage des données, etc. L’Administrateur général des données en arrive à la conclusion que l’État « n’est pas encore prêt à saisir tout le potentiel [des] données ».

L’AGD ouvre les chantiers pour les mois et années à venir

Celui qui est également le nouveau numéro un de la Direction interministérielle au numérique (DINSIC) propose dès lors d’ouvrir « de premiers chantiers permettant de premières et substantielles améliorations de cette situation ».

Henri Verdier annonce tout d’abord qu’il lancera dans le courant de l’année 2016 « un projet de cartographie collaborative ouvert à toutes les administrations qui souhaiteront y participer et en bénéficier ». Ce travail de recensement ne se limitera pas aux seuls documents administratifs détenus par les acteurs publics (rapports, études...), puisqu’il vise à établir une liste complète des données disponibles dans les systèmes d’information de l’État.

Deuxièmement, la DINSIC va « intégrer la capacité à extraire et utiliser les données dans les critères d’examen des projets informatiques de l’État ». Le rapport explique qu’il s’agit de préparer « l’extractibilité » des données de l’administration « by design ». Ce vaste chantier sera mené en lien avec les projets existants, et notamment ceux liés à la stratégie dite d’État plateforme (France Connect, APIentreprises...).

rapport agd dinsic

Pour faciliter la fastidieuse suppression des informations personnelles contenues dans des données publiques (tout du moins quand cette anonymisation est possible), un pôle d’expertise sera mis en place. Il aura notamment pour mission de fournir aux administrations un « kit d’anonymisation » open source. « Ce pôle devra inclure une meilleure maîtrise des questions liées à l’anonymisation des données, non pas uniquement sous l’angle juridique, mais également sous l’angle technique (capacité d’automatiser l’anonymisation à grande échelle). Il assurerait une veille technologique sur les questions d’anonymisation relatives aux différents types de données (tables données de réseau, données géolocalisées, etc.). » L’AGD envisage d’autre part l’élaboration d’un « pack de conformité » avec la CNIL.

1
Avatar de l'auteur

Écrit par Xavier Berne

Tiens, en parlant de ça :

Chiffre et formules mathématiques sur un tableau

CVSS 4.0 : dur, dur, d’être un expert !

C’est comme CVSS 5.0 mais en moins bien

18:17 Sécu 1
Une tête de fusée siglée Starlink.

Starlink accessible à Gaza sous contrôle de l’administration israélienne

Géotechnopolitique

16:37 Web 17
Fibre optique

G-PON, XGS-PON et 50G-PON : jusqu’à 50 Gb/s en fibre optique

Il faudrait déjà généraliser la fibre

16:03 HardWeb 17

Sommaire de l'article

Introduction

L’AGD ouvre les chantiers pour les mois et années à venir

Chiffre et formules mathématiques sur un tableau

CVSS 4.0 : dur, dur, d’être un expert !

Sécu 1
Une tête de fusée siglée Starlink.

Starlink accessible à Gaza sous contrôle de l’administration israélienne

Web 17
Fibre optique

G-PON, XGS-PON et 50G-PON : jusqu’à 50 Gb/s en fibre optique

HardWeb 17
Photo d'un immeuble troué de part en part

Règlement sur la cyber-résilience : les instances européennes en passe de conclure un accord

DroitSécu 7
lexique IA parodie

AGI, GPAI, modèles de fondation… de quoi on parle ?

IA 6

#LeBrief : logiciels libres scientifiques, fermeture de compte Google, « fabriquer » des femmes pour l’inclusion

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

IAScience 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Sécu 11
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Sécu 16
Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hard 5
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécu 10

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

HardWeb 2
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

IASociété 62

Plainte contre l’alternative paiement ou publicité comportementale de Meta

DroitIA 33
Nuage (pour le cloud) avec de la foudre

Économie de la donnée et services de cloud : l’Arcep renforce ses troupes

DroitWeb 0
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société 5
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitWeb 3

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

Le poing Dev – round 6

Next 148

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 9
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Science 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hard 7

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

651e édition des LIDD : Liens Intelligents Du Dimanche

Web 30
Bannière de Flock avec des bomes sur un fond rouge

#Flock, le grand remplacement par les intelligences artificielles

Flock 34
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #9 : LeBrief 2.0, ligne édito, dossiers de fond

Next 65
Pilule rouge et bleue avec des messages codés

Encapsulation de clés et chiffrement d’enveloppes

Sécu 31
Empreinte digital sur une capteur

Empreintes digitales : les capteurs Windows Hello loin d’être exemplaires

Sécu 20

#LeBrief : succès du test d’Ariane 6, réparer plutôt que remplacer, Broadcom finalise le rachat de VMware

Puces en silicium

Apple ne paierait que peu de royalties à Arm pour ses puces

Hard 44

Des logiciels libres scientifiques français à l’honneur

SoftScience 4

Une femme dont le visage se reflète en morceaux dans une série de miroirs.

Pourquoi inclure des femmes si on peut les fabriquer ?

Société 24

Logo de Google sur un ordinateur portable

Google commencera son ménage dans les comptes non utilisés le 1er décembre

Web 7

Commentaires (1)


ColinMaudry Abonné
Il y a 8 ans

Ah ! La bonne boîte est en ligne ! Hâte de voir les retours, mais en phase de test ça s’annonçait prometteur.