Europe : les organismes publics devront partager gratuitement de nouvelles données

Europe : les organismes publics devront partager gratuitement de nouvelles données

Expire !

Avatar de l'auteur
Martin Clavey

Publié dans

Droit

03/01/2023 7 minutes
12

Europe : les organismes publics devront partager gratuitement de nouvelles données

La Commission européenne a établi une liste de données prioritaires à partager en licence Creative Commons par les organismes publics des états membres de l'UE, dont notamment un certain nombre qui pourront aider à la protection de l'environnement.

Le 21 décembre dernier, la Commission européenne a publié un règlement d'exécution établissant une liste d'ensembles de données qualifiées « de forte valeur » que les organismes publics vont devoir partager gratuitement.

Cinq grands ensembles sont concernés par cette liste : le géospatial, l'observation de la terre et l'environnement, les données météorologiques, certaines statistiques globales sur les pays (allant de la production industrielle jusqu'à la fécondité en passant par l'emploi), certaines informations sur les entreprises et leur propriété, et enfin la « mobilité », et plus concrètement les réseaux de transport.

Ce règlement va entrer en vigueur le 9 février prochain et sera applicable 16 mois après, soit le 9 juin 2024.

Une bonne partie de ces données sont, en fait, des données qui étaient de plus en plus partagées au sein de l'Union européenne puisque la directive Inspire de 2007 exigeait déjà aux autorités publiques de rendre ces données accessibles au public et de les partager entre elles.

Mais ce nouveau règlement, qui fait suite à la directive de 2019 sur les données ouvertes, impose la gratuité des données et des conditions de mise à disposition nouvelles et plus pratiques.

Prolonger l'inspiration

En 2007, l'Union Européenne se dotait d'une Infrastructure d'information géographique dans la Communauté européenne (INfrastructure for SPatial InfoRmation in the European community, Inspire).

Cette infrastructure est chargée notamment de faciliter le suivi des politiques environnementales en obligeant les autorités publiques à recenser les données qu'elles détiennent, les mettre sous une forme interopérable, créer et maintenir à jour les métadonnées et les partager avec les autres autorités publiques.

Si les services de recherche devaient être gratuits et que la consultation n'était payante que dans des cas particuliers (dont Météo France), le téléchargement, la modification ou l'utilisation d'API pouvaient être payants.

Concrètement, les données récoltées par Inspire sont visibles et disponibles pour l'ensemble des pays européens via le géoportail de l'infrastructure. La France rend aussi les siennes accessibles sur le géoportail de la connaissance du territoire mis en œuvre par l’IGN.

Inspire

Des données en licence CC-by en format ouvert et accessibles

Mais la directive sur les données ouvertes publiée en 2019 a prévu la création d'une liste de catégories thématiques d'ensembles de données de forte valeur pour « mettre en place des conditions propices à la réutilisation de documents à laquelle se rattachent d'importants avantages socioéconomiques d'une valeur particulièrement élevée pour l'économie et la société ».

La liste d'ensembles de données de forte valeur fixée par le règlement publié le 21 décembre dernier est en grande partie composée par les ensembles qui ont été créés à l'occasion d'Inspire.

Les données qui se trouvent dans cette liste doivent être publiées sous licence Creative Commons BY 4.0 ou sous « toute licence ouverte équivalente ou moins restrictive ». De même, elles doivent être toutes disponibles dans « un format ouvert et lisible par machine, reconnu au niveau de l’Union ou au niveau international ».

Pour la quasi-totalité, elles devront aussi être disponibles par l'intermédiaire d’interfaces de programmation d’application (API) et sous la forme d’un « téléchargement en masse », une fonction qui permet de télécharger un ensemble de données entier en un ou plusieurs paquets. Une attention est aussi demandée sur la qualité des métadonnées les accompagnant.

Beaucoup de données d'Inspire

La première catégorie de données de la liste, qui aide particulièrement à la cartographie européenne en général, est la « géospatiale ». Elle inclut les ensembles de données relevant des thèmes de données Inspire « unités administratives », « dénominations géographiques », « adresses », « bâtiments » et « parcelles cadastrales » à tous les niveaux de généralisation disponibles avec une granularité jusqu’à l’échelle de 1 : 5 000.

Le règlement y a ajouté les « parcelles de référence » et les « parcelles agricoles » au niveau de précision au moins équivalent à celui de la cartographie à une échelle 1 : 10 000 et, à partir de 2016, à une échelle de 1 : 5 000.

La liste contient une deuxième catégorie « observation de la terre et environnement ». Celle-ci est aussi abondamment fournie par Inspire. Elle en inclut « les ensembles de données sur l’observation de la terre – y compris des données satellitaires ou de télédétection, ainsi que des données au sol ou in situ –, l’environnement et le climat  ».

On pourra y trouver des données sur l'hydrographie, les zones à risque naturel ou la répartition des espèces, par exemple. Le règlement y ajoute aussi les données collectées par les organismes publics concernant l'air, le climat, les émissions, la protection de la nature et la biodiversité, le bruit et les déchets.

La catégorie « mobilité » touche toutes les données concernant les réseaux de transport incluses dans la directive Inspire.

Mais aussi des nouvelles données

Le règlement possède aussi une catégorie « météorologique » qui vise « les ensembles de données relatifs à des données d’observation mesurées par les stations météorologiques, des observations validées (données climatiques), des alertes météorologiques, des données radar et des modèles de données de prévision météorologique numérique (PMN) ».

On pourra y retrouver, par exemple, les données d’observation mesurées par stations météorologiques, les alertes météorologiques (au moins 48 heures à l’avance). Ces données devront aussi être accessibles par l’intermédiaire d’API et sous la forme d’un « téléchargement en masse », sauf pour l’ensemble de données « modèles de données PMN » qui en est exempté.

Il faut aussi souligner que le texte du règlement permet aux États membres d'« exempter certains organismes du secteur public, à leur demande et conformément aux critères énoncés dans la directive, de l’obligation de mettre à disposition des ensembles de données de forte valeur à titre gratuit pour une durée n’excédant pas deux ans à compter de la date d’entrée en vigueur du présent règlement d’exécution ». Ainsi, l'État français pourrait exempter Météo France d'un certain nombre de contraintes pendant cette durée.

Le règlement intègre aussi un volet « entreprises et propriété d’entreprises » contenant les données sur la situation de la société, la date d'enregistrement, le siège social, l'activité, etc., ainsi que des documents comptables, notamment les états financiers, les déclarations non financières, les rapports de gestion et les rapports financiers annuels.

Enfin, un volet fourre-tout appelé « statistiques » obligera les organismes publics à mettre à disposition les données sur des sujets comme la production industrielle, le flux touristique en Europe, la population, les dépenses de santé courantes, la pauvreté, l'emploi, le chômage, la main-d'œuvre potentielle, etc.

Écrit par Martin Clavey

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Prolonger l'inspiration

Des données en licence CC-by en format ouvert et accessibles

Beaucoup de données d'Inspire

Mais aussi des nouvelles données

Le brief de ce matin n'est pas encore là

Partez acheter vos croissants
Et faites chauffer votre bouilloire,
Le brief arrive dans un instant,
Tout frais du matin, gardez espoir.

Fermer

Commentaires (12)


C’est vraiment une excellente nouvelle que cette directive impose l’utilisation de licence « vraiment » ouvert, c’est-à-dire autorisant l’usage commercial et les travaux dérivés. Car je vois fleurir pas mal de données, dites ouvertes qui sont en CC-NC-ND.



Par ailleurs, comme beaucoup de ces données ouvertes sont en fait des bases de données, je ne suis pas sûr que les licences CC soient les plus adaptées. La licence ODbL aurait du au moins être mentionnée. Cela étant dit, c’est l’intention qui compte et je ne pense pas qu’un quelconque organisme attaquera en justice quelqu’un réutilisant une base de données sous licence CC BY au prétexte que la CC BY ne protège pas (ou protège mal) les bases de données.



Quoi qu’il en soit, ça prend du temps (trop ?) mais ça va clairement dans la bonne direction.


Concernant Météo France, il y a un vrai sujet. C’est financé par nos impôts mais ça l’ait insuffisamment alors que cet organisme assure une mission régalienne (prévoir les événements météorologiques d’ampleur afin de pouvoir s’y préparer). Cela conduit donc Météo France a facturer au prix fort les données quel possède, y compris à d’autres organismes publics qui en ont besoin.
Cela conduit par exemple le CEA à utiliser les données météorologiques en provenance des États-Unis, y compris pour le territoire français et européen.



Ça ressemble à la situation qui était celle de l’IGN il y a quelques années. Bien qu’assurant également une mission régalienne, l’IGN était obligé de vendre ces fameuses cartes IGN - plébiscitées par les randonneurs et randonneuses - pour boucler son budget.


“la pauvreté, l’emploi, le chômage, la main-d’œuvre potentielle”



les données biaisées (pauvreté, chômage, emploi) ou fallacieuses (Main d’œuvre, pauvreté) ?


Cool ! J’espère que ça aboutira à des catalogues plus accessibles ! Dans le même genre, l’ouverture des données IGN a plutôt bien fonctionné.
Si au passage ils pouvaient en profiter pour pousser des formats standards, et imposer des contraintes sur l’homogénéité des données, ça serait pas dommage …


ça marchera aussi pour les infos des greffiers qui ne sont délibérément pas à jour en open data?


La question de la souveraineté et de son financement (“C’est financé par nos impôts mais ça l’ait insuffisamment alors que cet organisme assure une mission régalienne” de pamputt) est réelle, cf. en ce qui concerne l’IGN Rapport d’information de la commission des finances du Sénat


Vous pourriez demander à Météo-France de vraiment partager leurs données. Même forcé par la commission européenne, ils ne le feront pas (trop belle poule aux oeufs d’or)
Je ne sais pas qui a le poids suffisant pour cela. (j’ai bien peur que même en passant par la CADA ou la CJUE, ca ne suffise pas)


Je vais être à contre courant mais je ne vois pas en quoi c’est une bonne nouvelle que les données “à forte valeur” européennes soient partagées sans réciprocité de la part du reste du monde.



En gros les services publiques européens vont perdre des rentrées d’argent potentielles qui devront sans doute être compensées par nos impôts.


C’est une bonne question, mais les exemples de Météo France et de l’IGN sont riches d’enseignement. On utilise les données des voisins pour améliorer les prévisions météo, les cartes topo françaises n’étaient plus utilisées… La réciprocité c’est que tout le monde le fait. Les rentrées d’argent quand personne ne vous achète les données ce n’est pas une rentrée d’argent.
Je ne pense pas que les données dont on parle sont “à forte valeur”. La valeur est surtout ajoutée après-coup, dans le traitement des données. Je découvre avec enthousiasme les données Lidar HD de l’IGN mais ce ne sont pas les données elle-mêmes qui sont importantes, ce sont les relevés photogrammétriques que je réalise au drone, et que les nuages de point de l’IGN me permettent de géoréférencer gratuitement (échelle, orientation, altitude…). La données publique n’est pas un business, c’est un initiateur de business.
Il y a aussi un autre exemple sur les données sismologiques, je sais que certains pays sont très peu partageurs et que cela les isole très nettement sur la recherche et les systèmes d’alerte. Il y a un autre exemple avec la mission astrométrique GAIA, 600M€ financés par l’Union Européenne juste pour localiser des milliard d’étoiles : c’est le prix pour alimenter la recherche sur 30 ans, 1€ par Européen.


Jurassi

C’est une bonne question, mais les exemples de Météo France et de l’IGN sont riches d’enseignement. On utilise les données des voisins pour améliorer les prévisions météo, les cartes topo françaises n’étaient plus utilisées… La réciprocité c’est que tout le monde le fait. Les rentrées d’argent quand personne ne vous achète les données ce n’est pas une rentrée d’argent.
Je ne pense pas que les données dont on parle sont “à forte valeur”. La valeur est surtout ajoutée après-coup, dans le traitement des données. Je découvre avec enthousiasme les données Lidar HD de l’IGN mais ce ne sont pas les données elle-mêmes qui sont importantes, ce sont les relevés photogrammétriques que je réalise au drone, et que les nuages de point de l’IGN me permettent de géoréférencer gratuitement (échelle, orientation, altitude…). La données publique n’est pas un business, c’est un initiateur de business.
Il y a aussi un autre exemple sur les données sismologiques, je sais que certains pays sont très peu partageurs et que cela les isole très nettement sur la recherche et les systèmes d’alerte. Il y a un autre exemple avec la mission astrométrique GAIA, 600M€ financés par l’Union Européenne juste pour localiser des milliard d’étoiles : c’est le prix pour alimenter la recherche sur 30 ans, 1€ par Européen.


“Données de fortes valeurs ” c’est extrait du premier paragraphe de l’article.




Le 21 décembre dernier, la Commission européenne a publié un règlement d’exécution établissant une liste d’ensembles de données qualifiées « de forte valeur » que les organismes publics vont devoir partager gratuitement.




Concernant la collaboration entre les états européens je suis pour mais mettre à disposition de tous les données de l’UE si les US, la Russie ou la Chine ne le font pas, je ne pense pas que ça soit une bonne idée.
D’autant que les ressources pour traiter ces données sont le plus souvent hors de l’UE.



Selon moi, mais je peux me tromper, l’UE met à disposition massivement et gratuitement des données que les GAFAM vont pouvoir nous revendre une fois qu’ils les auront valorisées.


“En gros les services publiques européens vont perdre des rentrées d’argent potentielles qui devront sans doute être compensées par nos impôts.”
C’est un choix de croyance économique. Les libéraux vous diront que l’état s’y retrouvera en TVA, créations d’emplois, … tandis que d’autres répondront collectivisation des coûts et privatisation des bénéfices.



pamputt a dit:


[…] Cela conduit par exemple le CEA à utiliser les données météorologiques en provenance des États-Unis, y compris pour le territoire français et européen.




Le pire, c’est que les stations météos du CEA qui transmettent leurs données à MétéoFrance doivent payer pour récupérer ces données dans le cas où (bêtement je l’avoue) elles n’ont pas gardé une copie de leurs envoies à MétéoFrance …