Pour la CADA, les administrations doivent proscrire les scans au format PDF
Yes we scan (ou pas)
Le 17 avril 2018 à 13h23
4 min
Droit
Droit
Aux yeux de la Commission d’accès aux documents administratifs (CADA), les acteurs publics qui fournissent au public des documents scannés au format PDF contreviennent à la loi Numérique de 2016. La CNIL vient d’en faire les frais.
Vous souvenez-vous de la mise en ligne des premières déclarations d’intérêts des parlementaires, en 2014 ? La plupart des documents diffusés par la Haute Autorité pour la transparence étaient en fait des versions scannées de formulaires remplis au stylo, ce qui rendait impossible toute extraction automatisée des informations contenues dans ces fichiers.
Résultat, l’association Regards Citoyens avait dû solliciter l’aide de milliers d’internautes pour ressaisir tous les renseignements alors fournis par les députés et les sénateurs...
Malheureusement pour nous, nous avons goûté au même type de déconvenue il y quelques semaines. Dans le cadre d’une demande « CADA », la CNIL nous a transmis l’une de ses délibérations sous forme de document scanné. Pour en reprendre des extraits, pas d’autre solution que de tout retranscrire. Dommage quand on sait que ce fameux document a bien dû être édité à la base sur un logiciel de traitement de texte !
Les formats non réexploitables sont interdits par la loi Numérique
Notre saisine de la Commission d’accès aux documents administratifs étant déjà enclenchée au moment où nous avons reçu ce PDF (la CNIL a mis près de trois mois à nous l’envoyer), nous avons informé l’institution que nous maintenions notre demande d’avis, sur le fondement du nouvel article L300-4 du Code des relations entre le public et l’administration.
Introduit par la loi Numérique, cet article prévoit en effet que « toute mise à disposition » (communication individuelle, diffusion...) effectuée dans le cadre du droit d’accès aux documents administratifs doit se faire « dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé » – conformément aux principes de l’Open Data.
Après avoir ausculté notre dossier, la CADA a considéré le 5 avril dernier que « la mise en ligne de documents administratifs numérisés sous format PDF image ne permet ni la réutilisation et ni l'exploitation des données fournies par un système de traitement automatisé ».
L’autorité indépendante estime ainsi qu’en cas de demande de documents administratifs, les dispositions de la loi Numérique « font obligation à l'administration d'en fournir une copie en format ouvert, aisément réutilisable et exploitable par un système de traitement automatisé dès lors qu'elle en dispose déjà ou qu'elle est susceptible d'en disposer à l'issue d'une opération de transfert, de conversion ou de reproduction courante ».
Autrement dit, cette obligation prévaut si l’administration a conservé le fichier de traitement de texte original, mais aussi si elle l’a supprimé (à condition qu’une reconversion soit possible).
Un sérieux avertissement à l'attention des administrations
Dans le cas présent, la CNIL a ainsi été enjointe à nous communiquer sa fameuse délibération dans un format compatible avec les standards de l’Open Data. Ce qu’a fait l’institution en diffusant ce jour une nouvelle version de sa délibération sur le site Légifrance.
- Voir la délibération de la CNIL (PDF/en version consultable sur Légifrance)
- Voir l’avis de la CADA (PDF)
Cet avis de la CADA n’a pas de valeur contraignante pour les administrations. Il devrait néanmoins servir d’aiguillon, et pourrait permettre à certains demandeurs d’obtenir plus facilement des documents dans un format ouvert et aisément réutilisable. On se souviendra en ce sens de la première « ouverture » de l'algorithme d'Admission Post-Bac, sous forme de scan, quelques jours seulement après la promulgation de la loi Numérique...
Le PDF déjà déconseillé par Etalab
La mission Etalab, qui accompagne les administrations dans leur marche vers l’Open Data, demande de longue date aux acteurs publics d’ouvrir leurs données « dans des formats ouverts (Exemple : CSV, JSON, XML, RDF...) qui permettent la réutilisation sans restriction d’accès ni de mise en œuvre, par opposition à un format fermé ou propriétaire ». Dans l’hypothèse où cela ne serait pas possible, l’institution recommande de « rechercher autant que possible le véritable format d’origine, et pas, par exemple, le PDF, développé pour le confort de lecture, qui circule usuellement ».
Pour la CADA, les administrations doivent proscrire les scans au format PDF
-
Les formats non réexploitables sont interdits par la loi Numérique
-
Un sérieux avertissement à l'attention des administrations
-
Le PDF déjà déconseillé par Etalab
Commentaires (60)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 17/04/2018 à 13h28
Je vous aime trop NextINpact ! J’adore ! Bravo !
Le 17/04/2018 à 13h38
NextInpact, le meilleur client de la CADA ^^
Et le meilleur média sur le numérique sous tous ses aspects !
Le 17/04/2018 à 13h40
En soit, c’est logique de donner un pdf, un fichier modifiable c’est trop simple à falsifier.
Le pdf a l’avantage de figer le document à un état donné. Le minimum est d’enregistrer le fichier concerné en pdf en s’assurant que les données sont sélectionnables.
Le 17/04/2018 à 13h44
L’idée de l’open data n’est pas de servir de preuve mais de permettre l’utilisation des données.
Donc non ce n’est pas trop normal.
(De plus si la source reste en ligne tout un chacun peut vérifier si les données ont été falsifiées, quel que soit le format du document.)
Le 17/04/2018 à 13h45
Non. Un PDF semble être non modifiable pour ceux qui n’y connaissent pas grand chose (y compris bon nombre de décideurs, malheureusement), mais les sécurités qu’il offre sont illusoires et ne garantissent pas contre les modifications.
Le 17/04/2018 à 13h49
Le 17/04/2018 à 13h49
Ben, pour la lisibilité vaut quand même un pdfa (pdf + texte) que du json ou du xml non?
Le 17/04/2018 à 13h56
génial ! Un bon pas en avant.
Le 17/04/2018 à 14h01
Ils ne fonctionnent pas les logiciels d’OCR ?
Le 17/04/2018 à 14h03
Je propose que NXI demande à la CADA la transmission de son logiciel de traitement des demandes CADA.
Je suis sûr que ça commence par :
<code>
If (demandeur eq ‘Nextimpact’) {
# répondre oui sans étudier, c’est des emmerdeurs, leur demande est toujours justifiée et on finit par répondre oui
return 1;
}
# traiter normalement, est-ce justifié ou pas.
</code>
" />
Le 17/04/2018 à 14h03
mmm… le sous-titre… " /> (2 pts perdus parce qu’elle est utilisée un peu à toutes les sauces)
Le 17/04/2018 à 14h24
On est en train de bannir le stylo, c’est pas assez traçable/flicable. " />
(avec la bénédiction de NXI entre autres)
Quels gens sauront encore écrire demain ? " />
Le 17/04/2018 à 14h32
Acrobat intègre nativement un OCR pour traiter les PDF image. Ça marche plutôt bien.
Reste qu’Acrobat (par le reader) est payant et n’est donc pas accessible à tous.
Sur le fond, un PDF texte natif c’est quand même beaucoup plus pratique.
Le 17/04/2018 à 14h45
Ah force de jouer aux cons, vous allez finir par gagner.
L’administration dira simplement qu’elle n’a plus le doc original et comme elle aura interdiction de fournir un PDF, il n’y aura aucun doc mis à disposition " />
Le 17/04/2018 à 14h47
Le 17/04/2018 à 14h53
Le 17/04/2018 à 15h15
T’aurais des exemples de ses meilleures fake news ?
Le 17/04/2018 à 15h18
Le 17/04/2018 à 15h20
Peut-on faire une demande CADA pour recevoir le magazine Next INpacthttps://fr.ulule.com/next-inpact/ dans un standard ouvert permettant la réutilisation par un système de traitement automatisé ? " />
Le 17/04/2018 à 15h22
Le 17/04/2018 à 15h46
Le soucis étant le côté scan image. Mais un pdf ouvert, sans sécurité illusoire, ou l’on peut copier le texte, ça ne pose pas de soucis. Mais les administrations fournissent trop souvent les docs imprimés puis rescannes à cause d’un tampon ou d’une signature…’
Le 17/04/2018 à 15h54
Google
Le 17/04/2018 à 15h56
C’est le fait d’avoir imprimé le pdf puis de l’avoir scané ce qui “écrase” son contenu au copier/coller (force à faire un OCR sur tout le contenu) qui est reproché.
Un pdf ou le texte est copiable sera valide il me semble.
Le 17/04/2018 à 15h58
Ah RAHHHHHH LOVELLLLYYY " />" />
Le 17/04/2018 à 16h05
Le 17/04/2018 à 16h09
Surtout que je vois pas l’intérêt de s’emmerder avec ça …
PAPIER (chiant)
Chercher le document papier à envoyer
Aller à la photocopieuse
Déposer la liasse dans le chargeur (je l’espère en tout cas …)
Indiquer la procédure de copie (noir & blanc, recto/verso, …)
Indiquer où envoyer la copie
Retourner à son poste
Récupérer la copie
Ouvrir un nouveau message et envoyer
NUMERIQUE (bien)
Chercher le document numérique à envoyer
Ouvrir un nouveau message et envoyer
Après, y’a le combo ultime, qui expliquerait pourquoi c’est toujours des PDF :
PAPIER (MEGA-chiant)
Chercher le document numérique à envoyer
L’imprimer
Aller à la photocopieuse
Récupérer la liasse
Mettre la liasse dans le chargeur (je l’espère en tout cas …)
Indiquer la procédure de copie (noir & blanc, recto/verso, …)
Indiquer où envoyer la copie
Retourner à son poste
Récupérer la copie
Ouvrir un nouveau message et envoyer
" />
Le 17/04/2018 à 16h10
« font obligation à l’administration d’en fournir une copie en format ouvert, aisément réutilisable et exploitable par un système de traitement automatisé dès lors qu’elle en dispose déjà ou qu’elle est susceptible d’en disposer à l’issue d’une opération de transfert, de conversion ou de reproduction courante ».
Donc, si elle ne dispose que du document papier, elle a toujours le droit de faire un scan.
Le 17/04/2018 à 16h15
Bon, je retiens pour mon boulot.
De toutes façons, le secrétariat, c’est moi qui le fait, et j’ai les docs originaux au format Open Document (ou Microsoft pour les plus anciens).
Comme ça, si je veux entuber quelqu’un je peux faire un duplicata en enlevant/rajoutant ce que je veux !
" />" />" />" />" />
Le 17/04/2018 à 16h18
Le 17/04/2018 à 17h26
Travaillant dans une grande entreprise qui construit des avions de combat, le seul moyen de “signer” un document …… tu l’imprimes, tu le signes au stylo, tu scan, tu insères l’image dans le word, tu le transformes en PDF.
Refus des signatures numériques car il est interdit de rajouter des certificats roots dans le système n’appartenant pas au groupe (pour les sous-traitant ou prestataire).
Résultat, tu scan une fois les signature et tu fais tu C/C sur les doc…..super sécurisé :‘(
Le 17/04/2018 à 17h26
Dommage quand on sait que ce fameux document a bien dû être édité à la base sur un logiciel de traitement de texte !
Vous êtes bien péremptoires. Qui vous dit qu’il n’a pas été créé sous Paint ?
Le 17/04/2018 à 17h51
Le 17/04/2018 à 18h08
JE… Non rien.
Surtout qu’avec PDF Creator par exemple, tu peux faire des images au lieu de texte.
Mais j’imagine que les gens qui imprime, puis scan des documents numériques pour les envoyer, n’ont pas connaissance d’un logiciel comme PDFCreator et ce qu’on peut faire avec.
Le 17/04/2018 à 18h43
Pas par défaut. J’en modifie plein d’ailleurs de cette manière.
Et quand bien même : tu ouvres le PDF, tu l’imprimes sur une imprimante PDF, et zou, tu le modifies.
Le 17/04/2018 à 18h45
Prenez PDX-Xchange Editor, et créez un tampon avec la signature. Plus besoin de scanner quoi que ce soit.
Le 17/04/2018 à 18h48
Personne n’a entendu parler de signature électronique ou bien ? " />
Tout document est falsifiable, mais au moins la signature electronique permet de valider la source et l’original du document en question…
Le 17/04/2018 à 20h39
Si un jour tu peux te visiter un labo de recherche (type CNRS), tu pourras voir des gens à qui on demande :
" />
non ceci n’est pas une blague " />
Le 17/04/2018 à 20h51
Le 17/04/2018 à 22h22
Le 18/04/2018 à 02h31
Je crois qu’il faut surtout chercher la raison des PDF images dans les logiciels mis en œuvre par les administrations pour l’archivage légale des documents qui font du stockage image (Généralement quelques peu bugués…).
Le 18/04/2018 à 02h38
Les certificats coûtent cher et demandent du temps pour être délivrés car les administrations ayant été refroidit par les failles de la PKI de l’Administration Centrale (gérée par l’ANSSI à l’origine) passe maintenant par des fournisseurs pour leur certificats publique.
Le 18/04/2018 à 06h50
La on veut quelque chose d’exploitablr automatiquement. Pour la lisibilité, il sera toujours plus facile de transformer ton JSON/XML/markdown dans un format lisible que l’inverse
Le 18/04/2018 à 07h13
Ce serait bien d’avoir dans ce cas un nouveau format, aussi portable, standard et léger que le PDF, avec un accès complet au contenu comme les formats Open Document.
Le 18/04/2018 à 07h53
Doublon
Le 18/04/2018 à 07h55
Libreoffice te permet de créer des PDF hybrides : lisible dans un lecteur PDF et éditable dans Libreoffice grâce à la norme OpenDocument. Cette idée a été reprise par MS Office sauf que le PDF hybride n’est pas compatible avec celui de LibreOffice.
De manière générale, il me semble que la norme PDF permet de lier un PDF “classique” avec un format XML. L’intéret est de structurer la donnée. Ainsi tu as un PDF de factures de téléphone mais que tu peux donner ce document à Clouzy Cloud pour qu’il suive ta consomation ou des dépenses bancaires.
Certains pays européens demandent ce type de PDF il me semble.
Le 18/04/2018 à 07h57
Nice. Je ne connaissais pas.
Reste que je me questionne sur la licence du PDF. Bon je vais regarder à l’occasion.
Le 18/04/2018 à 08h01
Ca ne change rien au fond du problème de certains commentaires précédant (et qui n’ont rien compris à la news au passage " />)
Si la France n’a pas les moyen de ce payer des certificats pour les documents officiels qu’elle émet, on est pas dans la merde… Je ne dis pas qu’il faut un certificat par employé, mais au moins par entité ca serait pas mal.
Le 18/04/2018 à 08h15
Le format est ouvert par Adobe et il n’y a pas de charge financière sur son utilisation. Il existe des bibliothèques libres pour manipuler le PDF, par exemple iText sous une licence GPL. Il reste que Adobe reste le chef du format en terme d’évolution.
Le 18/04/2018 à 08h21
Dans ma boîte, PDF Creator est installé par défaut sur tous les postes et apparaît dans les listes d’imprimante. J’ai envie de dire que si les utilisateurs se retrouvent à faire ce genre de gymnastique, c’est que le service IT n’a pas fait son boulot (outils et formations).
Le 18/04/2018 à 09h05
Si, mais - de mémoire - le meilleur taux de réussite est à 99 % (si le document est bien lisible, et le logiciel très performant). Une page de texte c’est environ 1 000 signes : ça fait au mieux 10 erreurs/page. La moyenne est à 96 % (toujours de mémoire), ça fait donc 40 erreurs/page.
Sur une page, ça fait un peu de taf. Sur 10, ça devient insupportable.
C’est du temps de correction et vérification qu’il faut prévoir dans l’organisation (d’une administration publique comme dans une entreprise privée). Bien évidemment, ce temps n’est jamais donné, on a tous des exemples au boulot de prise de décision court-termiste insensée qui se révèle chronophage sur le long terme…
Le 18/04/2018 à 12h01
En ce moment 80% des communications officielles concernant notre dame des landes?
100% de celles concernant l’intervention en Syrie?
Perso sans chercher j’en trouve déjà beaucoup trop " />
Le 18/04/2018 à 12h04
En l’occurence un PDF est également falsifiable.
Et concernant les déclarations d’intérêt des parlementaires attendu que ce sont des déclarations elles peuvent être fausses de base…
Dans ce cas précis l’intérêt étant de comparer les déclarations et éventuellement des les croiser avec des données géographiques, socio économiques etc. le format PDF n’a strictement aucune pertinence.
Le 18/04/2018 à 12h10
Après l’archivage papier a tout de même certaines qualités que n’a pas l’archivage électronique…
Par contre ne pas faire des PDF formulaires heu… c’est pas parce qu’on fait des recherches top niveau qu’on a des secrétaires top niveau? " />
Le 18/04/2018 à 12h12
Ca dépend où dans l’administration il ne faut pas exagérer, la plupart des administrations ont des intranets/extranets avec des formulaires en ligne quand même. Y compris pour les paiements.
Après il y aura toujours LA procédure non dématérialisée parce que tout le monde s’en fout ou que le coût de déploiement d’un formulaire est démesuré par rapport au fait de ne rien changer…
Le 18/04/2018 à 12h14
Là c’est probablement parce que ça sort d’une GED.
Le 18/04/2018 à 12h16
Le 18/04/2018 à 12h27
Là c’est pareil, ça dépend où, pas mal d’intranets sont très bien faits pour gérer les trucs internes genre congés, formations, déplacements, réservations de ressources etc.
Mais il est certains que la combo secrétariats pas toujours capables de gérer du doc électronique + coût des solutions pour gérer du courrier/parapheur/archivage + gestion des certificats à renouveler tous les deux ou trois ans et pertes éventuelles des clés par les agents + emmerdements techniques pour avoir des certificats qui marchent sur les postes -java mon amuuuur " />- laisse la plupart des petites collectivités sur le carreau et les procédures qui ne relèvent pas de signatures “RGS” de côté.
Possiblement si un jour les signatures sont gérables de manières centralisée via des mécanismes type AD/SSO avec de jolies interfaces d’administration et/ou des dispositifs de clés techniquement moins rugueux (genre les Yubikey évoquées avant hier?) ou alors via des APIs France connect (rêvons) ça se généralisera totalement même aux échanges les plus triviaux…
Le 18/04/2018 à 17h37
Malheureusement c’est souvent les premiers postes sur lesquels on rogne faute de crédit (dans mon labo no s’est retrouvé avec 2 secrétaires pour 200 personnes : bilan il a fallu 5 mois pour cloturer les comptes de l’année dernière et permettre de passer les commandes sur les comptes de cette année). Du coup le plus souvent on continue d’une certaine manière parce que le service n’a pas le temps de mettre en place autre chose.
Le 22/04/2018 à 14h51
On se demandais à quoi servait NextInpact … la démocratie doit être défendu pied à pied chaque jour … et quelques uns le font avec un certain brio. Merci.
Le 22/04/2018 à 15h04
La démocratie ? Rien que ça ?
Il y a des jours où je préférerais que l’on défende l’orthographe !