Comment la Cour de cassation a créé son outil de pseudonymisation utilisant le machine learning

Pseudonymiser n'est pas anonymiser

Comment la Cour de cassation a créé son outil de pseudonymisation utilisant le machine learning

Le 10 mai 2023 à 10h16

Commentaires (11)

votre avatar

J’ai du mal à comprendre où se trouve la confidentialité dans un code de pseudonymisation. Les données doivent être confidentielles mais le code ne contient normalement pas les données en dur.



En tout cas, c’est dommage qu’un logiciel développé par de l’argent public ne soit pas publié sous licence libre …

votre avatar

probablement pour ne pas ‘casser’ la méthode de mise en place de pseudo afin de pouvoir déterminer qu’elle juge est plus favorable pour tel type d’infraction.

votre avatar

Ca fait du bien de voir un article qui ne parle pas d’ IA.
Le “machine learning” et le “deep learning”, ca change.



#sarcasm

votre avatar

Mais carrément !



Merci pour l’article super intéressant :8

votre avatar

À noter qu’ils recrutent des dev full stack s’il y a des intéressés https://www.courdecassation.fr/les-offres-d-emplois-et-de-stages/cdd/developpeurdeveloppeuse-full-stack-0

votre avatar

en 2015 la cada avait rendu un avis favorable à la divulgation du code source de calcul d’impots considérant que le code source pouvait (sous certaines conditions) être considéré comme un document administratif.



ça pourrait valoir le coup de faire la demande :)

votre avatar

Dans le monde de la sécurité informatique d’ailleurs, la vraie, l’offuscation est généralement apparentée à de la dissimulation de (potentielle) défaillance : la méthode doit être vérifiable, donc publiée. Seuls les clés/secrets, données en entrée de la méthode vérifiable, sont sensibles.



Je ne comprends pas comment une entité publique peut se prévaloir du secret, qui ne devrait être engagé qu’au seul motif de la protection de personnes, cas par cas. Certainement pas pour des modèles, algorithmes ou logiciels.
J’apparente cela au refus du contrôle de l’entité publique par les citoyens qui sont censés pouvoir l’effectuer.



Depuis toutes ces années, nous devrions pourtant avoir appris que l’opacité, norme du monde économique privé (traitant les personnes/données d’autres), est à la racine d’un grand nombre de dérives, car justement incontrôlé.
Et pourtant…



J’aimerais une prise de conscience commençant par la réalisation qu’à placer l’économie avant la société, la société devient l’économie, et qu’aujourd’hui la société ne sait plus réfléchir qu’avec les réflexes/logiques qu’elle a acquis du monde économique privé.
Nos institutions publiques doivent (re)devenir le fer de lance de la société que l’on souhaite avoir par l’exemplarité.

votre avatar

Je crois que nous ne parlons pas des même types de procès.



La vie privée doit être protégée. Exemple : une victime de viol devrait avoir le droit d’être anonymisée. Cela devrait même être une condition primordiale avant de rendre public ce genre de procès.



Certains noms ne devraient pas être livrés à la vindicte publique ou à la haine en ligne. Autre exemple, dans le cas de coupables de délits mineurs qui ont pleinement purgé leur peine, ils ont droit à une nouvelle chance, et dans ce cas l’anonymat peut aider à se réinsérer.

votre avatar

(quote:2132627:DantonQ-Robespierre)
Certains noms ne devraient pas être livrés à la vindicte publique ou à la haine en ligne.


C’est la grosse différence entre une accusation et une condamnation.



Quand tu écoutes une affaire un peu médiatisée du type “Machin accusé de viol”, “Machin accusé de pédophilie” et j’en passe, il est déjà condamné dans l’opinion publique quand bien même la justice finirait par le blanchir. Quand je vois les réactions excessives du type la personne accusée qui perd son emploi, se fait conspuer, démolir socialement, et même condamnée à l’avance (les soupçons énoncés comme étant avérés, et non au conditionnel) c’est l’inverse de ce qu’est l’Etat de droits de mon point de vue.



Et malheureusement, plus ça va, plus on tend vers ceci (surtout avec les volontés de vouloir supprimer la présomption d’innocence pour certains cas, de l’arbitraire pur). Et dans le cas où la plainte est classée sans suites (quand il y en a une, combien de fois y a-t-il des accusations sans plaintes ?), l’affaire a été oubliée par la mémoire collective. Mais le mal a été fait.

votre avatar

+1, Ce que tu dis me fait fortement penser à l’affaire d’Outreau, avec son monceau d’erreurs et sa chaîne d’incompétence crasse, aux conséquences catastrophiques…



Il faudrait pouvoir anticiper ce genre de dégâts, l’anonymisation des comptes-rendus en ligne est une chose importante, mais bien évidemment ça ne suffit pas : pour mieux respecter la présomption d’innocence, il faudrait pouvoir, durant toute l’enquête et durant le(s) procès, garder secret les noms des présumées victimes, mais aussi ceux des accusés, notamment dans les cas ou certaines accusations s’avèrent fausses, même après appel(s).



Je n’y connais rien en matière juridique, d’autres exprimeraient ça bien mieux que moi, mais pour prolonger le propos, même la presse ne devrait pas être autorisé à dévoiler les noms des personnes privées avant l’annonce du verdict.



Par contre, du côté des personnes occupant des postes à (très) haute responsabilité, des entreprises (telles que Servier, exemple) ou autres entités collectives, je pense que l’anonymat ne servirait à rien et serait même préjudiciable au public.

votre avatar

Merci pour cet article très intéressant.

Comment la Cour de cassation a créé son outil de pseudonymisation utilisant le machine learning

  • La création d'une nouvelle équipe autonome au sein de la Cour

  • L'annotation internalisée aussi

  • Coordination par l'expertise métier

  • Un moteur de pseudonymisation de l'Opendata... en source fermée

Fermer