Publié dans Droit

9

La CNIL va tenter de désanonymiser 850 000 identifiants publicitaires géolocalisés

La CNIL va tenter de désanonymiser 850 000 identifiants publicitaires géolocalisés

Comme annoncé dans son plan stratégique 2022-2024, la CNIL « souhaite rendre visibles les flux de données des applications mobiles », et lance donc une étude basée sur « un jeu de données de géolocalisation obtenu auprès d’un data broker (courtier de données) ».

Elle lui a demandé, « dans les mêmes conditions que n’importe quel potentiel client », à pouvoir accéder à « un échantillon de données correspondant à la France [...] présentées comme anonymisées par le revendeur de données ».

Ce fichier est constitué de données de géolocalisation horodatées associées à près de 5 millions d’identifiants publicitaires de smartphones (Android et iOS) sur une période d'environ une semaine en 2021.

La CNIL « vérifiera si, sur la base de ce jeu de données, elle est en capacité de réidentifier les personnes et, dans l’affirmative, elle informera individuellement celles-ci. »

L'autorité précise que ce travail de réidentification ne concernera que les seuls identifiants publicitaires « pour lesquels au moins dix points de localisation sont présents », soit « environ 850 000 identifiants publicitaires différents ».

Un projet qui devrait durer 15 mois, « à l’issue desquels les données seront supprimées », l'étude devant déboucher sur plusieurs publications sur le site du Laboratoire d'innovation numérique de la CNIL (LINC). 

9

Tiens, en parlant de ça :

Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

652e édition des LIDD : Liens Intelligents Du Dimanche

Et bonne nuit les petits

00:04 Next 2
dessin de Flock

#Flock distribue des mandales tous azimuts

13:40 Flock 11
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #11 et résumé de la semaine

11:47 Next 27
Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

652e édition des LIDD : Liens Intelligents Du Dimanche

Next 2
dessin de Flock

#Flock distribue des mandales tous azimuts

Flock 11
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #11 et résumé de la semaine

Next 27
Carte graphique AMD GeForce

Cartes graphiques : 30 ans d’évolution des GPU

Hard 18

Google lance son opération de communications Gemini pour rivaliser avec OpenAI

IA 6
Ecran bleu de Windows

Linux : le composant systemd se dote d’un écran bleu de la mort

Soft 32
Une petite fille en train d'apprendre à programmer et hacker logiciels et appareils électroniques

Un roman graphique explique les logiciels libres aux enfants

SoftSociété 20
Nouveautés pour Messenger

Meta lance (enfin) le chiffrement de bout en bout de Messenger, entre autres

Socials 5

#LeBrief : cloud européen, OSIRIS-REx a frôlée la catastrophe, CPU AMD Ryzen 8040

Windows en 2024 : beaucoup d’IA, mais pas forcément un « 12 »

Soft 21
Einstein avec des qubits en arrière plan

Informatique quantique, qubits : avez-vous les bases ?

HardScience 9
Notifications iPhone

Surveillance des notifications : un sénateur américain demande la fin du secret

DroitSécu 17

En ligne, les promos foireuses restent d’actualité

DroitWeb 19

#LeBrief : modalité des amendes RGPD, cyberattaque agricole, hallucinations d’Amazon Q, 25 ans d’ISS

Logo Twitch

Citant des « coûts prohibitifs », Twitch quitte la Corée du Sud

ÉcoWeb 29
Formation aux cryptomonnaies par Binance à Pôle Emploi

Binance fait son marketing pendant des formations sur la blockchain destinées aux chômeurs

Éco 10
Consommation électrique du CERN

L’empreinte écologique CERN en 2022 : 1 215 GWh, 184 173 teqCO₂, 3 234 Ml…

Science 6
station électrique pour voitures

Voitures électriques : dans la jungle, terrible jungle, des bornes de recharge publiques

Société 75

#LeBrief : intelligence artificielle à tous les étages, fichier biométrique EURODAC

KDE Plasma 6

KDE Plasma 6 a sa première bêta, le tour des nouveautés

Soft 13
Un homme noir regarde la caméra. Sur son visage, des traits blancs suggèrent un traitement algorithmique.

AI Act et reconnaissance faciale : la France interpelée par 45 eurodéputés

DroitSociété 4
Api

La CNIL préconise l’utilisation des API pour le partage de données personnelles entre organismes

SécuSociété 3
Fouet de l’Arcep avec de la fibre

Orange sanctionnée sur la fibre : l’argumentaire de l’opérateur démonté par l’Arcep

DroitWeb 23
Bombes

Israël – Hamas : comment l’IA intensifie les attaques contre Gaza

IA 22

#LeBrief : bande-annonce GTA VI, guerre électronique, Spotify licencie massivement

Poing Dev

Le poing Dev – Round 7

Next 102
Logo de Gaia-X sour la forme d’un arbre, avec la légende : infrastructure de données en forme de réseau

Gaia-X « vit toujours » et « arrive à des étapes très concrètes »

WebSécu 7

Trois consoles portables en quelques semaines

Hard 37
Une tasse estampillée "Keep calm and carry on teaching"

Cyberrésilience : les compromis (provisoires) du trilogue européen

DroitSécu 3

#LeBrief : fuite de tests ADN 23andMe, le milliard pour Android Messages, il y a 30 ans Hubble voyait clair

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

9

Commentaires (9)


Paupiette5000 Abonné
Le 14/06/2022 à 09h22

Une emission de john oliver (U.S.) où il rend compte, entre autre, de la facilité a déanonymiser ces fameuses données :



https://www.youtube.com/watch?v=wqn3gR1WTcA


deathscythe0666 Abonné
Le 14/06/2022 à 09h51

Paupiette5000 a dit:


Une emission de john oliver (U.S.) où il rend compte, entre autre, de la facilité a déanonymiser ces fameuses données :



https://www.youtube.com/watch?v=wqn3gR1WTcA




Est-ce que c’est sur des données prétraitées suivant les lois US ou CNIL ? Ça change énormément en fonction des juridictions.


Jarodd Abonné
Le 14/06/2022 à 13h33

La CNIL « vérifiera si, sur la base de ce jeu de données, elle est en capacité de réidentifier les personnes et, dans l’affirmative, elle informera individuellement celles-ci. »




Admettons que la CNIL identifie une personne en retrouvant ses nom et prénom : comment va-telle les informer ? Elle envoie un e-mail à [email protected] ? Ça a des chances de fonctionner mais c’est un peu amateur. Et pour les autres, je ne vois pas, l’e-mail n’étant pas forcément présent/en clair dans le jeu de données…


Berbe Abonné
Le 14/06/2022 à 17h51

Adresse IP + horodatage = identité.
D’où le pseudonymat.



Je pense que l’idée est de corréler le trafic à une signature, puis de trouver dans le lot un seul maillon permettant de remonter à du trafic identifié.


Jarodd Abonné
Le 14/06/2022 à 19h01

Berbe

Adresse IP + horodatage = identité. D’où le pseudonymat.

Je pense que l’idée est de corréler le trafic à une signature, puis de trouver dans le lot un seul maillon permettant de remonter à du trafic identifié.

D’accord, mais ça ne répond pas à ma question : comment la CNIL va contacter la personne ?
Elle va demanser aux FAI de fournir les infos pour chaque IP relevée ?


SebGF Abonné
Le 16/06/2022 à 05h18

Jarodd

D’accord, mais ça ne répond pas à ma question : comment la CNIL va contacter la personne ? Elle va demanser aux FAI de fournir les infos pour chaque IP relevée ?

Le tag Réidentification ne renvoie qu’un seul résultat sur le site de la CNIL, à savoir cette annonce. Je pense et j’espère que la méthodo sera détaillée dans une prochaine publication car c’est très intéressant.


grsbdl Abonné
Le 14/06/2022 à 19h22

Je ne pense pas que la CNIL contactera les personnes identifiées.
Si je comprends bien l’opération, c’est une étude qui vise à prouver si oui ou non il est possible de dé-anonymiser des données annoncées comme étant anonymisées. Si la dé-anonymisation est un succès, cela pourrait suggérer de nouvelles mesures d’anonymisation plus solides, ou bien demander à réduire les données collectées. Simples exemples.



C’est important car il n’y a pas que la pub qui est concernée. Exemple : des données judiciaires (comptes rendus de procès, divorces, etc) sont compilées en base de données et anonymisées. Je parle de ça car c’était mon boulot fut un temps, et si l’anonymisation n’est pas aussi robuste qu’annoncée (tip : je n ‘ai jamais eu de retour sur les performances de notre anonymisation, on a juste retiré les noms prénoms et adresses. Automatiquement, donc avec de possibles erreurs. Mais est-ce suffisant ?) alors il y aura du boulot pour ré-anonymiser tout ça.


fdorin Abonné
Le 14/06/2022 à 21h23

Je ne pense pas que la CNIL contactera les personnes identifiées.




C’est pourtant ce qui est dit dans la news :




La CNIL « vérifiera si, sur la base de ce jeu de données, elle est en capacité de réidentifier les personnes et, dans l’affirmative, elle informera individuellement celles-ci. »




L’information pourra être faite par courrier postal. Avec les informations de géolocalisation, il y a de grande chance de réussir à trouver le domicile des personnes concernées. Les contacter sera donc facile.


vaneck Abonné
Le 15/06/2022 à 00h02

bin a prioris le jeux pour la cnil c’est de trouver toutes les infos que les publicitaires pourrait eux meme trouver en analysant les meme données. Le simple fait qu’elle puisse te contacter est donc la preuve de ce qu’elle cherche à prouver