Fingerprinting : Mozilla pointe les limites du Privacy Budget proposé par Google

Fingerprinting : Mozilla pointe les limites du Privacy Budget proposé par Google

Fingerprinting : Mozilla pointe les limites du Privacy Budget proposé par Google

Le Privacy Budget est une idée lancée par Google pour lutter contre le fingerprinting. Au centre du mécanisme idéalisé, une valeur générale à ne pas dépasser dans les informations réclamées par un site (processeur, plateforme, navigateur, mémoire, etc.).

Avec cette idée, un site serait donc limité dans la quantité de précisions qu’un site peut relever, limitant de fait le fingerprinting à cause de valeurs trop générales. Selon Mozilla toutefois, même si l’intention est bonne, la pratique risque d’être complexe.

La fondation relève surtout quatre points problématiques :

  • Une estimation difficile du nombre d’informations révélées par un seul signal, d’autant que certains signaux sont plus représentatifs que d’autres. Par exemple, utiliser Firefox Nighlty renvoie immédiatement à un très petit groupe d’utilisateurs.
  • Même si une valeur plafond est choisie, il serait difficile de savoir quand un lot de requêtes la dépasse. Selon Mozilla, les requêtes ne sont pas indépendantes et il n’y a pas de méthode fiable pour les additionner.
  • L’application du mécanisme entrainerait probablement de nombreux problèmes pour les sites, car une fois le budget atteint, une partie des appels aux API seraient bloqués, entrainant des erreurs dans le fonctionnement.
  • Le mécanisme pourrait potentiellement servir lui-même de signal pour le fingerprinting, en épuisant le budget via une série spécifique de requêtes et en testant son comportement.

Pour Mozilla, la solution n’est pas dans le Privacy Budget de Google. La fondation recommande une limitation stricte des informations exposées par les nouvelles API et de réduire graduellement celles fournies par les API actuelles.

Commentaires (23)


Pour mémoire, le fingerprinting est considéré par la CNIL depuis 2020 (délibération n°2020-091 “lignes directrices”) comme un “traceur” (au même titre que les cookies) et - de ce fait - soumis par principe à une demande de consentement de la part du possesseur du terminal…



Oui, je sais ce que beaucoup d’entre vous vous écrire en réaction à ce rappel légal…



(quote:1904393:[Ledieu-Avocats])
Pour mémoire, le fingerprinting est considéré par la CNIL depuis 2020 (délibération n°2020-091 “lignes directrices”) comme un “traceur” (au même titre que les cookies) et - de ce fait - soumis par principe à une demande de consentement de la part du possesseur du terminal…



Oui, je sais ce que beaucoup d’entre vous vous écrire en réaction à ce rappel légal…




Oui et j’ai du mal a comprendre pourquoi les navigateurs sont si généreux en info via api.
L’os, browser, l’espace de stockage et la mémoire c’est 4 info a elle seul permettent un fingerprint unique.


Il n’y aurait donc pas un greffon FF pour faire varier certains éléments, ou les fixer à null via about config ?



luxian a dit:


Il n’y aurait donc pas un greffon FF pour faire varier certains éléments, ou les fixer à null via about config ?




Faire ca te rend encore plus unique si tous les browser le fond pas en meme temps.



SIaelrod a dit:


Oui et j’ai du mal a comprendre pourquoi les navigateurs sont si généreux en info via api. L’os, browser, l’espace de stockage et la mémoire c’est 4 info a elle seul permettent un fingerprint unique.




Parce que certaines informations peuvent être utiles pour adapter le contenu d’un site, donc le navigateur les diffusent.
Par exemple, la dimension de la fenêtre est transmise pour que le site puisse adapter l’affichage. Mais si tu n’es pas en plein écran, elle est quand même assez unique (je viens de faire le test à l’instant sur AmIUnique : 2% des utilisateurs sur les 30 derniers jours ont la même taille de fenêtre. Et techniquement, 0,68% ont les mêmes capacités en WebGL et 0,30% les mêmes polices disponibles. Sachant que je suis sur Firefox qui a lui-même une part de marché assez faible (snif).



Ce qui serait peut-être pertinent, c’est de diminuer l’unicité de certaines données en la diffusant de manière plus floue, quitte à compléter effectivement par cette notion de “budget” (qui reste une grosse galère à gérer). Par exemple, la demande en mémoire pour donner des tranches plutôt qu’une valeur exacte.


C’est dans la même lignée que cette info :
https://www.nextinpact.com/lebrief/48163/chrome-94-peut-indiquer-aux-applications-web-quand-utilisateur-est-absent



Réduire ce que permet les API afin d’éviter le traçage, c’est un peu triste, mais malheureusement, il n’y a pas le choix face à certaines grosses boites (Google, Criteo & co).



Et Firefox possède une option pour augmenter la résistance au fingerprinting :
https://support.mozilla.org/en-US/kb/firefox-protection-against-fingerprinting



(reply:1904479:MisterDams)Pour avoir testé, AmIUnique te dira que ton empreinte digitale est unique quelque soit le navigateur que tu utilises, même avec Tor ou Brave qui inclut par défaut une randomisation de l’empreinte digitale, ce n’est pas une source auquel je ferais confiance, de toute manière, les sites de test d’empreintes digitales ne peuvent pas tester l’empreinte digitale du navigateur de manière fiable, ces sites déterminent le caractère unique de ton empreinte digitale en se basant sur leur propre base d’utilisateurs, ça ne tient pas compte de la majorité des utilisateurs réels, fournissant ainsi des statistiques inexactes et n’est pas un moyen viable de déterminer comment tu t’en sort dans le monde réel.



https://addons.mozilla.org/fr/firefox/addon/chameleon-ext/



Pour spoofer une empreinte navigateur random



Et



https://addons.mozilla.org/fr/firefox/addon/adnauseam/



qui en gros «clique» sur toutes les pubs pour flooder les annonceurs de données non pertinentes.



La fondation recommande une limitation stricte des informations exposées par les nouvelles API et de réduire graduellement celles fournies par les API actuelles.




Ca me semble illusoire de vouloir restreindre les possibilités de javascript ou du browser alors que le duo javascript+browser devient LA plateforme d’exécution standard des applications.



QTrEIX a dit:


ces sites déterminent le caractère unique de ton empreinte digitale en se basant sur leur propre base d’utilisateurs, ça ne tient pas compte de la majorité des utilisateurs réels, fournissant ainsi des statistiques inexactes




Pour moi c’est justement ce qui lui donne sa pertinence. On se parle pas d’Amazon ou de Google qui utilise ça, ils ont d’autres solutions pour ça. Plus le trafic du site est faible et plus l’empreinte peut-être “floue” et juste.



Mais rien qu’en voyant que “la liste intégrale des polices installées” est consultable en JS, on voit quand même que c’est loin d’être difficile de faire une distinction en recoupant 3 ou 4 infos bien choisies…



MisterDams a dit:


Pour moi c’est justement ce qui lui donne sa pertinence.




Non et je ne vois pas en quoi ça lui donne de la pertinence, plus d’infos sur pourquoi il est inutile de s’arrêter aux résultats des sites de tests d’empreinte digitale.




MisterDams a dit:


On se parle pas d’Amazon ou de Google qui utilise ça




Oui, les grandes entreprises technologiques comme Google et Amazon peuvent utiliser beaucoup de choses pour nous suivre.




MisterDams a dit:


Plus le trafic du site est faible et plus l’empreinte peut-être “floue” et juste.




Je ne sais pas d’où vient cette affirmation et je ne suis même pas sûr de la comprendre, je ne vois pas la corrélation entre un trafic faible et la prise de l’empreinte digitale.




MisterDams a dit:


Mais rien qu’en voyant que “la liste intégrale des polices installées” est consultable en JS, on voit quand même que c’est loin d’être difficile de faire une distinction en recoupant 3 ou 4 infos bien choisies…




Yep.



MisterDams a dit:


Parce que certaines informations peuvent être utiles pour adapter le contenu d’un site, donc le navigateur les diffusent. Par exemple, la dimension de la fenêtre est transmise pour que le site puisse adapter l’affichage. Mais si tu n’es pas en plein écran, elle est quand même assez unique (je viens de faire le test à l’instant sur AmIUnique : 2% des utilisateurs sur les 30 derniers jours ont la même taille de fenêtre. Et techniquement, 0,68% ont les mêmes capacités en WebGL et 0,30% les mêmes polices disponibles. Sachant que je suis sur Firefox qui a lui-même une part de marché assez faible (snif).



Ce qui serait peut-être pertinent, c’est de diminuer l’unicité de certaines données en la diffusant de manière plus floue, quitte à compléter effectivement par cette notion de “budget” (qui reste une grosse galère à gérer). Par exemple, la demande en mémoire pour donner des tranches plutôt qu’une valeur exacte.




oui enfin je voit pas en quoi l’espace de stockage disponible ou d’autre info système inutile au site, si t’a pas assez d’espace ton os râlera bien avant que ca “ennuie” le site, donc c’est leur donnée beaucoup d’info, car je suis a peu près sur que t’a pas deux machine dans un pays qui a au bit près le meme espace libre…



Ce qui rend l’info extrêmement utile au fingerprint et totalement inutile pour l’utilisateur qui a déjà l’info via l’os.



Et c’est que 1 exemple



(reply:1904537:marba) Merci pour les extensions, elles sont sympa et sous licence libre. En revanche, je ne comprends pas cette fâcheuse tendance de la plupart des extensions Firefox à avoir comme permission :



Accéder à vos données pour tous les sites web




J’aurais aimé qu’ils le proposent sans.



(reply:1904654:prog-amateur) Parce que c’est ainsi que les extensions de navigateurs peuvent fonctionner et appliquer leurs magie, c’est une question de confiance, donc mieux vaut ne pas utiliser d’extensions lambdas sans se renseigner avant, sur Firefox, il est préférable de se contenter des extensions vérifiées.




Les extensions style canvas blocker, randomisation de l’user-agent etc font l’inverse de ce qu’elles promettent, elles participent à rendre ton empreinte digitale plus unique, plus tu utilises d’add-ons et plus tu te démarques, la protection doit s’opérer par défaut sur le navigateur au niveau architectural et non pas via une extension.



processeur, plateforme, navigateur, mémoire




c’est totalement inutile à n’importe quel site.




MisterDams a dit:


Par exemple, la dimension de la fenêtre est transmise pour que le site puisse adapter l’affichage




Typiquement l’info inutile, en enlevant cette API les sites seraient un peu mieux codés (en utilisant les unités em ou rem par ex au lieu de javascript foireux)
En css tu peux dire qu’une partie s’applique à partir de telle largeur par ex : c’est suffisant il n’y a pas besoin de connaitre au px près la taille de la fenêtre. Pour positionner un truc en bas tu peux maintenant faire des calculs en CSS directement :



top: calc(100% - 20px) 


QTrEIX a dit:


Je ne sais pas d’où vient cette affirmation et je ne suis même pas sûr de la comprendre, je ne vois pas la corrélation entre un trafic faible et la prise de l’empreinte digitale.




C’est simplement que si tu augmentes le nombre de visites, le risque d’avoir un “faux jumeau” est élevé, donc tu dois multiplier les critères pour vérifier.



Exemple :
Tu veux détecter un accès depuis Firefox parmi tes 100 visiteurs de ton site e-commerce, tu as limité la reconnaissance possible à 3,7 visiteurs. Avec la seule résolution d’écran, tu dois pouvoir affiner pour savoir exactement qui il est quand il revient.
Du coup, tu peux déjà envisager du retargeting sur les produits consultés, ou une fluctuation des prix grâce à ces critères.
Sur 100 000 visiteurs utilisant Firefox, t’es à 3 680 possibilités, la résolution permettra d’affiner un peu, mais il faudra certainement un critère de plus pour être sûr de toi…



Après, si tu veux faire cette identification entre deux services distincts, évidemment il faudra bien plus de critères pour éviter les doublons. J’imagine aussi que dans les flottes d’entreprise, l’uniformisation du parc doit rendre plus difficile d’identifier un poste spécifique sur ces seuls critères…



(reply:1904654:prog-amateur) MAJ de mon précédant commentaire : Pour comparer, prenons en exemple les applications sur smartphones prévuent pour optimiser la consommation de la batterie, le problème est que l’application en question consomme elle-même de la batterie, donc au final, ça ne fais rien d’autre qu’en consommer encore plus.



(reply:1904694:fofo9012) Je suis d’accord, recueillir des informatons sur la mémoire, le navigateur, le CPU etc me parait juste bon à faire des stastistiques pour tu sais bien, “t’offrir une meilleur expérience utilisateur” et “améliorer la qualité du service”.



(reply:1904703:MisterDams) Ok merci pour ses informations, je m’y pencherai un peu à l’occasion pour mieux comprendre :chinois:



Merci pour tes com’, si le fingerprinting prend également en compte le nombre (voire le type) d’extensions, là c’est chaud, et effectivement, mieux vaut les limiter.




(reply:1904703:MisterDams) merci aussi pour l”exemple, on dirait que t’as fait ça toute ta vie professionnelle ^^




(reply:1904790:prog-amateur) De rien et pour allez plus loin, même en désactivant Javascript et en empechant l’utilisation de vecteurs importants pour le fingerprinting, cela n’empêche pas entièremernt cette pratique, la prise d’empreintes digitales peut être réalisé uniquement avec HTLM et CSS, l’utilisation des règles @media pour déterminer la définition de ton navigateur en est un exemple. pour pousser encore plus le vice, elle peut même se faire rien qu’en fonction de la position de ta souris (et autres éléments biométriques de comportements) sur l’écran et de ton fuseau horaire.




(reply:1904818:QTrEIX) la position de la souris… ça fait flipper quand même !




(reply:1904839:prog-amateur) Certains navigateurs comme Tor, Bromite et Brave ont une forte protection et randomisent l’empreinte digitale pour chaques sites web visités ou après chaques ré-ouverture du navigateur, mais ce n’est pas l’alpha et l’oméga non plus, rien n’est parfait en informatique, bien sûr, il convient de noter que certaines données comme la consommation de la RAM et la défintion de l’écran ne permet pas t’identifier un utilisateur de manière unique (ils n’ont pas besoin de ton nom et de ton adresse), c’est la combinaison de tout cela qui le permet.



Merci pour vos retour ! “Dis-moi où tu surf, je te dirais qui tu es ^^”



(quote:1904790:prog-amateur)
merci aussi pour l”exemple, on dirait que t’as fait ça toute ta vie professionnelle ^^




OK j’ai peut être laissé un bout de fingerprint avec 3 ans de data marketing :D



Mais les probabilités sont toujours plus explicites dans des cas concrets (genre avoir conscience que t’as autant de chances que les chiffres de ton choix sortent au prochain tirage du Loto que d’avoir exactement le même tirage que la semaine précédente :eeek2: )


Fermer