Alertes sur les sites GenAI : pourquoi notre extension affiche-t-elle des faux positifs ?

Ça Bloom ?

Illustration : Flock

Sébastien Gavois

Le 08 avril 2025 à 10h50

Next utilise un filtre de Bloom pour afficher des alertes sur les médias utilisant de l’IA générative pour tout ou partie de ses articles. Comment fonctionne notre algorithme de détection et pourquoi y a-t-il des faux positifs ? On vous explique.

Alertes sur les sites GenAI : pourquoi notre extension affiche-t-elle des faux positifs ?

Ça Bloom ?

Illustration : Flock

Sébastien Gavois

Le 08 avril 2025 à 10h50

5 min

Notre extension Chrome et Firefox pour alerter les visiteurs des sites d’information utilisant l’IA générative pour tout ou partie de leurs articles utilise une liste de plus de 3 000 noms de domaines identifiés « à la main et de visu » (sans recours à des outils de vérification algorithmique et automatisé) par notre journaliste Jean-Marc Manach. Le code source est disponible sur GitHub.

Next

Alertes GenAI, Domaines Tiers Contactés : le code source de nos extensions est sur GitHub

Next

Mardi 18 mars 2025 à 17h30 18/03/2025 17h30

15

Cachez cette liste que je ne saurais voir…

Nous ne souhaitons pas diffuser publiquement la liste des domaines (et des entreprises), pour plusieurs raisons que nous avons déjà expliquées dès la première partie de notre enquête :

« Nous ne voulons pas, d’une part, que cette base de données puisse aider ceux qui voudraient améliorer leurs générateurs d’articles automatisés, et qui se targuent de ne pas être reconnus comme GenAI (nous y reviendrons). Nous ne voulons pas non plus faire de « name and shame » et mettre sur le même plan des auto-entrepreneurs SEO ayant créé quelques sites de façon opportuniste et les entreprises (y compris individuelles) en ayant créé plusieurs dizaines ».

Next

Notre extension Chrome et Firefox vous alerte sur 3 000 médias générés par IA et des cyberarnaques

Next

Jeudi 06 mars 2025 à 10h47 06/03/2025 10h47

47

Nous avons donc utilisé une méthode d’obfuscation pour masquer la liste. Un développeur de moji – Hasnaine – nous a grandement épaulés pour cette tâche. Il a développé le code de cette partie de l’extension, ainsi qu’un script pour transformer notre liste de manière irréversible. La méthode utilise un filtre de Bloom, mais qu’est-ce que c’est et qu’est-ce que cela implique ?

Comme l’explique Bioinfo-fr, « le filtre de Bloom ne vous permet pas vraiment de “stocker” des données à proprement parler ; le filtre est là pour vous permettre de tester l’appartenance d’un élément à un ensemble de données ». Parfait, c’est exactement ce que l’on cherche.

Contre les faux positifs, la liste blanche

Un filtre de Bloom est une structure probabiliste. Dans la pratique, c’est un tableau de n bits qui est initialement à 0 sur toutes ses entrées. « Nous allons utiliser plusieurs fonctions de hachage indépendantes qui retourneront une suite de bits correspondant à des adresses mémoires : au lieu d’effectivement stocker les données, on ne stockera ainsi que quelques bits d’information », explique Bioinfo-fr.

L’exemple parle du stockage de séquences ADN (logique pour un site dédié à la biologie), mais cela fonctionne à peu près pour n’importe quoi. L’algorithme a deux résultats possibles lors d’un test : l’élément est probablement dans la liste, ou il n’est pas présent (cette fois-ci avec certitude), comme le résume Wikipédia :

« Plus précisément, un test d’appartenance renvoie soit « peut-être dans l’ensemble » ou « assurément pas dans l’ensemble ». Dit autrement, il n’y a jamais de faux négatif mais il peut y avoir des faux positifs. »

Il a donc l’avantage de ne pas produire de faux négatif (un site qui serait dans la liste, mais non identifié comme tel). Toutefois, il a l’inconvénient de générer des faux positifs. Et plus la liste d’éléments de base est grande, plus le risque de faux positifs augmente. Raison pour laquelle certains sites sont parfois identifiés à tort par notre extension.

Un faux positif arrive donc lorsque l‘algorithme identifie à tort un site comme étant « peut-être » dans notre liste, quand bien même il n’y figure pourtant pas. Pour contrer cette problématique inhérente au fonctionnement du filtre de Bloom, nous avons mis en place depuis quasiment le début une liste blanche d’URL à ne pas identifier.

Nous tâchons d’ajouter au plus vite les éléments dans notre liste pour corriger les faux positifs quand ils nous sont signalés. Depuis peu, l’application télécharge sa liste blanche sur les serveurs de Next, ce qui évite d’avoir à la pousser manuellement à chaque nouvelle mise à jour (encore à déployer sur Chrome, ça arrive).

Notre algorithme, côté technique

Pour en revenir à notre filtre de Bloom, nous vous donnons les principaux paramètres de notre formule pour calculer la taille de notre tableau (en bits), à partir du nombre d’éléments et du taux de faux positif spécifié. Attention, plus le taux est faible, plus la taille du tableau est importante, il faut donc choisir avec précaution ce paramètre.

const expectedElements = strings.length;
const falsePositiveRate = 0.00000001; 
const size = Math.ceil(-(expectedElements * Math.log(falsePositiveRate)) / (Math.log(2) ** 2));
const numHashes = Math.max(1, Math.ceil((size / expectedElements) * Math.log(2)));

Une fois la taille de notre tableau obtenu, nous calculons le nombre de hachages pour notre filtre de Bloom.

L’influence de la précision

Voici quelques résultats en fonction de la précision (falsePositiveRate) demandée sur les faux positifs (il s’agit ici de quelques exemples, d’autres combinaisons sont possibles) :

1 % (0.01):

Taille : 32 772 bits
Nombre de fonctions de hash : 7

0,01 % (0.0001) :

Taille : 65 543 bits
Nombre de fonctions de hash : 14

0,0001 % (0.000001) :

Taille : 98 314 bits
Nombre de fonctions de hash : 20

0.000001 % (0.00000001) :

Taille : 131 086 bits
Nombre de fonctions de hash : 27

Afin de limiter le nombre de faux positifs, nous avons augmenté la précision dans la dernière mise à jour de notre extension.

Commentaires (15)

Abonnez-vous pour prendre part au débat

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles d'un média expert

Profitez d'au moins 1 To de stockage pour vos sauvegardes

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

Sajicen

Le 08/04/2025 à 11h25

Merci pour votre travail et vos explications !
Je ne connaissais pas ce genre de filtre, cela donne envie de plonger plus dedans.

Petite remarque, mais j'ignore si je dois le faire ici. Je travaille beaucoup avec la console des navigateurs, le souci, c'est que l'extension laisse quelques traces de logs sur chaque page, par exemple :


Congratulations!!Service Worker Registered ServiceWorker scope:   Next

Ce n'est pas non plus très gênant, mais c'était surtout pour prévenir ! Je sais que sous Chrome, je peux masquer ce genre de message :)

Encore une fois super extension et merci pour vos explications.

PS : J'aurais bien report l'issue sur Github, mais je n'ai trouvé que le code pour Firefox :)

fdorin Premium

Le 08/04/2025 à 11h49

PS : J'aurais bien report l'issue sur Github, mais je n'ai trouvé que le code pour Firefox :)

A confirmer par @SébastienGavois, mais le code est sans doute le même. En tout cas, j'ai pu le prendre tel quel et il fonctionne sous Chrome.

C'est juste l'empaquetage et la distribution qui doivent changer.

Sajicen

Le 08/04/2025 à 13h28

Ah d'accord, merci !

fdorin Premium

Le 08/04/2025 à 11h47

De mon côté, je me demande si Google n'a pas pris en compte, de manière "discrète", le résultat de l'enquête.

Je retrouve beaucoup moins de lien GenAI dans le résultat de recherche ces derniers jours (j'utilise une version modifiée de l'extension, qui ~~barre en rouge~~ les liens qui sont des liens de sites GenAI, évitant de devoir se rendre sur ledit site pour s'en rendre compte)

Seb65

Le 08/04/2025 à 11h53

Pourquoi ne pas avoir simplement fait une liste de noms de domaines hashés ?
C'est masqué et ne laisse pas de place au hasard.

fdorin Premium

Le 08/04/2025 à 12h03

Je laisse bien sûr l'équipe infirmer / confirmer, mais voici mon analyse :

la taille du filtre de Bloom est "indépendante" du nombre d'éléments (c'est le facteur de faux positif qui en dépend)

impossible de savoir le nombre exact d'éléments à l'intérieur

inverser le filtre de Bloom nécessitera un peu plus de compétence et de temps que d'inverser une fonction de hashage classique

la complexité de la vérification via un filtre de Bloom est en temps constant O(1) par rapport aux nombres d'éléments (car la taille du filtre ne dépend pas du nombre d'éléments), contrairement à une liste de hashage où elle serait, au mieux en O(log(n)).

hezirem Premium

Modifié le 08/04/2025 à 12h18

Au moment ou j'ai élaboré le POC pour l'extension j'ai été confronté a ce choix.

En choisissant la table de hash j'aurais dû exposer le nombre d'éléments dans le set, cela aurait grandement augmenté la taille de l'extension, le bloom filter réduit considérablement la taille de la structure de donnée contenant le set d'URLs.

Cela aurait aussi entraîné une complexification importante du process de mise a jour de la liste, le sérialisation du bloom filter est beaucoup plus simple.

Dernièrement, un attaquant expérimenté aurait eu une plus grande surface d'attaque sur une hash table possédant plus d'informations a exploiter

Ces raisons sont les principales qui m'ont poussé a choisir la solution du bloom filter.

Après j'aime bien me dire que l'aspect probabiliste avec la possibilité de faux positifs est une feature plutôt qu'un bug, ça te force a faire marcher ton esprit critique en te demandant si le site est vraiment généré par IA ou pas, plutôt que du suivre aveuglément une figure d'autorité

Celui qui cesse de douter, cesse de progresser

PS: D'après les retours de mes collègues j'ai des tendances a overengineer, si vous avez une solution plus simple et élégante je serais ravi d'avoir vos perspectives.

gg40 Premium

Le 08/04/2025 à 16h23

Merci pour les précisions.
Je suppose qu’héberger la liste des domaines IA pose des problème de confidentialité ?

DHMO Premium

Le 08/04/2025 à 16h54

J’avais lu un truc sur la manière dont Firefox vérifie (ou vérifiait ?) les domaines pour voir s’ils sont malveillants. Si je me souviens, le domaine est hashé, le début du hash est envoyé à Mozilla, Mozilla répond avec tous les domaines malveillants commençant par ce bout de hash, et le navigateur vérifie dans cette liste si le domaine est présent.

Ainsi, la seule chose que sait Mozilla, c’est que telle adresse IP veut visiter un site dont le début du hash est pareil à ceux dans la liste. Mozilla ne sait même pas s’il est dans la liste : ce peut être un site légitime, mais ayant le même début de hash.

hezirem Premium

Le 08/04/2025 à 18h04

C'est une solution que nous avions envisagé quand j'ai discuté de la structure de l'extension avec JM et Seb.

Cette stratégie nous aurait en effet évité d'avoir a implémenter un mécanisme d'obfuscation mais la grande contrepartie en termes d'appels réseaux nécessaires et de bande passante dédiée a cela sur les serveurs de Next nous a fait éluder cette option.

Bien que nous l'ayons envisagé, le format actuel semble représenter un bon compromis entre les nécessités d'économies réseaux tout en préservant notre liste d'URL

Mihashi Premium

Le 08/04/2025 à 20h30

Et ça correspond à quoi le 1485 ? (expectedElements)
Le nombre estimé de sites qui seront bloqués ?

Timanu69

Le 09/04/2025 à 00h07

La mort de Richard III

Jean-Marc Manach Équipe

Le 10/04/2025 à 14h14

D'où sort ce chiffre ?... Comme indiqué, il y a plus de 3 000 NDD dans la liste (près de 3 500 en fait, depuis)

Mihashi Premium

Le 10/04/2025 à 19h38

Des formules et des valeurs à la fin : -1485*log(0,01)/log(2)^2 = 32 774,56 ≈ 32 772

faril Premium

Modifié le 14/08/2025 à 23h01

Je ne veux pas dire de bêtise mais c’est plus ou moins le principe d’un dictionnaire avec une fonction de hachage pour calculer un index dans un tableau (avec un modulo sur lac taille du tableau). Sauf qu’on ne gère pas les collisions: on regarde directement la case d’arrivée pour trouver un 1 (au moins une adresse était arrivée sur cet index: match positif possible) ou un 0 (aucune adresse n’a mené ici, donc certitude qu’il n’y a pas de match).

https://mpechaud.fr/scripts/donnees/tablesdehachage.html