En 2020, montée en puissance des contrôles fiscaux ciblés par data mining
Data yoyo 2.0
Le 02 septembre 2021 à 09h39
8 min
Droit
Droit
La direction générale des finances publiques (DGFIP) a rendu public son rapport annuel. Au fil des pages, on y découvre le rendement de la taxe GAFA ou encore de la redevance audiovisuelle, mais surtout se confirme la part de plus en plus importante de l’IA et du data mining dans les contrôles. Objectif : supprimer le quart des analystes spécialisés.
La taxe sur les services numériques (ou « taxe GAFA ») a rapporté 375 millions d’euros en 2020, indique la DGFIP dans son rapport annuel. Soit 25 millions de plus qu’en 2019.
Instituée par la loi 24 juillet 2019, après bien des tourments avec l’administration américaine, elle vise la fourniture de prestations de ciblage publicitaire, la mise à disposition d’un service d’intermédiation entre internautes, et enfin la vente de données collectées en ligne à des fins de ciblage publicitaire.
Elle frappe les plus gros des acteurs, ceux ayant dépassé 750 millions d’euros de revenus au niveau mondial, dont 25 millions d’euros rattachables à la France. Son montant est alors de 3 %.
Son montant reste faible néanmoins, alors que l’an passé encore, la redevance audiovisuelle a rapporté à elle seule 3,789 milliards d’euros (contre 3,860 en 2019).
Le rapport présenté cette semaine a été moins médiatisé pour un autre de ses versants : l’importance de l’IA dans les opérations de contrôle.
Un contrôle sur trois est ciblé par l’IA
Parmi les critères d’ « efficacité de la lutte contre la fraude fiscale », la DGFIP indique en effet que la part des contrôles ciblés par Intelligence Artificielle et le data mining est passée de 13,85 % en 2018, à 21,95 % en 2019 et même 32,49 % en 2020. Dit autrement, un contrôle sur trois est ciblé par l’IA. Le data mining ne serait-il plus le cache-misère contre la fraude fiscale ?
« Le projet ciblage de la fraude et valorisation des requêtes (ou CFVR, ndlr) permet de moderniser les techniques d’analyse avec le "data mining", qui consiste à analyser et à recouper les informations aux fins d’y repérer des profils de fraude » insiste la direction.
« Ce dispositif bénéficie du décloisonnement et du partage des données pour détecter des anomalies simples ou pour enrichir et automatiser certaines requêtes ».
Le projet ciblage de la fraude et valorisation des requêtes
Les pierres principales de cet édifice ont été posées fin 2019 avec la généralisation de ce « CFVR » à l’ensemble de la population française. Dans la bassine des données, un nombre incalculable de fichiers, auscultés pour détecter de possibles fraudes.
Ce pourcentage représente finalement 794 millions d’euros de droits et pénalités rappelés l’an passé. Fin 2020, d’ailleurs, quelque 2 000 emplois temps plein (ou ETP) travaillaient de façon déconcentrée et sur des données cloisonnées afin de réaliser la quasi-totalité de la programmation des opérations de contrôle fiscal » indique ce document de la direction interministérielle du numérique.
Au même moment, Bercy annonçait dans sa lettre interne une « montée en puissance des contrôles ciblés par le data-mining ». En 2021 et l’année prochaine, ces contrôles reposeront ainsi « sur l’exploitation accrue des données extérieures aux déclarations fiscales afin d’avoir une vision plus globale des entreprises et des particuliers qui prenne en compte les éléments de contexte » :
« Dans cette optique, seront notamment exploitées les données des plateformes collaboratives obtenues par la DGFiP et les données collectées sur les réseaux sociaux. Elle s’appuiera enfin sur la réorganisation des circuits de transmission des productions issues du data-mining qui alimenteront directement, à moyen terme les nouveaux outils informatiques qui seront mis à disposition des équipes de contrôle tel que le projet PILAT, qui vise à transformer le système d’information relatif à la chaîne du contrôle fiscal ».
#BigBrotherBercy
Dans cette dynamique, le 13 février 2021, était publié le décret « portant modalités de mise en œuvre par la direction générale des finances publiques et la direction générale des douanes et droits indirects de traitements informatisés et automatisés permettant la collecte et l'exploitation de données rendues publiques sur les sites internet des opérateurs de plateforme en ligne ».
Ce texte a orchestré la possibilité pour les services fiscaux de collecter massivement des données librement accessibles sur les réseaux sociaux. Une collecte résumée par le hashtag #BigBrotherBercy, et avant tout une conséquence de la loi de finances pour 2020 au fil d’une expérimentation de trois ans.
Le texte est pour l’heure calibré dans la lutte contre la fraude en matière de commerce illicite (drogue, tabac) ou encore des domiciliations à l’étranger. Un dispositif taillé pour recueillir des indices, en deux phases.
D’abord une phase d’apprentissage puis une phase d’exploitation où « en aucun cas des redressements n’interviendront sur la seule base de telles données, avait décrit la DGFIP en 2018, et il n’y aura aucune inversion de la charge de la preuve : il incombera toujours à l’administration de démontrer la fraude, sur la base d’éléments objectifs. Il ne s’agit donc absolument pas d’une surveillance généralisée de tous les Français ».
La phase d’apprentissage est architecturée par la mise en œuvre d’outils « de collecte et d'analyse des données » pour « identifier des indicateurs (…) tels que des mots-clés, des ratios ou encore des indications de dates et de lieux ». Elle sera suivie par l’exploitation de ces informations.
En identifiant des lieux, à l’aide des photos, de la géolocalisation, des vidéos, et autres éléments glanés à travers les réseaux, Bercy espère deviner la présence de fraudeurs dans l’océan des internautes, ceux qui déclarent fictivement vivre 6 mois et 1 jour à l’étranger, alors que leurs activités sociales sur Internet indiqueraient le contraire.
La douche froide
Seul souci, l’appétit de Bercy a été refroidi coup sur coup par le Conseil constitutionnel puis la CNIL. Les données chalutées ne peuvent qu’être librement accessibles sur les sites des opérateurs de plateforme, et cela ne concerne que celles manifestement rendues publiques par leurs utilisateurs. « Ne peuvent être collectés et exploités que les contenus se rapportant à la personne qui les a, délibérément, divulgués », a ainsi relevé le Conseil constitutionnel.
Pour la CNIL, ces données librement accessibles sont « les contenus auxquels un utilisateur non inscrit ou sans enrôlement préalable (création de comptes, fourniture de certaines informations pour créer un identifiant ou toute autre forme d'inscription) sur une plateforme ou un réseau social pourrait avoir accès, sans saisie préalable d'un mot de passe ».
En outre, « pour être manifestement rendus publics les contenus doivent être délibérément divulgués par la personne titulaire du compte ou de la page ce qui implique incontestablement une action volontaire de sa part ». Dit autrement, et contrairement à ce qu'espérait la doctrine de Bercy, « la simple absence de mise en place d'un paramétrage de confidentialité spécifique par exemple ne suffit pas à caractériser qu'une personne a délibérément divulgué un contenu ».
#BigBrotherBercy connecté au CFVR
Malgré ces contrariétés, un autre témoignage du volontarisme de Bercy s'est manifesté fin avril 2021, lorsque le gouvernement publiait un arrêté pour que les données collectées sur les réseaux sociaux via #BigBrotherBercy soient envoyées vers le CFVR (ou « ciblage de la fraude et valorisation des requêtes ») afin d’en confirmer l’utilité, et vérifier les concordances, tout particulièrement s’agissant des lieux géographiques, des activités professionnelles outre des « données d'identification des titulaires de comptes des pages internet ».
Objectif : supprimer un quart des 2 000 analystes spécialisés
« Si le service national d’analyse n’a pas cessé de gonfler au fil des années – il compte désormais une trentaine d’agents contre une dizaine en 2017 –, l’automatisation du ciblage des contrôles doit surtout contribuer aux suppressions d’emplois dans la maison », relève en outre notre confrère Acteurs Publics.
L'objectif serait en effet de « supprimer jusqu’à 500 équivalents temps plein (100 ETP par an pendant cinq ans) sur un total de 2 000 ETP spécialisés dans l’analyse de risques identifiés au moment du lancement du projet, en particulier dans les services déconcentrés ».
En 2020, montée en puissance des contrôles fiscaux ciblés par data mining
-
Un contrôle sur trois est ciblé par l’IA
-
Le projet ciblage de la fraude et valorisation des requêtes
-
#BigBrotherBercy
-
La douche froide
-
#BigBrotherBercy connecté au CFVR
-
Objectif : supprimer un quart des 2 000 analystes spécialisés
Commentaires (32)
Le 02/09/2021 à 10h39
Hormis les zozos qui vivent de la promotion de rouge à lèvres ou robot cuiseur sur snap et TikTok je ne vois pas trop qui va en pâtir vu que la majorité des cibles potentielles pense logiquement à ne pas rendre leurs profils publics.
J’ai hâte que la police fasse de même pour traquer les stupéfiants. Ha on me dit qu’ils ont déjà pignon sur rue et qu’on ne fait rien
Le 02/09/2021 à 11h00
Rien sur le chalutage des images IGN pour les impôts locaux (piscine, garage, ..) ?
BFM TV
Le 02/09/2021 à 11h25
Oui bah ça c’est du réchauffé, ils le font depuis la sortie de Googlemap et ils ont largement publié là-dessus.
Le 02/09/2021 à 11h57
Ben non, il me semble que c’etait interdit jusqu’à présent et si on lit l’article :
Ce qui n’est pas le cas des données IGN
OK je n’avais pas capté que c’était une rétrospective 2020, j’ai lu l’article du canard il y a quelques semaines
Le 02/09/2021 à 11h56
C’est le rapport sur les résultats de 2020, pas un truc sur les projets en cours.
Et comme explique Refuznik, ils le faisaient déjà a la main dans certains secteurs
Le 02/09/2021 à 13h45
Comme m’a dit une fois agent des impôts concernant les piscines sur geoportail/maps : “c’est magnifiquement bleu pour les contrôles” et ça fait mini 10 ans
Le 02/09/2021 à 14h13
Sauf que normalement il faut être autorisé à rentrer chez un particulier pour constater de visu l’infraction, d’après l’article du Canard, le seul constat des données IGN suffirait.
Le 02/09/2021 à 11h22
Si je comprends bien, on va mettre a la porte les seuls personne compétente pour faire le boulot et les remplacer par des Bot a l’efficacité qui reste a prouver? Je vois mal comment surveiller facebook va aider a attraper les gros fraudeurs. L’heure n’est pas plutôt au recrutement? vue le manque a gagner (des centaines de milliard?) je ne comprends vraiment pas ce genre de décision.
Le 02/09/2021 à 13h30
Tu comprends bien, sachant qu’on pourrait très bien améliorer les contrôles mais bon ça fait un paquet d’années qu’on ne parle que du coût des fonctionnaires, donc continuons à supprimer au lieu d’améliorer les processus et le retour des fonds évadés…
D’autres utilisations de l’IA sont en cours à la DGFIP, par exemple pour vérifier les différents documents de la chaîne de dépense de l’état et des collectivités avec des résultats assez impressionants et évidemment à la clé des suppressions de poste (bien/mal, là n’est pas le propos mais la DGFIP se modernise énormément contrairement à beaucoup de préjugés).
Sinon à surveiller dans les années qui viennent les projets de cloud fournis aux autres ministères par la DGFIP et la centralisation des informations (“dites le nous une fois”) qui vont permettre toujours plus de traitements de données et de créations de profils numériques individuels très fournis.
Le 02/09/2021 à 12h33
« pour être manifestement rendus publics les contenus doivent être délibérément divulgués par la personne titulaire du compte ou de la page ce qui implique incontestablement une action volontaire de sa part ».
Si cela fonctionne pour les réseau sociaux, personne n’a demandé d’être sur Google Maps ? la CNIL devrait mettre son véto ?
Le 02/09/2021 à 12h38
On a des infos sur combien des contrôles engagé par un signalement de l’analyse des réseaux sociaux ont abouti a une fraude constatée ?
Le 02/09/2021 à 13h30
doublon dsl
Le 02/09/2021 à 13h32
Après, je ne vois pas le problème. Les gens n’arrêtent pas de persifler sans savoir (“lui il a fait un garage sans le dire, lui il a fait une piscine”) -> là on a un contrôle automatique, un peu comme les radars. Et sur la même base sur lesquels s’appuient les voisins pour montrer du doigt.
Pour ne pas craindre, il suffit de déclarer. C’est pas dur. Coincer les gens qui fraudent, ça ne me choque pas.
Même si son efficacité reste à prouver (et il va s’améliorer si on y met quelques moyens), si dans la balance son coût reste proportionnel à son efficacité, il peut être plus rentable que l’humain
#pragmatisme aveugle
Le 02/09/2021 à 15h09
Moralité il faut construire des piscines couvertes
Le 02/09/2021 à 17h10
Ou ne pas traiter ou mettre un liner vert
Le 03/09/2021 à 08h09
La vente de revêtement / couverture (je sais pas comment on appelle ça mais en gros un tissu pour couvrir) peint pour représenter des bosquets ou une prairie va grimper en flèche prochainement.
Le 02/09/2021 à 19h27
Ce qui par ricochet va aussi servir à la DGSI et à la DGSE, ne nous leurrons pas.
Le 02/09/2021 à 22h02
Et la tu tombes sous le coup(t) de la fiscalité des abris de jardin…
Le liner vert c’est mieux … sauf en hier… enfin bon avec le réchauffement climatique…
Le 03/09/2021 à 08h08
Pas sûr que la balance soit rentable…
Le 03/09/2021 à 09h49
Pardon mais elle ne laisse pas prospérer. Elle pousse à ça en promouvant ses techniques de management innovantes
Le 03/09/2021 à 08h32
Une toile de camouflage ?
Le 03/09/2021 à 08h57
Une bâche “gazon artificiel”
Le 03/09/2021 à 12h45
Tu devrais te renseigner sur le nombre de gens qui sont condamnés pour trafic de stupéfiant, et leur proportion en prison.
L’efficacité des bots est facile à mesurer avec les redressements fiscaux qui sont générés. Ensuite comme dit dans l’article, les “bots” signalent des profils, après il y a intervention d’un agent pour traiter le cas (en commençant par vérifier évidemment).
Recruter n’est pas un but en soi, et ici l’informatique permet de décharger une partie du travail de recherche de fraude. Le manque à gagner (pas forcément des chiffres aussi délirants qu’on voit ici ou là, pour diverses raisons) est constitué des fraudes qui sont plus difficiles à établir ; le fisc commence par récupérer tout ce qui est plus facile ou plus rentable, c’est une approche rationnelle.
Ce genre de propos, franchement… N’importe quel ministère (et ministre) ne demande qu’à récupérer plus d’argent (de la fraude) et à l’annoncer publiquement, il y a bien évidemment une pression globale pour que les contrôles rapportent le plus possible.
C’est un usage responsable de l’argent public que de ne pas avoir trop de personnel ou du personnel mal ou peu employé.
Le 03/09/2021 à 13h04
Entendu dans un débat sur France Culture cette semaine ou la semaine dernière. Il y aurait plus de moyens de police mis contre les consommateurs que contre les trafiquants.
L’efficacité des contrôleurs humains aussi est mesurable. Et il y a quelques années, le montant de 1 M€ / contrôleur avait été avancé.
Je tiens juste à rappeler qu’aucun gouvernement n’a fait sauter le verrou de Bercy : c’est à dire que c’est Bercy qui décide s’il faut poursuivre devant la justice pénale un fraudeur.
Ah, l’usage responsable et raisonnable de l’argent public … c’est un vaste débat.
Le 03/09/2021 à 13h56
J’ai quand même un doute, car on ne met pas les consommateurs en prison… et ça sert à rien de les chercher ces consommateurs.
Après, la lutte contre le trafic est un peu vaine, ça doit être démoralisant pour un policier, même s’il arrête du monde et en fait condamner régulièrement, c’est un puits sans fond.
Ah mais je ne disais pas le contraire. Je répondais à une interrogation (plus ou moins sincère) sur la mesure de l’efficacité des méthodes informatisées.
Je n’ai pas ouvert la page WP mais elle ne doit pas être à jour alors, et ça ne date pas de ces derniers mois : https://www.actu-juridique.fr/fiscalite/droit-fiscal/le-bilan-de-la-reforme-du-verrou-de-bercy/
L’article 36 de la loi n° 2018-898 du 23 octobre 2018 relative à la lutte contre la fraude a profondément réformé les modalités de poursuites de la fraude fiscale. Il existe désormais deux voies par lesquelles le parquet peut être saisi d’un dossier.
[..]
Cette réforme a supprimé le mécanisme du verrou de Bercy qui a longtemps constitué une exception au libre exercice de l’action publique par le parquet
Houla oui :-) .
Le 03/09/2021 à 14h00
Il y a une pression budgétaire qui pousse à diminuer les effectifs. L’argent rapporté par un ministère ne lui revient pas hein, donc ce sont des choses séparées, et si tu peux rapporter autant en diminuant les effectifs tu le feras.
Quant à avoir TROP de personnel ou mal employé, c’est toi qui le dit. Tu m’as l’air loin des réalités du travail de fonctionnaire, mais c’est plutôt bien vu de conchier sur ces gens donc soit.
Le 03/09/2021 à 14h05
Mais quel coût de formation pour un contrôleur? Alors qu’une fois qu’on a une IA, si on la duplique/lui met plus de performances…
La question est: dans le système “piloté” par IA, quel est le coût des agents pour le faire fonctionner?
Je me fais l’avocat du diable: je sais bien que la question est complexe (l’IA pourra-t-elle être adaptée facilement à de nouveaux cas de figures? Ne va-t-elle pas créer des niches? Va-t-elle finir pas donner trop de faux positifs? Les agents chargés de traiter les dossiers identifiés par l’IA vont-ils perdre en compétence avec le temps?)
Le 03/09/2021 à 16h56
Rapporter plus à effectif constant c’est bien aussi.
Pour la première phrase, c’est tout simplement quelque chose qui existe par la force des choses dans un monde qui évolue (par exemple les feuilles de soin dématérialisées, avant des gens entraient les infos papier sur ordi). Quant à ta dernière phrase, elle est ridicule, je ne conchie pas les fonctionnaires (faudrait me montrer où précisément) et je peux même ajouter que ce serait mal venu vu que j’en ai un certain nombre dans ma famille. J’ai aussi travaillé à ce qu’on appelait le Minefi (Bercy) à une époque comme prestataire.
Un contrôleur doit quand même être formé, à commencer par du droit, de la fiscalité et le code des impôts. l’IA lui facilite le ciblage en lui désignant directement des gens à contrôler plus avant.
A priori ils devront garder les compétences, car ils doivent monter un dossier correct pour aller demander des redressements, surtout si ça va au tribunal.
Le 04/09/2021 à 14h20
J’ai une place près de chez moi avec un grand parking où les mêmes gars sont présents chaque jour de 10h à 21h.
Le commissariat de police est à 300m.
Il ne se passe strictement rien, par contre si t’as raté le parcmètre là on ne t’oublie jamais
ça doit être une question de solvabilité bancaire sûrement…
Le 06/09/2021 à 13h06
Si tu veux aller par là, c’est combien le coût total et réel de l’IA? Est-ce qu’il faut y ajouter le coût social d’un chômeur de plus par rapport à un fonctionnaire?
Le 06/09/2021 à 15h11
Je suis d’accord, j’exprime juste les arguments habituels.
Pour former un humain, il faut plus de 20 ans. Ca ne s’améliore pas.
Pour former une IA … il faut un temps encore indéfini, mais pour former les “suivantes”, on peut aller beaucoup plus vite!
Le 07/09/2021 à 22h12
Drôle d’idée, comme si ça allait créer du chômage…
Et l’État ne manque pas de besoins en personnel, si on parle des fonctionnaires.
Et on ne va pas refaire le débats des métiers à tisser et de la mécanisation.
Tu pars d’un peu loin là :-)