Fraudes fiscales : les criblages par IA de Bercy ont contribué à supprimer des centaines d’emplois

Data mining, employés minés

Le 17 novembre 2023 à 13h47

14 min

Droit

Un rapport de la Cour des comptes consacré à la fraude fiscale des particuliers se félicite de la « sophistication des méthodes de détection par l’usage de modèles statistiques issus de l’intelligence artificielle ». Il relève cela dit que leur efficacité reste « difficile à évaluer », sauf en matière de suppression d’emplois.

Sous-titré « Une incontestable modernisation des méthodes, des résultats encore insuffisants », le rapport analyse dix années d’évolution des outils de détection de la fraude fiscale depuis la création, en 2013, de la mission de « Ciblage de la fraude et valorisation des requêtes » (CFVR).

Cet « outil de modélisation et de visualisation des comportements susceptibles de constituer une fraude » a pour objectif de « mener des actions de prévention, de recherche, de constations ou de poursuite d’infractions en matière fiscale ».

Le CFVR utilise la méthode de « croisement de données en masse », laquelle consiste à étudier la divergence entre les déclarations des redevables et la réalité, estimée ou obtenue par les services de la Direction générale des finances publiques (DGFIP).

CFVR est basé sur des « techniques d’exploration des données » et permet la « modélisation prédictive, l’analyse de risques, la recherche d’atypies ou d’incohérence » et de liens entre différentes personnes ou entités professionnelles. Pour autant, il ne « procède en aucun cas à la caractérisation d’une fraude fiscale mais constate simplement une anomalie ou une irrégularité possible ».

La Cour des comptes rappelle que CFVR est développé par l’administration fiscale depuis 2016, avec pour objectif d’ « élever le niveau de qualité de son analyse des risques fiscaux ». Initialement déployé sur les déclarations des entreprises, CFVR a ensuite été élargi aux particuliers, d’abord à titre expérimental jusqu’en août 2019, puis pérennisé.

Le « croisement de données en masse »

Il a d'ores et déjà représenté 21,3 M€ de dépenses, et rassemblé au sein d’un seul bureau du service juridique et du contrôle fiscal (SCJF-1D) 31 professionnels spécialisés (data scientists). En pratique, le programme CFVR permet de « modéliser et de visualiser les anomalies et irrégularités fiscales » afin de proposer des programmations de contrôles aux équipes de terrain, définies et classées par risque fiscal :

« CFVR signale toute divergence entre les déclarations des redevables avec les données détenues ou avec les estimations statistiques produites par l’administration fiscale (cf. 2 ci-dessous). L’algorithme de croisement des données trie les divergences par seuil d’enjeu dans un premier temps puis calcule dans un second temps un écart relatif en pourcentage entre la valeur déclarée et la valeur réelle ou estimée. »

Le croisement de données en masse couvre « actuellement » 50 « risques fiscaux » pour les particuliers. Ils peuvent porter, par exemple, sur des fraudes à l’impôt sur le revenu, aux réductions et crédits d'impôt, aux droits de succession, aux droits de mutation à titre onéreux ou encore aux « cessions de parts sociales à prix symbolique ou minoré ».

Au-delà des estimations statistiques de niveaux de revenus ou de prix de cessions, l’administration intensifie également ses travaux pour modéliser une « probabilité de fraude ». Ces travaux comprennent des méthodes supervisées qui s'appuient sur l'analyse des contrôles fiscaux effectués les années précédentes afin de dégager certaines caractéristiques-type, mais également des méthodes dites « non supervisées » qui consistent à détecter des comportements inhabituels ou incohérents, lesquels pourront ultérieurement être analysés comme des indices évocateurs de fraude.

Plus classiquement, l’administration procède aussi à l'analyse des réseaux de relations, basée sur la théorie des graphes, pour identifier et signaler les contribuables ou les entités entretenant des liens financiers avec des personnes suspectes ou déjà identifiées comme fraudeuses.

Sept agents pour le data mining des particuliers

Le fisc, qui a investi des millions d'euros dans ses algorithmes de « data mining », se concentre de plus en plus sur une analyse de risque grâce à l'intelligence artificielle, et de moins en moins sur l’importance des sommes en jeu, relève Acteurs Publics.

La Cour des comptes précise que l’équipe en charge du « croisement des données en masse » spécialisée sur les particuliers au sein de l’administration centrale n’est constituée que de cinq agents spécialisés, aidés dans leurs travaux par deux data scientists.

Ces sept agents ont procédé à « environ 155 000 suggestions de contrôles de particuliers en 2022, soit trois fois plus qu’en 2018 ». Des « gains d’efficience » d'autant plus « notables » que la période a été marquée par la baisse des effectifs de l’administration fiscale, dont le plafond d’emplois est passé de 103 473 agents en 2017 à 95 221 en 2021, soit 8 % de moins en quatre ans.

Et ce, alors que les effectifs des services « particulièrement impliqués » dans la lutte contre la fraude fiscale des particuliers au sein des blocs métiers « contrôle fiscal » se sont quant à eux réduits de 18,5 % entre 2017 et 2021, passant de 8 039 à 6 547.

La Cour déplore cela dit que les gains de productivité associés au croisement de données en masse, « dont la réalité n’est pas contestable », ne peuvent cependant être mesurés précisément, le nombre d’agents impliqués dans la détection des irrégularités fiscales avant et après 2016 « étant difficile à reconstituer en l’absence de données stables ».

20 000 piscines identifiées, 10 millions d’euros de recettes

Le volet « piscines » du projet « Foncier innovant », distinct de CFVR et développé en collaboration avec deux grandes entreprises du secteur du numérique « pour un coût estimé à 25,9 millions d’euros réparti sur trois ans », a de son côté conduit l’administration fiscale à identifier 20 000 piscines non déclarées et à recouvrer 10 millions d’euros de recettes supplémentaires au profit des communes concernées pour la seule année 2022, « même si son déploiement est incomplet », note la Cour des Comptes.

L'expérimentation n'a en effet été mise en place en 2022 que dans les Alpes-Maritimes, le Var, les Bouches-du-Rhône, l’Ardèche, le Rhône, la Haute-Savoie, le Morbihan, le Maine-et-Loire et la Vendée. Jugée concluante, « Foncier innovant » a été étendu à la fin de l’année 2022 à tout le territoire continental.

La Cour des comptes déplore, à cet égard, l’absence de déploiement en Corse et outre-mer, ce qui « affaiblit la portée du programme et constitue une inégalité de traitement des contribuables » selon leur département de résidence, « à laquelle il doit être rapidement mis fin ».

Pour rappel, le dispositif vise à automatiser la détection des constructions non déclarées (typiquement, les piscines) en exploitant les prises de vue aériennes publiques de l'Institut national de l'information géographique et forestière (IGN).

À cet effet, les algorithmes de « Foncier innovant » extraient des images aériennes les contours des immeubles bâtis et des piscines avec leurs coordonnées géographiques. Ces contours, traduits et convertis en bâtiments présumés, sont ensuite confrontés aux éléments d’assiette des impôts locaux concernés, et notamment à la taxe foncière afin de vérifier s’ils sont correctement déclarés.

La détection d’une anomalie entraîne un contrôle manuel par un agent de l’administration fiscale puis, le cas échéant, une demande d’information au propriétaire du bien avant un éventuel avis de taxation.

Une efficacité « difficile à évaluer »

La Cour observe cependant que l'efficacité du data mining reste « difficile à évaluer », faute de quantification précise de la fraude fiscale. Elle déplore que les indicateurs et repères d’activité de la DGFIP « portent sur les contrôles réalisés et ne font pas le lien entre les motifs qui ont conduit à programmer ces contrôles et leurs résultats ».

Se basant sur les données disponibles sur les seuls contrôles sur pièces (CSP), la Cour relève que les « taux de pertinence » de la sélection opérée par croisement de données ont atteint, en 2021, 63,9 % pour les dossiers de contrôlés au titre de l’impôt sur le revenu, 34,1 % pour les dossiers contrôlés au titre des impôts sur la fortune et les plus hauts revenus, et 28,4 % pour les dossiers contrôlés au titre des droits de mutation et de succession.

La Cour note que ce taux de pertinence « s’inscrit donc dans une fourchette large », qui « suggère que le croisement de données a déjà atteint une certaine maturité » pour la détection des irrégularités touchant à l’impôt sur le revenu mais qu’il « dispose encore de larges marges de progrès » sur les autres impôts pesant sur les particuliers.

Elle souligne que depuis 2016, le taux de pertinence est orienté par ailleurs à la hausse puisqu’entre 2018 et 2021, il a gagné 10 points (47,39 % en 2018 et 57,41 % en 2021), mais conclut que si le taux de pertinence du croisement de données en masse est légèrement supérieur à celui de l’ensemble des contrôles, il ne l'est « pas de manière spectaculaire ».

Acteurs Publics relève par contre que « l’automatisation du ciblage des contrôles a bien généré des économies, en supprimant des centaines d’emplois ». Notre confrère ajoute que la Cour invite à « élargir encore le spectre des données étudiées », en allant récupérer aussi des informations provenant d’autres administrations, comme les douanes ou l’Urssaf, « et d’autres ministères ».

Le fisc doit expliquer qui il contrôle et pourquoi

La Cour relève que l’inventaire des initiatives technologiques fiscales établi par l’OCDE montre que 28 pays utilisent déjà l’intelligence artificielle et les outils de traitement de données pour procéder à la détection d’anomalies en temps réel lors de la déclaration.

Elle note qu'en France, le plan national anti-fraude de juin 2023 prévoit une augmentation de 25 % du nombre de contrôles fiscaux des particuliers d’ici 2027 « en ciblant particulièrement les plus gros patrimoines », mais également que la part des contrôles de particuliers issue du data mining atteigne 50 % d’ici là, comme cela est déjà le cas pour les entreprises.

Elle souligne, en conclusion, que la volonté de systématiser la détection des anomalies et des irrégularités fiscales en déployant une « stratégie technologique » et en intensifiant l’usage du renseignement a « marqué la décennie 2010 » :

« Elle a profondément modifié les outils et les méthodes de l’administration en matière de lutte contre la fraude fiscale des particuliers, même si elle n’en a pas encore bouleversé les principaux résultats, qu’il s’agisse du nombre de contrôles effectivement diligentés ou des sommes réclamées par le fisc après contrôle. »

La Cour relève que « l'outil CFVR a déjà pris une place majeure et croissante dans les propositions de contrôle via le croisement de données en masse » et que les résultats affichés par le traitement de données en masse pour nourrir la programmation des contrôles fiscaux, « s’ils ne traduisent pas encore de véritable rupture, suggèrent clairement une pertinence croissante associée à des gains d’efficience ».

Elle note également que le déploiement de ces nouveaux outils s’est accompagné de « plusieurs précisions légales ou jurisprudentielles » destinées à garantir la proportionnalité des méthodes aux objectifs poursuivis et, « plus globalement », à veiller à ce que le cadre juridique de la lutte contre la fraude fiscale respecte les droits et libertés des contribuables et ne fragilise pas la protection de leurs données personnelles.

La Cour en appelle enfin à plus de transparence, afin de dépasser les craintes formulées notamment sous le hashtag #BigBrotherBercy, et de ne pas effriter le consentement à l’impôt :

« Alors que le débat public laisse parfois place aux suppositions et aux approximations, voire aux contre-vérités, il est de la responsabilité de l’administration fiscale d’expliquer qui elle contrôle et pourquoi, en vertu de quels risques, et avec quel équilibre entre la puissance des outils technologiques à sa disposition et la protection des droits des contribuables ».

Une prorogation de l'expérimentation de « webscrapping »

Le Club des Juristes relève pour sa part que le Gouvernement propose, à l’occasion du projet de loi de finances pour 2024, de réviser et proroger le mécanisme expérimental de collecte et d’exploitation (« webscrapping »), au moyen de traitements informatisés et automatisés, des contenus publiés par les contribuables sur Internet.

L'objectif serait d'en améliorer l'efficacité, les résultats de cette expérimentation, qui devait se terminer le 13 février 2024, étant « en demi-teinte ». Un rapport transmis au Parlement par l’administration fiscale évoque certes des bilans d’étape « encourageants », mais pour des montants rectifiés qui demeurent « faibles ».

L’Administration devrait ainsi être autorisée à collecter les informations rendues publiques par leurs auteurs sur les sites des plateformes où il est nécessaire de s’inscrire et de s’identifier via un mot de passe. Le Conseil constitutionnel avait en effet refusé, lors de l’examen de la première version de ce dispositif, l’accès à ces données.

Or, souligne le Club des Juristes, cette restriction avait obligé l’administration fiscale à se concentrer « seulement sur la détection des activités économiques occultes opérant sur les plateformes d’économie collaborative ».

Alors qu'avec cette potentielle modification du champ de l’expérimentation, le fisc pourrait envisager de collecter des informations sur les réseaux sociaux les plus usités, « et ainsi obtenir des informations sur le mode de vie des contribuables ».

Le projet propose également de modifier le champ de l’expérimentation pour ce qui est des types de comportements recherchés. En effet, relève le Club des Juristes, « l’Administration ne peut traquer que certains types d’agissements frauduleux », car, « en complément de l’avis de la CNIL », le législateur avait voulu limiter ce mécanisme « aux cas où son usage se justifie le plus ».

Outre les « activités occultes » et la domiciliation fiscale, le fisc ne pouvait rechercher que des irrégularités en matière douanière concernant « notamment » le commerce illicite de tabac ou d’alcool ou la contrebande.

Le projet de loi propose dès lors d’assouplir cet encadrement et d’autoriser l’administration fiscale à employer cette méthode en cas de minoration délibérée ou de dissimulation de recettes, « c’est-à-dire les cas les plus élémentaires de fraude fiscale ».

Ces deux révisions « étendraient grandement le champ d’application de ce mécanisme », conclut le Club des Juristes, rendant d’autant plus « indispensables » les garanties qui avaient été formulées lors de l’instauration de cette expérimentation ou au sein de son décret d’application, « ainsi que l’implication de la CNIL dans l’exécution de ce mécanisme ».

Commentaires (14)

Albirew Abonné

Le 17/11/2023 à 14h26

Il relève cela dit que leur efficacité reste « difficile à évaluer », sauf en matière de suppression d’emplois.

Oof, satyre à balles réelles =)

pamputt Abonné

Le 17/11/2023 à 14h47

Ces sept agents ont procédé à « environ 155 000 suggestions de contrôles de particuliers en 2022, soit trois fois plus qu’en 2018 ».

puis un peu plus loin

Et ce, alors que les effectifs des services « particulièrement impliqués » dans la lutte contre la fraude fiscale des particuliers au sein des blocs métiers « contrôle fiscal » se sont quant à eux réduits de 18,5 % entre 2017 et 2021, passant de 8 039 à 6 547

On a donc 6 547 agents chargés de gérer 155 000 suggestions. Avec ce genre d’outils, le suggestions augmentent mais le nombre de personnes pour contrôler diminue …
Pour rappel, au-delà de l’affichage politique qui vise à réduire le nombre de fonctionnaire, les fonctionnaires des impôts sont l’un des rares métiers de la fonction public qui rapporte plus qu’il ne « coutent »

Le 17/11/2023 à 15h26

Moi ce qui m’inquiète c’est ça :

CFVR signale toute divergence entre les déclarations des redevables avec les données détenues ou avec les estimations statistiques produites par l’administration fiscale (cf. 2 ci-dessous).

=> Ca veux dire quoi ? Que tes choix de vie sont suspicieux si ils sont pas semblable à ceux de tous les autres membres de ta catégorie socio-pro et qu’il vaux mieux aller y voir de plus près … ?

Il me semble que c’est assez malsain comme manière de faire.

(Après je suis d’accord que ce n’est qu’un contrôle. Ceci dit, toute personne ayant vécu un contrôle fiscal un peu poussé sais à quel point ça peux être stressant, chronophage et culpabilisant).

cauzik Abonné

Le 17/11/2023 à 16h16

Il faut aussi dire qu’on pourra développer toutes les IA possibles, leur apprentissage restera basé sur des méthodes déjà connues des services. Les fraudes qui coûtent le plus cher sont des fraudes assez récentes ou qui profitent d’une modification des lois, de règlements TVA etc. Et pour détecter ça je pense que seul un travail d’enquête, de fond peut faire le taf. Il faut donc des agents nombreux et compétents, et remplacer les départs à la retraite au lieu d’en profiter pour faire des économies.

Pour ce qui est du faible nombre de data-scientists et d’agents destinés à travailler sur des masses de données, mon petit doigt me dit que celui-ci augmente fortement actuellement, à petits pas car il faut réussir à attirer des gens compétents avec des salaires qui restent bas, la faute à des grilles qui sont les mêmes pour des agents administratifs vs informatique (sauf quelques primes à la marge).
Sauf à embaucher des contractuels mais dont le travail n’est pas forcément pérennisé puisqu’ils pourront plus facilement partir et seront moins sensibles au sens du service public.

Nightmaster Abonné

Le 17/11/2023 à 21h14

Ce qui me fait “doucement rire” c’est qu’ils parlent beaucoup des fraudes liées aux non déclarations d’impôts, mais ce n’est au final qu’une goutte d’eau dans les montants de détournements d’argent liés à des infractions.

Précisions, la suite de mon commentaire est basée sur un reportage vu il y a 2-3 ans, mais je doute que cela ait beaucoup bougé (en mieux s’entend…) depuis :
Le carrousel de TVA (expliqué via un document du gouvernement) était estimé, car non véritablement mesuré faute de moyens, à plusieurs milliards d’€.
À titre comparatif, on parle de millions d’€ avec les fraudes aux impôts.

Je ne rentrerais (volontairement) pas sur les +/- supposées liens +/- éloignés à la classe dirigeante, mais c’est risible de voir vers quoi les efforts pour “rattraper” de l’argent acquis par détournement se tourne → pas vers les points où les voleurs gagnent le plus…

Je pose ça ici aussi (cf. section « Des exceptions pour les infractions “occultes” »), histoire de souligner toute l’hypocrisie autour des délits liés au détournement d’argent…

serpolet Abonné

Le 18/11/2023 à 06h40

Nightmaster a dit:

À titre comparatif, on parle de millions d’€ avec les fraudes aux impôts.

Non :

L’action des services de contrôle a permis de mettre à jour 14,6 milliards d’euros d’impôts éludés (droits et pénalités) qui ont été mis en recouvrement auprès des particuliers et les entreprises, soit 8,2 et 1,2 milliard de plus qu’en 2021.

Source : Bilan de la lutte contre des fraudes fiscale, douanière et sociale : les chiffres-clés de l’année 2022

Schismatrice

Le 18/11/2023 à 09h59

“montants mis en recouvrement” ne veut pas dire “montants recouvrés”. En général, le fisc français recouvre la moitié des sommes qu’il réclame seulement.

Source : https://www.lesechos.fr/economie-france/budget-fiscalite/impots-les-controles-fiscaux-ont-fait-entrer-11-milliards-dans-les-caisses-de-letat-en-2021-1390825

fofo9012 Abonné

Le 18/11/2023 à 09h47

Nightmaster a dit:

Ce qui me fait “doucement rire” c’est qu’ils parlent beaucoup des fraudes liées aux non déclarations d’impôts, mais ce n’est au final qu’une goutte d’eau dans les montants de détournements d’argent liés à des infractions.

Précisions, la suite de mon commentaire est basée sur un reportage vu il y a 2-3 ans, mais je doute que cela ait beaucoup bougé (en mieux s’entend…) depuis : Le carrousel de TVA (expliqué via un document du gouvernement) était estimé, car non véritablement mesuré faute de moyens, à plusieurs milliards d’€. À titre comparatif, on parle de millions d’€ avec les fraudes aux impôts.

Ce n’est pas parce qu’il y’a pire qu’il ne faut pas traiter ce problème, ce raisonnement est assez étrange. Qu’on utilise une IA pour détecter des piscines, bah c’est bien, ça laisse plus de temps aux humains pour traiter les cas complexes. Bon ensuite il faut quand même que ce soit rentable, pour les piscines, on parle de 26millions investis pour en récupérer seulement 10millions, j’ai l’impression que les impôts ont été rerouter directement dans la poche de Capgemini :-/

fred42 Abonné

Le 18/11/2023 à 10h07

C’est 10 millions la première année 2022, soit une moyenne de 500 € par piscine. Il y a des rectifications qui peuvent remonter 3 ans en plus de l’année en cours.

Donc, en régime établi, ça devrait rapporter en plus 2,5 millions par an (plus le fait que les gens vont plus déclarer). Les dépenses seront amorties en 2029. Ce n’est effectivement pas forcément un bon investissement, mais pas un mauvais non plus. Par contre, ce devraient être les bénéficiaires des impôts locaux qui paient ces dépenses et pas l’État à qui ça ne rapporte rien.

fofo9012 Abonné

Le 18/11/2023 à 11h13

Je ne suis pas convaincu, la première année l’algo détecte d’un coup toutes les fraudes historiques de la région, l’an suivant il ne va détecter que les fraudes des nouvelles piscines, donc un nombre forcément très faible, et des amendes très faibles également vu qu’il n’y a aucun arriéré à récupérer

fred42 Abonné

Le 18/11/2023 à 11h30

Ceux qui ont été détecté la première année vont continuer à payer les années suivantes alors que sinon, ils n’auraient probablement jamais payé. Je ne compte que cela dans mon calcul.

En tout cas, j’ai bien fait de demander la régularisation de la piscine à mon vendeur avant mon achat. Ça évite les soucis.

Dj Abonné

Le 18/11/2023 à 09h57

La Cour des comptes déplore, à cet égard, l’absence de déploiement en Corse et outre-mer

Il faudrait recruter beaucoup de monde, surtout s’il y a des contrôles sur place ils devront être réalise par des agents du continent.

Suffit de regarder le boulot de U Levante

Puis bon il y a des domaines ayant beaucoup de pouvoir (via leurs relations)
https://www.leparisien.fr/faits-divers/en-corse-la-face-sombre-du-domaine-de-murtoli-le-paradis-des-stars-18-07-2019-8119272.php

Inodemus

Le 18/11/2023 à 11h39

fofo9012 a dit:

Je ne suis pas convaincu, la première année l’algo détecte d’un coup toutes les fraudes historiques de la région, l’an suivant il ne va détecter que les fraudes des nouvelles piscines

L’article dit que ce qui a permis de récupérer 10 millions c’est une expérimentation dans seulement 9 départements. Donc il en reste encore plein des nouvelles piscines à découvrir dans les ~85 autres. Après application d’une règle de 3 ça paraît donc plus que rentable, même s’ils ont du viser en premier des départements où il y en a beaucoup.

Et ensuite chez les redressés la taxe tombe chaque année, plus les éventuelles déclarations spontanées chez ceux qui ont peur d’être redressés, et une baisse des nouvelles constructions non déclarées.

vipaxx

Le 18/11/2023 à 17h42

Je viens de découvrir que le siège social de la maison mère d’ONEY, la banque associée à Auchan, est à Malte.

C’est facile, ça coûte pas cher et ça peut rapporter gros… pas besoin de data mining, ça crève les yeux.