Collecte de masse, algorithme auto-apprenant… quand le fisc s’échine
#BigBrotherBercy (suite)
Le 04 novembre 2019 à 07h32
9 min
Droit
Droit
Après les députés de la commission des lois, les élus de la commission des finances s’attaquent à l’article du projet de loi de finances autorisant la collecte massive et le traitement des données glanées sur les réseaux sociaux et les plateformes de vente. À cette occasion, le groupe LREM a déposé plusieurs amendements pour encadrer #BigBrotherBercy.
L’article 57 du projet de loi de finances entend autoriser le fisc et les douanes à aspirer l’ensemble des informations publiées sur Facebook, Instagram, Dailymotion, YouTube, Twitter, eBay ou encore Leboncoin. L’idée ? Repérer dans l’océan numérique des photos, textes, vidéos, des ventes publiées en ligne, des indices d’activités illicites pour ensuite concentrer les enquêtes sur les individus. Une collecte de masse assumée par le gouvernement.
Saisie en urgence, la CNIL n’a eu que quelques jours pour ausculter cette arme, fruit de l'exécutif. Malgré une contrainte calendaire, elle a décelé de nombreuses lacunes dans cette collecte qu’elle craint disproportionnée. Elle note aussi que Bercy et les douanes pourront alpaguer de nombreuses données personnelles comme les opinions politiques, syndicales, religieuses, les orientations sexuelles, etc. Au point d’influer sur la liberté d’expression et de communication de chaque internaute.
La commission des lois a déjà tenté d'encadrer quelque peu cet aspirateur géant. Elle suggère par exemple d’interdire la sous-traitance, afin d’internaliser la collecte et les traitements consécutifs. De même, les réseaux sociaux devraient être mis hors de la boucle. Des rustines insuffisantes aux yeux du rapporteur Philippe Latombe, comme celui-ci nous l’a indiqué dans une interview. L'élu MoDem compte bien déposer un amendement de suppression en séance.
En commission des finances, celle saisie au fond, une quarantaine d’amendements ont déjà été déposés. Plusieurs groupes minoritaires réclament la suppression pure et simple de cet article.
Les groupes non majoritaires souhaitent la suppression de l'article 57
« Le fait que les données soient accessibles sur internet ne signifie nullement qu’elles puissent être librement aspirées dans un but autre que celui dans lequel ces données ont été publiées » indiquent par exemple des députés Les Républicains (amendement CF1273). « Les données publiées par des tiers seront également aspirées. Les big data de l’administration fiscale ne contiendront donc pas seulement les données que nous choisissons de publier, mais aussi ce que d’autres publient sur nous ».
Même position au Parti socialiste : « Si les députés socialistes et apparentés sont favorables aux mesures de lutte contre les comportements frauduleux, certaines garanties fondamentales doivent être apportées aux contribuables ». Et celui-ci de considérer que le compte n’y est pas.
La France Insoumise note par ailleurs « l’ironie qui réside dans l'assujettissement des utilisateurs de plateformes à ce dispositif, quand on sait combien des entreprises telles que Facebook maîtrisent l’art d’échapper à l’impôt ». Ainsi, « plutôt que d’utiliser les réseaux sociaux pour traquer leurs utilisateurs, commençons par faire payer à ces entreprises l’impôt dû ». Le groupe sollicite lui aussi la suppression de l'article 57.
Le groupe LREM à la manoeuvre
Le plus intéressant réside toutefois dans les amendements déposés par les députés de la République en Marche, et surtout le contexte en cours. Le gouvernement a fait savoir en fin de semaine dernière qu’il accepterait de lâcher du lest pour encadrer cette collecte. Il faut donc analyser ces colmatages sous ce prisme politique et stratégique.
« Nous souhaitons que l’objet de cet article 57 soit proportionné et assure un juste équilibre entre les moyens utilisés pour lutter contre la fraude et le respect des libertés » écrivent les élus du groupe LREM dans cet amendement. De ce souhait, ils en déduisent que sur les sites internet des opérateurs de réseaux sociaux et de vente en ligne, seules les informations « manifestement rendus publics par leurs utilisateurs » pourront être collectées.
L’expression n’est pas neutre. L'article 9 du Règlement général sur la protection des données l’utilise déjà lorsqu’il s’agit d’autoriser les traitements portant sur des données sensibles (origine raciale ou ethnique, opinions politiques, convictions religieuses ou philosophiques ou l'appartenance syndicale, données de santé ou concernant la vie sexuelle ou l'orientation sexuelle d'une personne).
Le même groupe LREM, comme Joël Giraud, le rapporteur général, entendent limiter les infractions pouvant justifier la collecte puis le traitement. « Nous proposons donc de recentrer l’expérimentation sur la lutte contre l’économie souterraine et la recherche des infractions aux règles de domiciliation des personnes physiques, soit des faits particulièrement graves et particulièrement difficiles à identifier avec des méthodes d’investigation traditionnelles, justifiant d’utiliser une méthode inédite de ciblage des enquêtes fiscales et douanières ».
Là encore, les mots sont pesés soigneusement, en référence à la jurisprudence de la Cour de justice de l’Union européenne, qui n’apprécie pas la surveillance de masse pour les menus larcins.
Dans le texte déposé par le gouvernement, le champ infractionnel est beaucoup plus vaste, trop vaste même aux yeux de la CNIL. Celle-ci avait observé en effet que « la mise en oeuvre d'une telle collecte, particulièrement intrusive, conduisant à la collecte d'un nombre très important de données, n'apparaît pas à ce stade précisément justifiée pour les infractions portant sur des contraventions de deuxième et troisième classe ».
Opinions religieuses, politiques, orientations sexuelles... supprimées dans les 5 jours
Le groupe majoritaire est également désireux de limiter la durée de conservation des informations collectées. Dans le texte initial, lorsqu’elles sont de nature à concourir à la constatation des infractions poursuivies, « les données collectées sont conservées pour une durée maximale d’un an à compter de leur collecte et sont détruites à l’issue de ce délai ».
Toutefois, « lorsqu’elles sont utilisées dans le cadre d'une procédure pénale, fiscale ou douanière, ces données peuvent être conservées jusqu’au terme de la procédure ».
Les autres données sont supprimées au bout de 30 jours.
L'amendement du groupe LREM introduit une période intermédiaire. Les données dites sensibles (opinions religieuses, syndicales, politiques, orientations sexuelles, etc.) et les autres données manifestement sans lien avec les infractions poursuivies devraient être supprimées dans les 5 jours après la collecte. « Les autres données devront être analysées au maximum dans un délai de trente jours et détruites si elles n’apparaissent pas pertinentes ». Ou bien conservées jusqu’à un an voire au-delà en cas d’ouverture d’une procédure.
Le rapporteur général souhaite pour sa part que seules les données « strictement nécessaires » soient conservées au-delà d’un délai de trente jours, « et non pas toutes les données "de nature à concourir" à la constatation d’un manquement fiscal ou d’une infraction douanière ».
Droits de la défense
Dans le CF1375, les députés LREM proposent que « les administrations fiscale et douanière ne puissent procéder à l’appréciation de la situation de la personne concernée sur le seul fondement d’un algorithme ». Ainsi, « les informations recueillies sur les réseaux sociaux devront être analysées par un service compétent et corroborées par d’autres sources de renseignements ».
C’est donc seulement dans le cadre d’une procédure de contrôle que ces données pourront être opposées à une personne. Les droits de la défense seront ainsi respectés. Après collecte et traitement où seul le droit d'accès est assuré.
Consécration de l'algorithme auto-apprenant
L’amendement CF1376 est sans doute le plus riche du lot. Le groupe majoritaire y donne de précieuses informations sur « Big Brother Bercy » – informations qui n’avaient pas été soufflées par l’étude d’impact, particulièrement peu bavarde sur cette collecte de masse. Et pour cause, elle n’en dit mot ou presque !
Leur texte instaure « un bilan d’étape dix-huit mois avant la fin de l’expérimentation afin d’en évaluer la progression et de déterminer la suite à lui donner ». On apprend dès lors que l’expérimentation comportera « une première phase dite d’apprentissage, au cours de laquelle un algorithme auto-apprenant sera développé afin de déterminer des indicateurs permettant de cibler les infractions visées par le dispositif, sur la base d’une base de données anonymisées ».
C'est la première fois que l'expression apparaît dans un amendement. Ceci dit, une fois cette phase achevée, viendra le possible passage en production avec « détection de profils susceptibles d’avoir commis » l’une des infractions visées :
« Il apparaît important d’évaluer cette phase d’apprentissage en elle-même avant que l’expérimentation passe en phase dite de production et puisse conduire à la détection de profils susceptibles d’avoir commis les infractions visées par le dispositif, afin que l’administration apporte des garanties sur le fait que l’algorithme développé minimise les atteintes portées au respect au droit à la vie privée des utilisateurs des opérateurs de plateformes en ligne ».
En clair, les députés ne sont pas bien certains de ce chantier, à moins qu'ils ne cherchent à en adoucir la montée en puissance en commandant un rapport aux principaux partisans de cette collecte de masse.
Au final, si l’outil est taillé pour traquer l’infraction fiscale ou douanière, le jeu de l’article 40 du Code de procédure pénale pourra jouer à plein régime pour étendre le champ des finalités. Comme le relève la juriste Estelle de Marco, il « impose aux fonctionnaires d'informer le procureur des délits dont ils ont connaissance (permettant de dépasser les objectifs pour lesquels des pouvoirs intrusifs ont été accordés) ».
Collecte de masse, algorithme auto-apprenant… quand le fisc s’échine
-
Les groupes non majoritaires souhaitent la suppression de l'article 57
-
Le groupe LREM à la manoeuvre
-
Opinions religieuses, politiques, orientations sexuelles... supprimées dans les 5 jours
-
Droits de la défense
-
Consécration de l'algorithme auto-apprenant
Commentaires (36)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 04/11/2019 à 21h40
Le 05/11/2019 à 08h04
Le 05/11/2019 à 08h23
Bon sinon concrètement il va se passer quoi avec cette loi ?
Les infos que les “pas trop futés” laissaient trainer sur les réseaux vont disparaître
Tout ce qui pouvait être utilisé en cas d’enquête ciblée ne le sera plus.
Bravo clap clap clap !
Ils vont donc à terme collecter massivement des données d’intérêt zéro pour l’objectif défini.
On assistera dans le même temps à une recrudescence de pseudo, de créations de comptes emails bidons et un usage intensif des VPN.
Honnêtement ceux qui magouillent vraiment, à mon avis et ce n’est que le mien, il y a longtemps qu’ils sont anonymisés au possible.
D’ailleurs qu’en est-il du dark net ?
Le 05/11/2019 à 08h34
Etant locataire la taxe foncière je la paye indirectement je parle uniquement de la taxe habitation. Et je ne suis pas de le seul (dans mon cercle) qui a eu le droit a cette jolie augmentation.
Le 05/11/2019 à 08h37
Le 05/11/2019 à 15h50
Le 05/11/2019 à 15h52
Le 05/11/2019 à 18h15
Et ou ça dit que c’est un impot sur le capital ? ( j’ai peut-être raté quelque chose)
Moi je ne vois qu’un impot sur le revenu , les hauts revenus , les gains
Mais pas sur le capital
Le 05/11/2019 à 18h23
Nan je ne t’en voudrai pas , on a le droit de ne pas avoir la même opinion" />
et parce que les pourcentages de hauts revenus sont très similaires au pourcentage de redevables ISF ce sont les même personnes ?
Ah bon ben moi les rares que je connais qui paient l’ISF (ou qui le payaient) n’étaient pas des hauts revenus et ne le sont toujours pas
Je connais même un non imposable, qui est revenu en France
Souviens toi de la célèbre phrase de la milliardaire Leona Helmsley au tribunal :
“We don’t pay taxes; only the little people pay taxes”
Le 05/11/2019 à 18h45
Le 04/11/2019 à 13h37
La CNIL (…) note aussi que Bercy et les douanes pourront alpaguer de nombreuses données personnelles comme les opinions politiques, syndicales, religieuses, les orientations sexuelles, etc. Au point d’influer sur la liberté d’expression et de communication de chaque internaute.
Je suis tout à fait d’accord avec cette phrase.
Cependant, si les internautes étaient réellement conscients de l’impact de ce genre de collecte ils arrêteraient aussi d’utiliser les réseaux sociaux qui font exactement la même chose " />
Le 04/11/2019 à 13h53
Franco-Français mais mis en place aux Etats-Unis par Roosevelt à l’occasion du New Deal suite à la crise financière de 1929 (taux à 90%).
Et plutôt efficace soit dit en passant.
Le 04/11/2019 à 14h00
On ne trouve rien de tel dans ton lien.
Je sais qu’à une époque il a existé aux États-Unis un tranche assez élevée d’impôt sur le revenu, mais je ne crois pas qu’il y ait eu quelque chose qui ressemble à notre ISF (qui de toute façon n’existe ni chez nos voisins, ni plus loin - encore une fois ça revient à imposer de l’argent déjà imposé, et le principe est normalement d’imposer les flux et pas les stocks).
Le 04/11/2019 à 14h14
Plus d’info ici en anglais. Faire une recherche sur Revenue Act si nécessaire.
Le 04/11/2019 à 14h42
Je me demande en quoi passer de “Opinions religieuses, politiques, orientations sexuelles conservées 30 jours” à “Opinions religieuses, politiques, orientations sexuelles conservées 5 jours” est rassurant… Même si la plupart des gens s’en foutent d’être fichés sur ces critères… C’est plus ça qui est inquiétant.
La seule avancée que je vois, c’est le droit à la défense. Désolant que ça n’ait pas été prévu dès le départ (ou alors je ne l’avais pas compris ainsi).
Sinon, même si c’est fait en interne, ils ont une idée du coût du stockage ? On parle bien de stocker les même données que “Facebook, Instagram, Dailymotion, YouTube, Twitter, eBay ou encore Leboncoin” ? Et cela dans un datacenter maîtrisé par Bercy (donc pas d’utilisation d’AWS ou autre). En plus du coût du développement de l’algorithme : ce n’est pas parce qu’on utilise un mot magique qu’un miracle va se produire, il ne va pas se créer tout seul. D’ailleurs on parle d’internaliser le stockage, ou bien tout ?
(désolé de commenter le sujet, je fais tâche dans la discussion)
Le 04/11/2019 à 14h46
Personne n’est revenu, y’a toujours autant de départ. C’est juste une perte fiscale.
La Croix avait fait un papier sur la fin de l’ISF et globalement :
- les petits redevables actifs étaient contents (profession libérale, petit chef d’entreprise, …) et ils ont épargnés mais c’était pas la cible car leur activité les retient en France.
Globalement rien a changé avec quelques milliards à trouver pour boucler le budget.
Mais c’est comme la taxe d’habitation, elle a été supprimée alors que pas grand monde ne demandait sa suppression. C’est un des rares impôts qui étaient compris :
et on l’a supprimée.
Après je ne vais pas être hypocrite, je suis content de ne plus la payer mais par contre je suis plus inquiet sur la façon dont on va nous la faire payer !!!
Le 04/11/2019 à 14h51
Ca devient la mode de tout faire ici pour que les commentaires n’aient pas de rapport avec le sujet ? " />
Le 04/11/2019 à 15h39
Le 04/11/2019 à 15h58
Au delà de la perte des libertés individuelles que je regrette.
je ne pleure pas si l’on retrouve les fraudeurs, maintenant je me demande toujours comment ils vont utiliser cela.
ma foi si on fait une photo dans le casino de monte carlo, ce n’est pas pour ça qu’on flambe
idem si on va devant un bel hotel (et même, on peut effectivement se payer une nuit à 1500 €, ça me ferait chier perso mais j’imagine que des gens avec des salaires moyens se paient un instant luxueux)
même pour quelqu’un de riche, il peut louer son yacht (ou le faire acheter par une société écran)
à part l’exemple de la ferrari pour un RSA/dealer. ou effectivement les multiples maisons à l’ile de ré ou marakech pour un millionnaire, j’ai du mal à voir dans quelle mesure ce sera efficace.
et puis honnêtement, les geeks savent ce qui est en train de se passer
bientôt ce sera dans la tribune, les experts en patrimoine vont bientôt dire à leurs clients d’arrêter de montrer leur fortune sur facebook (ce qui me semble logique)
bref je reste dubitatif sur l’efficacité (tant qu’on reste sur les données accessibles en public)
Le 04/11/2019 à 16h18
L’imposition sur le revenu de Johnny Halliday qui a passé plus de 6 mois en France selon Instgram ?
Le 04/11/2019 à 16h59
Le 04/11/2019 à 17h37
Le 04/11/2019 à 18h23
La CSG est aussi un impôt sur de l’argent déjà imposé !
Par contre, ça ne concerne que les manants, ceux qui ont des parts dans les sociétés et des actions passent à travers.
Sur le principe, ça me gêne pas que l’on impose deux fois, juste au cas où, les “riches”.
Après sur le fond, une remise à plat de la fiscalité est nécessaire, car on ne doit pas, normalement, payer deux fois sont impôt => consentement à l’impôt, égalité devant l’impôt tout ça.
Mais ce sont que des valeurs, avec lesquels les gouvernant s’arrangent bien souvent. Au profit des mêmes…
Le 04/11/2019 à 18h47
Le 04/11/2019 à 18h57
LR qui se fait le défenseur de la vie privée, ça ne manque pas de sel. Ils en disent quoi Ciotti, Estrosi et consorts?
Le 04/11/2019 à 19h24
C’est bien un impôt https://fr.m.wikipedia.org/wiki/Contribution_sociale_g%C3%A9n%C3%A9ralis%C3%A9e bon les deux.
Mais ça change rien que tu la paye deux fois.
Le 04/11/2019 à 08h05
Je me demande bien de quel ordre de grandeur ont parle niveau chiffre… Pendant ce temps la j’attends les résultat de la suppression de l’isf ou encore de “l’évasion fiscale” des grandes entreprise du gafa histoire de pouvoir comparer.
Quoi qu’il en sois une avant que ce mécanisme sois mis en place je prédis que beaucoup vont faire le ménage sur leur compte de réseaux sociaux et qu’ensuite ils s’abstiendront de poster ce genre de choses du coup j’ai l’impression que ce truc ne servira à rien.
Par contre élargissement des critères tend au fameux big brother alors que dans le même temps il y à des choses bien plus graves qui nous coutent chaque jours bien plus d’argent.
Le 04/11/2019 à 09h13
L’impact de la suppression de l’ISF est connu : perte sèche du revenu de l’ISF, aucun investissement en contre partie.
Le 04/11/2019 à 11h07
Si, si, il y a des contres-parties, un président c’est fait plein de copains riches…
Le 04/11/2019 à 12h20
Le 04/11/2019 à 13h06
D’abord je en vois pas bien le rapport entre la consommation des ménages les plus fortunés et le Syndrome de l’Ile de Ré, d’autant qu’il me semble que le patrimoine est toujours soumis à l’impôt (IFI)
Même le rapport officiel explique :
Si les données agrégées disponibles ne permettent pas de mettre en évidence un impact significatif des réformes de la fiscalité du capital sur le patrimoine des ménages et le financement des entreprises, on ne peut pas pour autant conclure à l’absence d’effet.
Le 04/11/2019 à 13h16
Je n’ai pas parlé de la consommation des ménages les plus fortunés mais de la consommation des ménages affectés par l’ISF ( et crois moi cela n’a rien à voir) et qui avaient quitté la France à cause de ça.
Et c’est bien pour ça qu’ils n’arrivent pas à le quantifier correctement.
Le 04/11/2019 à 13h28
Tu ne m’en veux pas si je ne te crois pas ?
(toujours le même rapport)
Les plus hauts revenus déclarent donc plus souvent que les autres contribuables des revenus financiers, fonciers, ou encore un patrimoine taxable à l’ISF. La distribution par quantiles de revenus des foyers à hauts revenus financiers et redevables ISF est remarquablement proche : pour les neuf premiers déciles de revenu, moins de 5 % sont dans l’un de ces cas. La proportion de foyers ISF et celle de foyers à hauts revenus financiers s’élève à 20 % environ à partir du dernier centile de revenus, dépasse les 50 % au sein des 0,1 % des foyers très aisés, pour atteindre les 75 % au sein des plus aisés, c’ est-à-dire les 3 800 foyers constituant le top 0,01 %.
Le 04/11/2019 à 13h31
Concernant l’ironie dans le chapitre dédié à l’algorithme on comprend a demi mot le peu de maitrise sur le sujet. " />
En fait c’est une méthode couramment utilisée quand on souhaite développer un algorithme: on prend la totalité des variables à disposition et on teste les corrélations qui peuvent exister entre elles, et entre elles et le résultat attendu (ici une infraction).
Ce sont des statistiques de base dont le but est de limiter au maximum le nombre de données à collecter. Ce qui du coup va à l’opposé de la théorie du moissonnage aveugle des données.
L’intérêt du coup aurait plutôt était de demander si les données collectées allaient se restreindre dans un second temps uniquement au données d’intérêt. Ensuite suivant la réponse on aurait pu ou pas parler de moissonnage aveugle (ou de Big Brother).
Le 04/11/2019 à 13h33
" />
L’ISF, cet impôt franco-français auxquels certains tiennent… Alors que c’est un impôt sur de l’argent déjà imposé, en plus des effets pervers connus (dont le coût de collecte et de contrôle). C’est bien connu, les riches c’est des méchants et leur argent nous appartient. " />
(effectivement, la plupart plupart des pro-ISF semblent ignorer que ça existe toujours sous forme d’IFI)
Le 04/11/2019 à 13h34