Connexion
Abonnez-vous

Les données des Centres de prévention des maladies américains sauvées via Internet Archive

CDCD

Les données des Centres de prévention des maladies américains sauvées via Internet Archive

Le site de la principale agence états-unienne en matière de protection de la santé publique, la CDC, a été temporairement dépublié, puis remis en ligne sans certaines de ses pages. L'ancienne version a été en partie sauvegardée, notamment via Internet Archive. Des chercheurs et ingénieurs essayent d'indexer correctement cette archive essentielle.

Le 07 février à 16h27

À la fin du mois de janvier, plusieurs sites d'agences américaines ont été soit complètement dépubliés soit purgés des sujets bannis par un décret de Donald Trump, comme les informations sur le genre ou la transidentité.

Un mémo [PDF] envoyé le 29 janvier par l'Office of Personnel Management (OPM, l'agence des ressources humaines des employés fédéraux américains) donnait 48 h aux agences pour, entre autres, « supprimer tous les médias tournés vers l'extérieur (sites web, comptes de médias sociaux, etc.) qui inculquent ou promeuvent l'idéologie du genre » et envoyer un email à tous leurs employés indiquant qu'elles appliqueraient le décret de Donald Trump.

Comme nous l'évoquions lundi 3 février, le site des Centres de contrôle et la prévention des maladies (Centers for Disease Control and Prevention, CDC), la principale agence fédérale en matière de protection de la santé publique, a notamment subi la suppression de nombreuses pages web, dont celles qui évoquaient les LGBT.

Des données précieuses supprimées

Par exemple, la page du « social vulnerability Index ». Des chercheurs rassemblaient à cet endroit des données sur la vulnérabilité sociale, c'est-à-dire les facteurs démographiques et socio-économiques qui sont à prendre en compte dans le stress dû à des événements comme des catastrophes, naturelles ou d'origine humaine, ou des épidémies.

Parfois les pages ont été remises en ligne. Par exemple, la partie du site du CDC accueillant des informations sur les comportements à risque des jeunes avec une partie importante sur les LGBTQ, le Youth Risk Behavior Surveillance System (YRBSS), n'était plus accessible du 31 janvier (date à laquelle Science a publié un article) au 3 février (date de notre article). Mais il est actuellement de nouveau accessible. Pour autant, on ne sait pas vraiment ce qui y a été supprimé entre temps.

Mais le site du CDC n'abrite pas que des pages web : c'était aussi un dépôt de données de santé important. Celui-ci avait disparu avec le site et est réapparu dernièrement, sans qu'on sache non plus ce qui y a été enlevé. Comme le reste du site, un bandeau le surplombe avec le message « Le site web du CDC est en cours de modification pour se conformer aux décrets du président Trump ».

L'association des journalistes de santé (Association of Health Care Journalists) a protesté contre la suppression de données publiques « essentielles » du site web du CDC et se dit préoccupée par la mise en œuvre des décrets de Donald Trump :

« À l'heure où l'augmentation des maladies chroniques et des comportements nocifs chez les jeunes est une priorité nationale, les données de l'YRBBS sur le tabagisme, le vapotage, la consommation d'alcool, l'alimentation, l'exercice physique et le comportement sexuel sont cruciales pour les journalistes qui tentent d'informer le public sur ces questions. Les données de l'indice de vulnérabilité sociale au niveau du comté sont importantes pour informer sur la résilience des communautés et leur capacité à réagir face à des catastrophes telles que les incendies de forêt et les intempéries ».

Des chercheurs et ingénieurs s'organisent

Pour faire face à ces suppressions, des chercheurs, comme la virologue Angela Rasmussen, ont essayé d'archiver le plus possible les informations du CDC. Ils ont notamment utilisé les services d'Internet Archive pour y parvenir.

Les jeux de données du dépôt du CDC ont été archivés sur le site de l'organisation à but non lucratif le 31 janvier dernier par un utilisateur enregistré sous le pseudonyme SheWhoExists. Il contient 98,5 Go de données.

Plusieurs initiatives ont été lancées pour archiver les pages du site du CDC, toujours en utilisant Internet Archive. Le Boston Globe a, par exemple, développé un outil listant certaines des pages avec les liens vers les sauvegardes faites par Internet Archive.

Charles Gaba, un développeur web du Michigan a aussi lancé la sienne. Autodidacte, il est devenu expert des données de santé il y a plus de 10 ans. « Gaba a construit la source la plus fiable de données sur les inscriptions » à l'Obama Care Act, expliquait, en 2014, Vox en parlant de son site ACASignups.Net.

Cette fois, il a utilisé son site pour faire une indexation de toutes les pages récupérées par Internet Archive : 7 200 pages HTML individuelles qui étaient disponibles sur CDC.gov au 27 janvier 2025. Il précise cependant qu' « il est important de noter qu'il y aura probablement encore des liens brisés ci-dessous parce que Internet Archive n'a pas été en mesure de les refléter même avant la purge Trump/Musk, pour des raisons techniques quelconques ».

« C'est une question qui me préoccupe depuis le 6 novembre [le lendemain de l'élection présidentielle], et je regrette de ne pas avoir agi avant le 20 janvier [jour de l'investiture], car il est possible que certaines données essentielles aient déjà été discrètement purgées au cours de la première semaine, avant qu'il ne soit publiquement connu que c'était le cas », explique-t-il à nos confrères du média Michigan Advance. Il estime qu'une petite partie des documents ont été supprimés, mais fait remarquer que ça ne fait que deux semaines que Donald Trump est de nouveau au pouvoir.

« Il est également possible qu'ils aient modifié certaines des pages/données qui n'ont pas été purement et simplement supprimées… ou qu'ils le fassent à l'avenir. Tout cela fait qu'il est essentiel de préserver autant que possible les données », ajoute-t-il.

Donald Trump avait prévenu

Au Michigan Advance, l'urgentiste Rob Davidson a affirmé : « la purge des informations relatives à la santé sur les sites web du gouvernement fédéral est très préoccupante pour les médecins qui veulent que leurs patients aient accès à des informations fiables fondées sur la médecine et non sur l'idéologie ».

Au média Salon, Charles Gaba fait remarquer qu'en tant que candidat, Donald Trump et le Project 2025 avaient promis de purger le gouvernement fédéral de « toute personne ou n'importe quoi » qu'ils considèrent comme lié à la diversité, à l'équité et à l'inclusion, et de purger les agences fédérales des références et des ressources qui s'y rapportent . « Toute personne attentive (bien trop peu, malheureusement) aurait dû savoir que cela inclurait également la suppression de quantités de données/ressources publiques, ce qui est l'équivalent numérique de l'incinération de livres », commente-t-il.

Commentaires (24)

votre avatar
La NASA a également fait le ménage de ses données, mais j'ignore s'il y a eu une sauvegarde cette fois-ci.
Voir les scientifiques se plier aussi complaisamment à de tels ordres est déprimant...
votre avatar
Je comprends pas trop: comment ils ont pu supprimer des données de tous les backup, archives, replica, etc...
Si je devais supprimer un fichier en particulier de la prod, ok facile. Mais de tous les backups depuis des jours / mois / années ? c'est un travail de fou...
votre avatar
Quand t'as tous les droits, c'est pas forcément si compliqué, malheureusement...
Et là, il edt possible que led backups aient été gardés pour l'instant, car c'est pas l'urgence : elles seront supprimées automatiquement/naturellement ou manuellement plus tard.
votre avatar
En même temps, si t'as pas le choix...
Dans un pays autoritaire, c'est ferme la ou disparaît.
votre avatar
Les salariés n’ont pas eu le choix et retrouver du boulot dans certains secteurs n’est pas facile.

On n’est pas du tout à l’abris de ce genre de chiffres en France si l’extrême droite passe. Ils ont déjà annoncé vouloir faire du ménage.

Et même un gouvernement « démocratique » peut faire disparaître certaines données, genre les vraies valeurs de pollution ses plages… La vigilance des organismes non gouvernementaux est primordiale !
votre avatar
Il va falloir arrêter de croire que la science peut quoi que ce soit face à un régime autoritaire : ce sont des fonctionnaire publics assujettis à leur administration.
Les idées personnelles peuvent être différentes, des initiatives individuelles cachées peuvent avoir lieu, mais il ne peut pas y avoir un fonctionnement d'appareil administratif opposé au gouvernement, par nature.

Si une population suffisamment grande déclare son gouvernement illégitime et qu'elle n'a pas les moyens légaux de le retirer de son assise, alors on pourrait envisager une révolution… mais on parle de population, pas d'un groupe spécifique.

La science ne peut rien en elle-même face au pouvoir.
La politique n'est pas son royaume : c'est celui d'une Nation.

Ces trop grandes attentes faces aux scientifiques (et à l'"intelligence" en général) ne cacheraient-elles pas, en creux, une inaction citoyenne ?
votre avatar
la suppression de quantités de données/ressources publiques, ce qui est l'équivalent numérique de l'incinération de livres
Ah ! Je suis pas le seul à avoir pensé à 1933...
votre avatar
ou 1984 :windu:
votre avatar
Pareil. C'est donc à ça que ça ressemble, un autodafé moderne ...
votre avatar
Les débiles fascistes s'assurent qu'il ne puisse y avoir d'information contraire à leur DOGmE : logique, somme toute.

Pardon pour le jeu de lettres inique.
votre avatar
Trump apprend de ses erreurs: en 2020, il avait été humilié quand certains sites gouvernementaux avaient contredits son remède contre le Covid à base d'eau de javel.

Si cela se reproduisait en 2025, personne ne dirait rien...

Wait, mais vu que la météo va devenir aux ordres et ne dira plus rien sur les cyclones, vu que le CDC niera toute épidémie sur le sol US, vu que les embauches fédérales dans des domaines cruciaux ne se feront plus sur les compétences mais l'endoctrinement aux idées trumpettes...
Trump nous pond un plan Darwin (sélection naturelle) à l'échelle d'un pays. Bon il ne le fait pas exprès mais malheureusement le résultat ne va pas être beau à voir.
votre avatar
Le retrait US de l’OMS aura des répercussions mondiales, idem pour les autres organismes internationales.

Les USA participent à pas mal de recherches internationales sur tous les sujets, dont medicaux.

Penser que son action n’aura d’impact que sur les USA est au mieux naïf…
votre avatar
Eh bien il va falloir apprendre, et à vitesse grand V, à se passer des USA.

Sur le maximum de sujets. Voire tous.

(Après ça fait des années qu´on constate nos dépendances sans vraiment y faire quoi que ce soit. C´est au pied du mur... qu´on voit le mieux le mur. :mad2: )
votre avatar
ITER et le projet sur la fusion nucléaire risquent de souffrir aussi.
votre avatar
Tant mieux.
1. Ça ne fonctionnera pas avant des dizaines d’années (en production j’entends)
2. Si nous disposons d’une source d’énergie quasi inépuisable, c’est la fin de toute vie sur Terre
votre avatar
Iter c'est un projet de recherche, pas un projet industriel, le sens de "production" n'est pas le même que, par exemple, une centrale nucléaire.
votre avatar
Tu as raison, j’ai fait un raccourci : je parlais de la fusion nucléaire plus globalement et non d’ITER en particulier.
votre avatar
il me semble qu'il y a un petit sujet de grippe avicole/bovine (US)/mammifère (EU), a priori les contrôles douaniers ne sont pas super efficaces, c'est vraiment un moment bien choisi pour casser le thermomètre.
votre avatar
Les dégâts sont même plus large sur la même lignée.

La co-opération spatiale internationale est déjà au point mort après plusieurs années de radicalisation de positions nationalistes, sur fond de discours populiste encourageant la colère et le nombrilisme.

La science en co-opération internationale est clairement remise en question dans son ensemble.

Cela commence par la perte de liens, la perte du partage libre et non-baisé de connaissances factuelles, de méthodologies de travail communes, de relectures dans la confiance d'un objectif partagé commun…
Ceux qui valorisent cela et en voient les bienfaits savent que c'est perdant-perdant… et les débiles jubilent en creusant notre fosse commune à tous.
votre avatar
Oui, souhaiter le mal c'est mal, mais la nature fait bien les choses.
Que les ignares prennent le pouvoir, et les conditions climatiques et/ou un virus se fera un plaisir de balayer tout ça.
Si l'intelligence collective n'est plus, alors laissons faire la sélection naturelle 😅

Et ça s'applique à l'espèce humaine en général.
votre avatar
A oui, donc les données vont revenir, mais avec une conclusion disant que la javel en intraveineuse guérit tout? L'eau Miracle de Trump?
votre avatar
votre avatar
Quand ils ont annoncé que des données disparaissaient il y a quelques jours, l'image correspondant à la dernière phrase m'est effectivement immédiatement revenue en tête.
Ok, c'était peut-être celle du film Indiana Jones, mais c'est bien le bon évènement et ça m'a secoué.

Après, j'ai lu que Bush Junior avait fait de même visiblement.
votre avatar
Pour ceux qui ne parlent pas le binaire en seconde langue vivante, 0101 0110 0100 1111 0101 0100 0100 0101 en binaire ça donne 564F 5445 en héxadécimal soit en conversion ASCII "VOTE"

Merci Flock ^^

Les données des Centres de prévention des maladies américains sauvées via Internet Archive

  • Des données précieuses supprimées

  • Des chercheurs et ingénieurs s'organisent

  • Donald Trump avait prévenu

Fermer