Doctolib réfute livrer « les infos de ses utilisateurs » aux grands acteurs de l’IA
Les promesses n'engagent que ceux qui y croient
Illustration : Flock
Le 04 juin à 17h20
Le Canard enchaîné a révélé dans son édition du 2 juin 2026 que Doctolib livrait « les infos de ses utilisateurs à des géants américains de l’IA » et que ces données servaient l’entraînement des grands modèles de langage d’acteurs tels que Microsoft, Anthropic ou Google. Contactée par Next, l’entreprise dément fermement ces allégations. Le volume de prestataires sur lequel s’appuie Doctolib peut toutefois légitimement interroger.
Doctolib réfute livrer « les infos de ses utilisateurs » aux grands acteurs de l’IA
Les promesses n'engagent que ceux qui y croient
Illustration : Flock
Le Canard enchaîné a révélé dans son édition du 2 juin 2026 que Doctolib livrait « les infos de ses utilisateurs à des géants américains de l’IA » et que ces données servaient l’entraînement des grands modèles de langage d’acteurs tels que Microsoft, Anthropic ou Google. Contactée par Next, l’entreprise dément fermement ces allégations. Le volume de prestataires sur lequel s’appuie Doctolib peut toutefois légitimement interroger.
Droit
Droit
7 min
Coup de palme à la carotide. Le Canard s’est fendu, dans son édition du 2 juin 2026, d’un article au vitriol au sujet de Doctolib, le poids lourd des services numériques dédiés aux professionnels de santé. Il y affirme notamment que la licorne française « transmet la plupart de ses informations à Google, Microsoft et Anthropic, pour entraîner ses propres modèles d’intelligence artificielle ».
Le Canard évoque notamment la nouvelle offre d’assistant virtuel à la consultation, commercialisée depuis 2024 par Doctolib auprès des professionnels de santé. Cet assistant de consultation, qui figure effectivement au catalogue de l’éditeur, est chargé d’écouter la consultation, après information du patient, et de prendre des notes à la place du praticien, pour ensuite générer de façon autonome compte-rendus et courriers médicaux.
Des données personnelles utilisées à des fins d’entraînement ?
Sur son site commercial, Doctolib affirme que l’ensemble des données associées à ce service « sont hébergées sur des serveurs basés dans l’Union Européenne, certifiés Hébergement de Données de Santé (HDS) ». Ce qui ne convainc pas le palmipède :
« Sauf que ces notes, à en croire la politique de protection des données de l’entreprise, entraînent les modèles d’intelligence artificielle eux-mêmes coachés par Google (Gemini), Anthropic (Claude) et Microsoft (Copilot). Carton rouge ! Même si ces mastodontes stockent leurs datas dans l’Union européenne, la justice américaine peut les forcer à les transmettre outre-Atlantique, ce que Doctolib omet de préciser », écrit le Canard.
Nous avons à notre tour épluché les différents documents contractuels de Doctolib pour tenter de voir plus clairement de quoi il retourne, dans une version Web native ou sous forme de PDF en date de mars 2026. Microsoft, Google et Anthropic apparaissent effectivement au chapitre des « sous-traitants ultérieurs », définis comme des prestataires susceptibles d’avoir accès à des données personnelles collectées par Doctolib à des fins de traitement spécifiques.
Le tableau en question liste plusieurs prestataires spécialisés dans le support client, le marketing ou l’hébergement. Il affiche également une rubrique Autres dans laquelle figurent Microsoft Azure, Anthropic et Google Irlande, à la fois pour l’IA générative Gemini et pour l’outil d’annuaire Google My Business.
Si le service concerné (« fourniture du modèle de LLM ») est explicite, qu’en est-il de la finalité réelle, présentée comme « Analyse et création de contenu à des fins d’automatisation de tâches » ?
Doctolib réfute et avance une protection contractuelle
Contacté par Next, un porte-parole de Doctolib répond que ces deux intitulés « désignent concrètement l’utilisation de leurs modèles pour faire fonctionner des fonctionnalités produit, comme la transcription et la synthèse des consultations médicales, ou l’automatisation de certaines tâches internes ».
Dit autrement, Doctolib exploite donc au moins partiellement des LLM états-uniens dans la production de ses services d’assistance. Est-ce à dire que Google ou Anthropic peuvent entraîner leurs modèles sur les notes médicales concernées ? L’entreprise réfute catégoriquement :
« Les notes de consultation n’entraînent pas leurs modèles d’intelligence artificielle. Ces sociétés interviennent comme prestataires techniques, sur nos seules instructions et dans un cadre contractuel strict qui leur interdit de conserver ou d’exploiter les données pour leur propre compte, et en particulier d’en nourrir leurs propres modèles ».
En réponse au Canard, qui évoque dans son article la question de la portée extraterritoriale de certaines lois états-uniennes – « Même si ces mastodontes stockent leurs datas dans l’Union européenne, la justice américaine peut les forcer à les transmettre outre-Atlantique, ce que Doctolib omet de préciser » – Doctolib nous assure que « les données médicales des patients sont hébergées exclusivement en France et en Allemagne, chiffrées en permanence au repos et en transit ». Même en cas de transfert, les données seraient donc inexploitables, estime l’entreprise, qui stocke ses clés chez Evidian (Atos).
Doctolib admet que certaines données peuvent tout de même servir à des fins d’entraînement, mais l’usage serait limité à l’amélioration de ses « propres modèles », uniquement si le praticien l’a autorisé ou si le patient a consenti. « Cette autorisation comme ce consentement sont demandés séparément, peuvent être retirés à tout moment, et ne donnent en aucun cas aux prestataires le droit d’utiliser ces données pour leurs propres modèles » affirme à ce sujet l’entreprise.
Si certaines données ou notes médicales transitent bien par les serveurs d’Anthropic et de Google à des fins d’inférence, leur non-utilisation par les entreprises concernées serait donc verrouillée contractuellement.
Un détour par les conditions d’utilisation de la startup spécialisée Nabla, qui fournit elle aussi des services de transcription et de synthèse via LLM, révèle d’ailleurs une situation comparable. Sur son site, l’entreprise garantit l’absence totale de « réutilisation des données pour entraîner les modèles », alors qu’une partie de ses traitements est, d’après son propre accord sur la protection des données, réalisée par des modèles tiers sur des serveurs Microsoft.
En définitive, il faudrait donc avoir confiance en la qualité de la relation contractuelle établie entre ces prestataires du monde de la santé et les grands noms de l’intelligence artificielle.
Extension du domaine de la donnée
Du côté du Canard, cette confiance semble entachée par deux circonstances aggravantes. D’abord, une démarche active de lobbying qui aurait motivé 500 000 euros de dépenses en direct en 2025 pour « promouvoir une politique de l’hébergement, de la protection et de la portabilité des données favorable à l’activité de Doctolib » auprès de parlementaires français, cite l’hebdomadaire. Ensuite, une proximité implicitement taxée de connivence avec l’Élysée, dont le locataire et le patron de Doctolib seraient « copains comme cochons », selon le député Philippe Latombe, cité par le Canard.
D’un point de vue plus technique et sans préjuger de la robustesse de l’infrastructure mise en place par le leader de la réservation médicale, on pourrait s’alarmer de voir la longue liste de prestataires techniques amenés à intervenir sur certains éléments de données personnelles issus de la plateforme Doctolib.
Tout se veut bien sûr cloisonné, mais l’entreprise recense elle-même 33 scénarios de traitements externalisés sur les différents pans de son activité : la relation client chez Salesforce, l’hébergement des données de service chez AWS, les demandes de support chez Atlassian, l’automatisation de la transmission des flux de données chez Zapier, la BI chez Looker, la constitution de fiches des soignants à partir des sources publiques chez Reltio, etc. La fameuse licorne a été épinglée par deux enquêtes entre 2020 et 2021 pour son laxisme en matière de sécurité des données, même si elle s’est toujours défendue de tout manquement.
Commentaires (6)
Abonnez-vous pour prendre part au débat
Déjà abonné ou lecteur ? Se connecter
Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles d'un média expert
Profitez d'au moins 1 To de stockage pour vos sauvegardes
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousAujourd'hui à 17h41
Aujourd'hui à 17h58
Aujourd'hui à 18h26
Modifié il y a 23 minutes
Il y a 4 minutes
À l'instant
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?