Connexion
Abonnez-vous

Comment les médecins s’emparent de l’IA générative

Quelle est la capitale de Tamalou ?

Comment les médecins s’emparent de l’IA générative

L’intelligence artificielle n’a pas encore fait disparaître les radiologues. À l’heure du buzz autour de l’intelligence artificielle générative, les applications concrètes de ces technologies sont multiples en médecine, mais loin d’être prises en main par tout le monde.

Le 13 janvier à 09h10

« Dans l’idéal, je voudrais discuter avec le patient et que l’intelligence artificielle me structure le résumé des observations, voire qu’il y ait derrière une rédaction du courrier en fonction de ce que j’ai dit, une rédaction de l’arrêt de travail si besoin, la liste des besoins biologiques, etc ». Thomas Lafon est médecin généraliste, avec une grosse activité de dermatologie, et fondateur de Pictaderm, une société de télé-expertise dermatologique.

Friand de nouvelles technologies, il teste de nombreuses solutions intégrant de l’IA – « Nabla, Chat GPT, Thiana, Notebooklm » – pour fluidifier ses consultations et le travail administratif qui les entoure. De fait, il a le parfait profil des professionnels de la santé qu’un Doctolib, qui lançait en octobre 2024 son assistant de consultation boosté à l’IA générative, cherche à convaincre.

Outre la bien connue licorne française de la technologie en santé, Nabla, créée en 2018, la jeune pousse caennaise Thiana et de nombreux autres acteurs du secteur surfent sur la vague des grands modèles de langage, quand ils n’y nagent pas depuis plusieurs années. Nabla a, par exemple, commencé à tester GPT-3 en 2020, deux bonnes années avant que le grand public ne puisse s’emparer de Chat GPT, et lancé son Copilot en mars 2023.

Transition numérique toujours en cours

Quand on se plonge dans les statistiques, en revanche, l’usage de ces technologies n’a rien d’évident – pas plus que celui de technologies tout court, même pour les tâches les moins liées à la pratique médicales comme celles relatives au secrétariat.

En 2022, une étude de la Direction de la recherche, des études, de l’évaluation et des statistiques (Drees) constatait que 36 % des médecins généralistes utilisaient des outils comme Doctolib, Maiia ou Keldoc pour gérer la prise de rendez-vous, « le plus souvent en complément d’autres canaux de secrétariat ». Un autre tiers continuait de ne proposer que de la prise de rendez-vous sur place.

"Un médecin généraliste sur six assure lui-même son secrétariat en 2022", Études et Résultats, DREES, 2022

En 2024, les doctorantes en médecine Justine Magneval et Marion Beregi se sont penchées plus précisément sur l’usage d’IA en médecine générale. Constat initial : les logiciels utilisés par les praticiens sont légion, pour des pratiques plus ou moins spécifiques (gestion des dossiers médicaux, aide au diagnostic ou à la prescription de médicament, communication interprofessionnelle, outils de télémédecine, etc).

Cela dit, plus de la moitié des 401 personnes interrogées déclarent ne pas savoir si des technologies d’intelligence artificielle sont intégrées dans leurs outils ou non. 17 % déclarent utiliser de l’IA, principalement pour de la gestion des dossiers médicaux et de l’organisation des structures de soin. À l’inverse, 24 % se déclarent plutôt contre son usage, principalement par inquiétude, pour la qualité de la relation patient-médecin, et pour les enjeux éthiques que cela pose.

Auprès de Next, Justine Magneval constate aussi bien un intérêt pour ces technologies, « notamment chez les jeunes », qu’un manque de connaissance sur le sujet. Un constat peu étonnant, dans la mesure où la médecin indique que lors de sa formation, l’intelligence artificielle n’a « jamais été abordée ».

Radiologie, ophtalmologie : des spécialités précurseuses

Il est des spécialités, en revanche, où l’usage d’intelligence artificielle est plus porteur. En tête : la radiologie et l’ophtalmologie, dans lesquelles les systèmes algorithmiques de reconnaissance et de tri d’images ont vite démontré une efficacité réelle dans l’aide au diagnostic.

« Dans mon domaine, ça fait plus de 20 ans qu’on utilise de l’IA, témoigne le radiologue Radouane Mohammedi. Les procédés étaient peut-être moins fiables qu’aujourd’hui, mais les machines apportent une forme de stabilité. Même si la fiabilité des résultats tourne autour 80 % : moi, je n’ai pas 80 % de sensibilité toute l’année. »

Des outils comme IDx-DR, qui facilite la détection de la rétinopathie diabétique (maladie oculaire liée au diabète), Therapixel (spécialiste de l’imagerie médicale) ou Gleamer ont ainsi fait de l’IA un argument marketing autant que technique. Pour Radouane Mohammedi, l’intérêt est évident : « on a des volumes énormes à traiter. Gleamer ou Milviue, c’est très utilisé pour optimiser la performance de détection des lésions, dans les hôpitaux notamment. » De fait, Gleamer revendique commercialiser sa solution dans 2 000 hôpitaux dans 40 pays.

Et le chamboulement récent de l’IA générative ? Dans sa pratique, Radouane Mohammedi voit plutôt ce genre de technique servir une évolution récente, qui consiste à « partager les vocabulaires » entre spécialités, à proposer « des classifications communes » aux chirurgiens et aux radiologues, par exemple. En la matière, il cite KeyDiag, une autre solution de compte rendu médical spécialisée dans la radiologie, mais qui, là encore, utilise de l’IA pour produire simplement des documents standardisés.

Radouane Mohammedi balaie l’hypothèse avancée, en 2016, par le récent récipiendaire du prix Nobel de physique Geoffrey Hinton, selon laquelle les radiologues seraient rapidement remplacés par des machines : « Je suis médecin-radiologue. Si je reste médecin auprès du patient, je ne suis pas remplaçable. » Et de préciser que pour poser le diagnostic le plus précis, il y a besoin de tout un échange, « de discuter, d’obtenir le contexte que la personne peut me donner », que les machines ne traitent pas.

« À partir d’un certain âge, l’IA détectera plein de petites anomalies, illustre-t-il encore. Très bien, sauf que ça ne sera pas pour celles-ci que la personne aura pris rendez-vous. Si vous n’avez pas le patient devant vous, vous ne faites pas un bon diagnostic. Si ces technologies m’aident à trouver plus de temps pour le patient, c’est super. »

Une question de temps

Dans le domaine médical, le temps est un enjeu crucial. Sur la question du cancer, une étude d’Ipsos pour la Fondation ARC relevait début 2024 que 90 % des médecins généralistes d’Auvergne-Rhône-Alpes déclaraient manquer de temps pour faire de la prévention, alors que 80 % estimaient qu’il s’agissait d’une priorité, dans leurs missions auprès des patients. Plus largement, avec des semaines de plus de 50 heures, nombreux sont les généralistes qui raccrochent et changent de métier, alors même que le pays manque de médecins.

Les fournisseurs de solutions technologiques, qui font du gain de temps un de leurs arguments marketing phares, l’ont bien compris. Sur son site, Nabla promet « 2 h de temps économisé par jour ». « De la sérénité, de la sérénité, de la sérénité », telle était la promesse martelée par Stanislas Niox-Chateau, PDG de Doctolib, lors du lancement de l’assistant intelligent de l’entreprise. Le but, promettait-il : « réduire au maximum [la] charge de travail » des soignants, « rendre le plus autonome possible vos patients ».

Les LLM, un tournant dans la continuité

En pratique, l’outil déployé mêle transcription complète de la consultation, synthèse du texte obtenu, codification de l’acte… L’entreprise utilisait déjà de « petits modèles de langues » auparavant, explique le directeur Data et IA de Doctolib Nacim Rahal à Next, mais elle a « vu le point d’inflexion en 2023 ». Pour créer son assistant, l’entreprise a donc mêlé différentes technologies existantes, souvent développées par Open AI.

Pour la reconnaissance vocale, Doctolib s’appuie ainsi sur Whisper, « finetuné », précise Nacim Rahal quand on s’inquiète des risques d’hallucination. Pour la génération de texte, elle utilise « de gros modèles de langues comme GPT 4o, servi par Azure en France et en Allemagne, pour générer des modèles structurés, puis de plus petits pour fine-tuner les résultats », et notamment pour les structurer en fonction des besoins des soignants. « Ceci dit, on explore aussi d’autres modèles, pour avoir les meilleurs résultats », précise le data scientist.

Pour entraîner le tout, les équipes de Doctolib se sont d’abord appuyées sur « de fausses consultations, pour mettre en place le système de validation, puis sur des données supplémentaires ». L’assistant a ensuite été beta testé « par des soignants et des patients, à qui on demandait explicitement le consentement pour collecter l’audio et les notes de consultations anonymisées ». Pour la transcription des échanges vers le texte, indique encore Nasim Rahal, l’entraînement du système s’est fait « sur un mélange de données réelles, fabriquées et synthétiques ».

Chez Gleamer, fondé en 2017, le cofondateur Christian Allouche explique de son côté travailler avec Google Cloud Platform et avoir rapidement testé les grands modèles disponibles « sur étagère ». Pour la solution principale Bone View, l’entrepreneur explique s’être initialement appuyé sur des modèles plus petits et précis : « on a travaillé trois ans avant de le mettre sur le marché ».

La transformation qui l’intéresse, avec les grands modèles de langue, est la possibilité de « pré-entraîner un modèle de fondation sur des données annotées et non-annotées ». Le modèle Dino de Meta, par exemple, fonctionne par self-supervised learning, c’est-à-dire « par détection de schémas (pattern) dans de grandes sommes de données non annotées ».

Pour Gleamer, ces évolutions techniques permettent d’obtenir une précision plus forte qu’avec les modèles précédents, « où il fallait nécessairement faire de l’entraînement supervisé », avant même de passer à l’étape d’affinage des résultats avec des radiologues. L’entreprise ne s’est pas moins construit un data lake de 12 millions d’examens annotés. Mais elle travaille désormais à modifier les backbones, « le premier réseau qui extrait les caractéristiques d’une image », de son modèle algorithmique, pour s’appuyer désormais sur des modèles de fondation, explique Christian Allouche.

Manque de données… de marché

Techniquement, les choses bougent. Côté utilisateurs, cela dit, la thèse de Justine Magneval et Marion Beregi le montre, l’intérêt de l’IA reste encore flou, voire lointain, pour une part non négligeable des soignants. Il en va de même de son coût, sur lequel les deux doctorantes soulignent une probable sous-évaluation.

« En cardiologie, on peut aller d’un Cardiologs qui propose un électrocardiogramme à 5 euros en ligne au coût très élevé d’un électrocardiogramme intelligent, si vous décidez de vous en équiper, on a aussi Nabla Copilot, qui reste gratuit pour le moment [en freemium, ndlr], Doctolib, dont certaines fonctionnalités ne sont accessibles qu’avec l’abonnement pro… Les coûts sont très variés, en réalité », explique Justine Magneval, « ce dont on manque, c’est d’une cartographie claire ».

Interrogée sur les nouvelles pistes que leur travail a ouvertes, Justine Magneval explique : « ce que je trouve intéressant, ce sont les enjeux de spécialités, en dermatologie, en oncologie, en cardiologie. Comment, en somme, ces technologies permettraient aux médecins généralistes d’intégrer des outils spécialisés dans leur pratique. »

Thomas Lafon, lui, continue de tester des outils, et forme même son assistante à l’usage de ChatGPT, « pour qu’elle rédige des courriers pré-faits, en fonction des pathologies. » Parmi les usages qu’il teste, il y a la création « de fiches d’information à destination du patient, pour qu’il dise en amont pourquoi il consulte, quels sont ses antécédents dermatologiques, et qu’ensuite, nous, on puisse structurer le tout avec de l’IA ». Ou encore le client mail, qui devait « pré-trier en fonction de l’urgence, voire prompter la réponse ». Celui-là n’a pas fonctionné.

Ce qui est certain, c’est que le plus gros frein qu'il a rencontré jusqu’ici était le manque d’intégration d’outils comme le Copilot de Nabla à son logiciel médical principal, Medistory. Or, ce dernier a annoncé travailler au déploiement de Loquii, un outil natif permettant de générer automatiquement les comptes rendus médicaux. « Ça, conclut-il, dès que je peux l’utiliser, je le fais ».

Commentaires (7)

votre avatar
J'ai bobola ;)
votre avatar
Je croyais que c'était : Malocu.
votre avatar
« À partir d’un certain âge, l’IA détectera plein de petites anomalies, illustre-t-il encore. Très bien, sauf que ça ne sera pas pour celles-ci que la personne aura pris rendez-vous. Si vous n’avez pas le patient devant vous, vous ne faites pas un bon diagnostic. Si ces technologies m’aident à trouver plus de temps pour le patient, c’est super. »
Peu importe le domaine, cela rappelle que l'IA ne peut pas remplacer un expert de celui-ci. Elle l'assistera, mais elle n'est pas autonome.
votre avatar
Et encore, parfois, elle pourrait lui donner de fausses pistes.
votre avatar
Sauf à travailler la transparence des ingrédients utilisé. Mais si c'est pour finalement devoir encore utiliser encore plus de temps pour repasser derrière, ça va être compliqué.
votre avatar
Au vu du témoignage cité dans la partie radiologie, la fiabilité ne semble pas particulièrement mauvaise.

Et l'expert doit savoir remettre en question le résultat de l'IA. Ça reste un outil, comme toujours. Si l'expert suit l'avis de l'IA sans le vérifier, ce n'est pas un expert mais une caisse enregistreuse. Je l'ai souvent répété ici, mais il faut considérer l'IA comme son stagiaire. Un stagiaire, c'est pas censé être autonome et ça fait des erreurs. Donc on contrôle son travail.

Une chose que l'IA ne sait pas reproduire, c'est le feeling de l'expérience. Ça, on le constate justement entre un junior et un expérimenté dans une discipline. Un défaut ou une erreur sautera plus vite aux yeux d'un senior que d'un débutant.

Tout est donc question d'esprit critique et de prise de recul quant aux résultats de l'outil.
votre avatar
perso je pense que au contraire une ia pourrait donner de nouvelles pistes au médecin car ils sont peut être expert dans leur domaine mais une maladie rare qu'il a peut vu une fois dans sa carrière sera très dure à être diagnostiquer et faire des dizaines d'expert pour s'entendre dire ba on ne sait pas ce que vous avez c'est très compliqué à vivre.
On peut faire apprendre à une ia tous les cas, tous les symptômes possible de chaque maladie même si il n'y a eu qu'un malade dans le monde avec cette forme de symptômes.
Même si on ne sait pas nommer la maladie car c'est actuellement une impasse diagnostique au moins ça permettrait de regrouper ensemble les patients atteins et donner plus de data aux chercheurs pour comprendre la maladie
J'espère en tout cas que ça va pouvoir donner des pistes de recherches pour les experts.

Comment les médecins s’emparent de l’IA générative

  • Transition numérique toujours en cours

  • Radiologie, ophtalmologie : des spécialités précurseuses

  • Une question de temps

  • Les LLM, un tournant dans la continuité

  • Manque de données… de marché

Fermer