Connexion
Abonnez-vous

Comment l’IA générative pourrait améliorer le triage des patients aux urgences

Intelligence artificielle, conséquences réelles

Comment l’IA générative pourrait améliorer le triage des patients aux urgences

L’intelligence artificielle reproduit les biais humains, puisqu’elle est généralement entrainée sur des données biaisées. Mais l’IA peut aussi servir à mesurer et essayer de contrer les biais humains. Des chercheurs expliquent « comment l’IA générative pourrait aider à améliorer la prise en charge » des patients aux urgences.

Le 21 février à 10h34

L’Institut national de la santé et de la recherche médicale (Inserm) revient sur une étude publiée dans Proceedings of Machine Learning Research (PMLR). Elle est signée par des chercheurs de l’université de Bordeaux, qui se sont basés sur des données du CHU du chef-lieu de la Nouvelle-Aquitaine.

Des biais pendant le triage aux urgences de l’hôpital

L’Inserm explique, en guise d’introduction, que « les biais cognitifs humains peuvent particulièrement impacter la prise de décision lorsque celle-ci doit être rapide, en particulier lorsqu’elle présente un enjeu vital, comme lors de la prise en charge médicale aux urgences par exemple ». L’Institut ajoute que « les nouveaux algorithmes d’IA générative peuvent être mis à profit pour identifier et comprendre les biais cognitifs humains ».

Ce dont parle l’étude du jour sont des « raccourcis cognitifs » qui arrivent lorsque des personnes doivent se former une opinion ou prendre une décision « à partir d’une information incomplète ou peu nuancée ». Les biais sont toujours un peu les mêmes dans ce genre de situation – sexe/genre, l’âge, l’ethnie… – « et conduire à sous-estimer ou à surestimer la sévérité de l’état d’une personne ».

Les chercheurs ont voulu identifier ces biais et voir comment ils pouvaient diminuer leur impact. Ils ont pour cela utilisé une intelligence artificielle générative, sur un cas précis : le triage des patients aux urgences médicales. Pour une fois, elle ne va pas reproduire les biais des humains, mais au contraire tenter de les identifier.

Un enjeu doublement critique

L’équipe de recherche était dirigée par Emmanuel Lagarde (directeur de recherche Inserm). L’enjeu du triage aux urgences peut être critique : « la sous-estimation d’une urgence qui reporterait la prise en charge peut entraîner la dégradation du pronostic d’un patient. A contrario, surestimer la gravité de l’état de la personne peut entraîner une surutilisation de ressources qui peut être particulièrement préjudiciable en cas d’affluence forte ».

La première phase de l’opération est classique : entraîner l’intelligence artificielle à trier les patients arrivant aux urgences en se basant sur leur dossier, « reproduisant ainsi les éventuels biais cognitifs du personnel infirmier en charge de ce triage ». 480 000 entrées aux urgences du CHU de Bordeaux (entre janvier 2013 et décembre 2021) ont ainsi été analysées.

Les données disponibles

Les données comprennent notamment la date et heure l'admission, le sexe du patient, le motif d’arrivée aux urgences, l'historique et les antécédents médicaux, des signes vitaux (fréquence cardiaque, fréquence respiratoire et pression artérielle, entre autres) ainsi que le score de triage associé.

On retrouve également des informations relatives au personnel soignant au triage, notamment leur sexe, le nombre d'années d'expérience et s’ils ont reçu une formation spécialisée. Un exemple est donné :

Une IA évalue les patients « comme le ferait le soignant »

Une fois la phase d’apprentissage terminé, le modèle (un LLM de « taille moyenne ») était donc capable d’évaluer la sévérité de l’état du patient, « comme le ferait le soignant ».

Les chercheurs expliquent avoir testé Mistral 7B, BioMistral 7B Labrak, Mixtral 8x7B 3 et Llama 3 8B. Selon la publication scientifique, « Mistral 7B et Llama 3 8B sont capables d'imiter le triage d'urgence humain avec une précision satisfaisante ».

L’IA refait les calculs sur des dossiers « maquillés »

La seconde phase peut alors commencer : le dossier est « maquillé » en modifiant le genre du patient. Le modèle attribuait alors un nouveau score de sévérité. La différence entre les deux scores permet d’estimer le biais cognitif dû au genre.

Le résultat ne devrait pas surprendre grand monde :

« Les résultats ont montré un biais significatif de l’IA au détriment des femmes : à dossiers cliniques identiques, la sévérité de leur état avait tendance à être sous-évaluée par rapport à celle des hommes (environ 5 % étaient classées « moins critiques » tandis que 1,81 % étaient classées comme « plus critiques »). A contrario, la sévérité de l’état des hommes avait tendance à être légèrement surévaluée (« plus critiques » pour 3,7 % contre 2,9 % « moins critiques ») ».

D’autres conclusions intéressantes émanent de cette étude : « Ce biais est plus prononcé chez les infirmières ou lorsque les patients signalent des niveaux de douleur plus élevés, mais il diminue avec l’expérience du personnel soignant ».

Les chercheurs en arrivent à la conclusion que « les grands modèles de langage peuvent aider à détecter et à anticiper les biais cognitifs humains », c’est en tout cas ce qu’affirme Emmanuel Lagarde. Et s’ils y arrivent si bien, c’est qu’ils « sont capables d’identifier et de reproduire les biais qui guident la prise de décision humaine », ajoute Ariel Guerra-Adames, doctorant et premier auteur des travaux.

Ce n’est que le début, d’autres biais à analyser

Ce n’est que la première étape de l’étude, la suivante portera sur d’autres biais comme l’âge et le groupe ethnique des patients. « À terme, le système devrait également être affiné avec l’introduction de variables non verbales (expressions faciales, ton de la voix) qui n’apparaissent pas nécessairement dans les données écrites et peuvent être pourtant critiques dans la prise de décision », précise l’Inserm.

Pour l’open source et la reproductivité de l’étude, on repassera. Les données ne sont pas partagées pour des questions de confidentialité des patients et de l’accord des chercheurs avec le CHU de Bordeaux, peut-on lire dans l’étude. « Même chose pour le code, car certains des principaux scripts contiennent également des informations sensibles ».

Ce n’est pas la première fois que l’intelligence artificielle générative trouve son utilité dans le domaine médical. Nous en parlions récemment sur Next.

Commentaires (33)

votre avatar
Il faudrait surtout plus de soignants et plus de médecins de familles disponibles.
votre avatar
Oui. Or, cela va dans le sens contraire.
votre avatar
Quand un médecin généraliste adresse son patient aux urgences que ces derniers ne le font pas sortir 3h après 😤
votre avatar
Dans le temps les médecins généralistes tenaient des permanences le week end, chacun leur tour.
votre avatar
Il existe parfois des maisons médicales de garde le week end en journée mais c'est blindé.
votre avatar
Ce système ne permet pas de corriger le biais le plus grave du triage aux urgences auquel j'ai été confronté : on ne trouve pas ce que tu as en 3 minutes, donc c'est sans doute psychosomatique. Allez hop, dehors.

Pour entraîner leur système efficacement, il ne faut pas que la décision d'un humain dans la même situation, il faudrait aussi connaître les suites histoire de détecter et corriger les erreurs qui ont été faites.
votre avatar
Il y a quand même très rarement du triage aux urgences, vu que ça ne s'applique qu'en cas de catastrophe ou de guerre.
votre avatar
Cadeau :
https://www.srlf.org/wp-content/uploads/2015/11/0211-Reanimation-Vol11-N7-p480_485.pdf
votre avatar
ça tombe bien, ils disent eux-même

"L’histoire et l’étymologie de triage sont intéressantes. Ce terme franglais, qu’on retrouve dans la littérature médicale internationale depuis les années 1970, vient du français « trier » et se réfère au cadre médical militaire français de la fin du XIe–début du XXe siècle [1]. Il visait à déterminer sur le champ de bataille les blessés pouvant être soignés de ceux qui devaient être laissés sur place."

où "laisser sur place" signifie qu'on n'essaiera même pas de les sauver.
votre avatar
Je suis désolé de te l'apprendre : nous ne sommes plus au début du XXème siècle. On va donc en rester à la définition actuelle du mot.
votre avatar
Définition que tu as trouvé dans quel dictionnaire ?

Par contre il y a des mots du dictionnaire qui conviennent très bien : tri et priorisation. Mais ça donne un ressenti plus économique, qui est le cas du triage moderne.
votre avatar
Trouvé dans ton post auquel je répondais. Il faut juste savoir de quoi on parle. Certes, triage a un sens particulier en médecine militaire. Mais il a aussi un sens particulier à la SNCF. Là, on ne parle ni de l'un, ni de l'autre.
votre avatar
Les résultats ont montré un biais significatif de l’IA au détriment des femmes : à dossiers cliniques identiques, la sévérité de leur état avait tendance à être sous-évaluée par rapport à celle des hommes
C'est parce que l'IA a été entrainé sur une pub pour Cofidis. Donc elle sait que les femmes sont plus résistantes que les hommes, alors qu'un homme ça crie de douleur à la moindre écharde dans le doigt.
votre avatar
J'aime beaucoup cette idée d'utilisation de l'IA, la faire réagir comme un humain et constater les biais.
votre avatar
J'ai pas compris en quoi le fait que l'IA ai un biais de 3,2% chez les femmes et 0,8% chez les hommes allait changer quoi que soit.

Surtout dans un contexte où on est littéralement en train de fermer les urgences, où il faut passer par le SAMU avant d'aller aux urgences et où le SAMU à littéralement 2h d'attente voir nous raccroche au nez. Où 11% des français n'ont pas de médecin traitant et où 62% des médecins traitants ne prennent plus de nouveau patient (en 2022, ca doit être encore pire aujourd'hui).

Ca sent tout de même le techno-solutionisme à plein nez....
votre avatar
Qu'est-ce qui what pourrait mal se wrong passer ?
votre avatar
J'ai du mal à comprendre pourquoi il faut une IA générative pour ce travail. Ça ressemble beaucoup à "Si le seul outil que vous avez est un marteau, vous verrez tout problème comme un clou.".
Je conçois bien qu'une IA peut aider aux urgences, mais pas le fait qu'elle soit générative.
votre avatar
"IA générative" devient un peu trop générique comme "IA". Les LLM (la techno ici utilisée dans l'étude) ne sont pas que des générateurs de texte, ils ont aussi des capacités de raisonnement étudier des documents, tirer des schémas et suggérer des résultats. C'est cette adaptabilité qui est utilisée ici, je pense.

On est dans un cas d'usage proche du robot conversationnel type hotline assurance par exemple : tu dis au robot que t'as un sinistre à déclarer, il va te demander la nature, se baser sur les données standard (les contrats type, etc) pour établir un dossier de base en fonction du sinistre (le bot ne posera pas les mêmes questions si c'est un pare choc embouti ou la fenêtre d'une maison cassée), puis ensuite transférer l'appel à un humain pour traitement personnalisé selon la couverture de l'assuré.

Si leurs résultats sont aussi probants sur des modèles obsolètes, je me demande que ça donnerait sur des plus récents.
votre avatar
Parce que si une IA n'est pas générative, c'est juste un arbre de décision qui a été précalculé "au mieux".
Bref, c'est le diagnostic différentiel qu'on fait déjà et qui se base sur des constantes/normalités. Et qui dit constantes/normalités, dit que c'est ce qui observé "en moyenne".

A mon sens, l'intérêt du "génératif" c'est de générer à chaque fois un nouveau raisonnement a partir d'un contexte qui est unique et spécifique au cas du patient.
votre avatar
Un algorithme implémentant des mathématiques complexes pour gérer les nombreuses variables, oui.
Par exemple un solveur. Peut-être un réseau de neurones si on sait les programmer, puis les entrainer (sans biais ! Retour à la case départ ?) pour résoudre des problèmes complexes (mais on perd en déterminisme, de toutes façons…).

Mais pourquoi "IA" ?
Et du coup pourquoi "IA générative" ? Ces bébêtes sont bonnes à produire du texte, pas à raisonner, ni faire des calculs…
votre avatar
Un réseau de neurones, c'est dans le champ de l'IA. Je pensais d'ailleurs à des techniques de ce type en écrivant mon commentaire plus haut.

On est d'accord sur l'aspect "IA générative".
votre avatar
Je pense que le "générative" ici, vient du fait que les modèles utilisés pour faire le diagnostic sont à la base des modèles de LLM génératifs (genre GPT/LLama&co...). En gros, il demande à une sorte de chatGPT tuné pour l'occasion de leur donner un diagnostic. Avec un modèle basé sur la réflexion, on peut même avoir un flux de pensé et avoir une idée du cheminement pour arriver à sa conclusion.
votre avatar
"Les résultats ont montré un biais significatif de l’IA au détriment des femmes : à dossiers cliniques identiques, la sévérité de leur état avait tendance à être sous-évaluée par rapport à celle des hommes (environ 5 % étaient classées « moins critiques » tandis que 1,81 % étaient classées comme « plus critiques »). A contrario, la sévérité de l’état des hommes avait tendance à être légèrement surévaluée"

:mrgreen::mrgreen::mdr::mdr:

https://secretnews.fr/accoucher-comprendre-souffrance-mari-rhume/
votre avatar
L;"IA" ayant ses propres biais ...
votre avatar
Quand on en arrive au triage (ce qui correspond à prioriser les gens qui peuvent survivre par rapport aux autres parce qu'il n'y a pas les capacités à soigner tout le monde), c'est qu'il y a déjà un problème que l'IA ne saurait résoudre.

Apparemment le terme a été dévoyé pour en faire un outil de rationalisation économique.
votre avatar
Même avec des moyens, il faut trier aux urgences pour traiter les urgences vitales avant les autres.
À cause de la difficulté à trouver un médecin rapidement, surtout en dehors des horaires habituels, la facilité est d'aller aux urgences. Ces cas là doivent passer après les vraies urgences. Une solution : premier arrivé premier examiné ne fonctionne pas aux urgences et c'est tant mieux.

Triage, ne veut pas dire ce que tu sous-entends : choisir ceux qui peuvent survivre. On n'est pas dans des choix de médecine de guerre, sauf éventuellement dans des cas extrêmes d'attentats ou de gros accidents où arrivent en même temps trop de blessés.
votre avatar
Historiquement, triage signifie choisir ceux qui peuvent survivre quand il n'y a pas assez de moyens pour s'occuper de tout le monde

fr.wikipedia.org Wikipedia

Le triage comprend bien sûr un ordre de priorité parmi ceux qui peuvent survivre, afin d'en sauver le plus possible.

D'ailleurs le terme triage est en anglicisme, même si les anglais ont utilisé notre verbe trier.
votre avatar
On se moque de l'historique. Quand je cite la médecine de guerre, j'y fais bien sûr allusion.

Le mot triage pour les urgences est défini dans la page de l'Inserm en lien :
Le triage aux urgences médicales consiste à classer les patients en fonction de la sévérité de leur état, afin d’optimiser l’ordre de prise en charge et ainsi de sauver un maximum de personnes. Il est réalisé par des personnels infirmiers dédiés qui, pour ce faire, collectent auprès de chaque malade différentes informations (raison de la visite, signes vitaux, historique médical…) et attribuent un score « d’urgence » selon une échelle validée.
D'ailleurs le terme triage est en anglicisme
N'inversons pas les choses. L'article Wikipédia que tu as mis en lien dit l'inverse :
Le terme triage (triage médical) est devenu un gallicisme en anglais médical, y compris sous la forme du verbe to triage au sens technique de trier les victimes dans un contexte de médecine militaire ou de médecine de catastrophe.
votre avatar
Dans mon cas c'était plutôt du genre ils te mettent 3h en attente dans le couloir parce qu'ils viennent de recevoir un gars qui s'était défenestré du comico et qu'ils estiment que tu vas survivre plus longtemps que lui.
:stress:
Bon, ils ont eu raison, j'ai survécu...
votre avatar
Le triage aux urgences a toujours existé, il ne s'agit pas de savoir si oui ou non tu vas être vu mais quelle va être ta position dans la file d'attente.

À moins d'avoir en permanence plus de médecins que de patients, on aura toujours besoin de faire ce tri.

Tu confonds tri et filtre.
votre avatar
j'ai la chance de ne pas avoir d'abonnement aux urgences, mais je n'avais entendu le terme "triage" que dans des séries (je comprend tout à fait la méthode aux urgences, mais n’aurai pas forcément associé le terme à la pratique "normale" de l'orientation en France), et dans des cas critiques ou forcément, 5 ambulances, 25 blessés, ceux qui n'ont aucune chance d'arriver à l’hôpital sont mis de coté avec ambulancier / morphine pour ne pas aggraver le bilan ...

du coup je comprend que si on parle de "triage" sans savoir que c'est le terme "standard", on puisse se dire que la situation est déjà très (trop) grave
votre avatar
Règlement (UE) 2024/1689 - AI Act
---
Considérant 58
... Enfin, les systèmes d’IA utilisés pour évaluer et hiérarchiser les appels d’urgence émis par des personnes physiques ou pour envoyer des services d’intervention d’urgence ou établir des priorités dans l’envoi de tels services, y compris la police, les pompiers et les secours, ainsi que dans l’utilisation des systèmes de tri des patients admis dans les services de santé d’urgence, devraient aussi être classés comme étant à haut risque car ils prennent des décisions dans des situations très critiques pour la vie, la santé et les biens des personnes.

---
Annexe III - Systèmes d'IA à haut risque visés à l'article 6, paragraphe 2

Item 5 - Accès et droit aux services privés essentiels et aux services publics et prestations sociales essentiels:
d) systèmes d'IA destinés à évaluer et hiérarchiser les appels d'urgence émanant de personnes physiques ou à être utilisés pour envoyer ou établir des priorités dans l'envoi des services d'intervention d'urgence, y compris par la police, les pompiers et l'assistance médicale, ainsi que pour les systèmes de tri des patients admis dans les services de santé d'urgence.

---
Chapitre III - Systèmes d'IA à haut risque

Article 6 - Règles relatives à la classification de systèmes d’IA comme systèmes à haut risque

1. Un système d’IA mis sur le marché ou mis en service, qu’il soit ou non indépendant des produits visés aux points a) et b), est considéré comme étant à haut risque lorsque les deux conditions suivantes sont remplies:

a) le système d’IA est destiné à être utilisé comme composant de sécurité d’un produit couvert par la législation d’harmonisation de l’Union dont la liste figure à l’annexe I, ou le système d’IA constitue lui-même un tel produit;

b) le produit dont le composant de sécurité visé au point a) est le système d’IA, ou le système d’IA lui-même en tant que produit, est soumis à une évaluation de conformité par un tiers en vue de la mise sur le marché ou de la mise en service de ce produit conformément à la législation d’harmonisation de l’Union dont la liste figure à l’annexe I.

2. Outre les systèmes d’IA à haut risque visés au paragraphe 1, les systèmes d’IA visés à l’annexe III sont considérés comme étant à haut risque.

---
Au delà des requis du règlement (UE) 2024/1689, personnellement, je choisirais une IA décisionnelle pour une application de triage de patient et non pas une IA générative ; cf. "a fool with a tool remains a fool".
votre avatar
Du coup on laisse l'infirmière d'accueil faire son tri avec ses propres biais, puis on applique le ratio +x% pour les femmes pour équilibrer le biais. y'a besoin d'un IA pour ça ? un simple tableur devrait suffire non ?

Comment l’IA générative pourrait améliorer le triage des patients aux urgences

  • Des biais pendant le triage aux urgences de l’hôpital

  • Un enjeu doublement critique

  • Les données disponibles

  • Une IA évalue les patients « comme le ferait le soignant »

  • L’IA refait les calculs sur des dossiers « maquillés »

  • Ce n’est que le début, d’autres biais à analyser

Fermer