IA et recrutement : un simple prénom peut pousser les modèles génératifs à la discrimination

SebGF Abonné

Le 13/03/2024 à 07h 44

#1

Problème, constate Bloomberg dans une enquête qui reproduit la méthodologie de travaux scientifiques sur la question : ChatGPT reproduit, voire amplifie des biais existants dans le monde hors ligne. Et lorsqu’on lui demande, à plusieurs reprises, de classer 1 000 CV, la machine tend à privilégier des prénoms caractéristiques de certains types de population.

Je veux pas être désagréable, mais à un moment il faut arrêter d'être con et considérer que ChatGPT peut tout faire. Ce n'est PAS un outil RH. Ce n'est PAS un système de recherche scientifique. Ce n'est PAS une divinité omnisciente qui sait tout et voit tout.

Un outil RH qui utiliserait de l'IA doit utiliser un modèle spécialisé et fine-tuned dans le domaine.

Je ne vois vraiment pas l'intérêt de ce genre de démonstration pour un usage aussi spécifique. Le GPT-3.5 / GPT-4 utilisé par ChatGPT est un modèle généraliste. Il est biaisé, c'est pas une nouveauté ça fait deux ans qu'on le répète et le démontre. Pire encore, ChatGPT possède un system prompt qui va forcément orienter sa façon de travailler et répondre. C'est le fonctionnement de base d'un LLM. A ma connaissance, ce system prompt n'est pas public, donc on ne sait pas comment ChatGPT est conditionné.

Le vrai problème, c'est de vouloir utiliser cet outil spécifiquement, et non un modèle LLM fine-tuned pour des cas d'usage particuliers. Rien qu'un entraînement sur une base de CV publics (du genre linkedin et tout le bordel) supprimant toute donnée personnelle (car ça n'a aucun intérêt pour le tri de CV pour du profil de candidat de mon point de vue, mais je peux me tromper n'étant pas RH) permettrait en théorie d'avoir un modèle capable de faire le taff. Dans tous les cas, je ne vois pas pourquoi le LLM devrait traiter de la donnée personnelle : c'est une information absolument inutile pour savoir sur Profil #234362 matche avec Offre #76576. Ce sont les compétences qu'on prend vérifier cela, pas les noms des personnes.

Surtout quand on dit à la fin :

OpenAI déclare interdire l’usage de ses technologies à des fins d’automatisation des processus de recrutement.

Faut vraiment arrêter de donner raison à Brassens et de chercher à démontrer que des outils qui ne sont pas fait pour certaines tâches n'y répondent pas. Je considère cette "étude" comme inutile personnellement, elle part d'un postulat faux.

psychopatt Abonné

Le 13/03/2024 à 08h 40

#1.1

D'accord avec toi sur le principe mais :

Une entreprise comme OpenAI vend d’ailleurs ChatGPT à des entreprises de divers secteurs, vantant les capacités de ses technologies pour des tâches aussi spécifiques, notamment en matière recrutement.

Si l'outil est effectivement vendu dans ce but, y'a un souci et c'est bien de le soulever.

anagrys Abonné

Le 13/03/2024 à 09h 32

#1.2

psychopatt

D'accord avec toi sur le principe mais :

Une entreprise comme OpenAI vend d’ailleurs ChatGPT à des entreprises de divers secteurs, vantant les capacités de ses technologies pour des tâches aussi spécifiques, notamment en matière recrutement.

Si l'outil est effectivement vendu dans ce but, y'a un souci et c'est bien de le soulever.

ta citation de l'article est à mettre en rapport avec celle que fait SebGF, issue du même article. Il y a une légère contradiction entre les deux affirmations.

psychopatt Abonné

Le 13/03/2024 à 09h 52

#1.3

anagrys

ta citation de l'article est à mettre en rapport avec celle que fait SebGF, issue du même article. Il y a une légère contradiction entre les deux affirmations.

En fait j'ai interprété cette conclusion comme une réaction d'OpenAI suite à l'étude, mais c'est vrai que ce n'est pas clair

SebGF Abonné

Le 13/03/2024 à 12h 57

#1.6

psychopatt

D'accord avec toi sur le principe mais :

Une entreprise comme OpenAI vend d’ailleurs ChatGPT à des entreprises de divers secteurs, vantant les capacités de ses technologies pour des tâches aussi spécifiques, notamment en matière recrutement.

Si l'outil est effectivement vendu dans ce but, y'a un souci et c'est bien de le soulever.

C'est contradictoire avec la phrase de fin dans ce cas.

Ils vendent la solution comme pouvant le faire ou bien l'interdisent dans les conditions d'usage ? Faudrait savoir.

psychopatt Abonné

Le 14/03/2024 à 10h 25

#1.12

SebGF

C'est contradictoire avec la phrase de fin dans ce cas.

Ils vendent la solution comme pouvant le faire ou bien l'interdisent dans les conditions d'usage ? Faudrait savoir.

J'ai finalement eu le temps d'aller voir les articles liés, la phrase de fin me semble être une traduction un poil approximative d'une phrase de l'article de Bloomberg, ici en gras :

OpenAI [...] sells the AI technology behind it to businesses that want to use it for specific tasks, including in HR and recruiting. (The company says it prohibits GPT from being used to make an automated hiring decision.)

Le mot clef est ici "décision" (devenu "processus" dans l'article de Next) : OpenAI vend un outil pour automatiser des parties du processus mais la décision finale d'embauche ne doit pas être automatisée via GPT. En gros "on vous mâche le boulot mais vous devez vérifier et décider", histoire de se dégager de toutes responsabilités.

Comme dans la pratique il y a de fortes chances que l'utilisateur de l'outil prenne le premier candidat sans plus fouiller que ça...

fred42 Abonné

Le 15/03/2024 à 01h 20

#1.13

psychopatt

J'ai finalement eu le temps d'aller voir les articles liés, la phrase de fin me semble être une traduction un poil approximative d'une phrase de l'article de Bloomberg, ici en gras :

OpenAI [...] sells the AI technology behind it to businesses that want to use it for specific tasks, including in HR and recruiting. (The company says it prohibits GPT from being used to make an automated hiring decision.)

Le mot clef est ici "décision" (devenu "processus" dans l'article de Next) : OpenAI vend un outil pour automatiser des parties du processus mais la décision finale d'embauche ne doit pas être automatisée via GPT. En gros "on vous mâche le boulot mais vous devez vérifier et décider", histoire de se dégager de toutes responsabilités.

Comme dans la pratique il y a de fortes chances que l'utilisateur de l'outil prenne le premier candidat sans plus fouiller que ça...

Comme dans la pratique il y a de fortes chances que l'utilisateur de l'outil prenne le premier candidat sans plus fouiller que ça...

Ça, je ne le pense pas. Je pense que l'outil va être utilisé pour éliminer beaucoup de candidats avant que les quelques-un restants soient traités par des humains. L'humain choisira parmi 4 ou 5 candidats qu'ils aura reçus.
Ce qui prend du temps dans un processus de recherche de candidats, c'est de lire les CV et de voir qu'ils ne conviennent pas.
Ayant été à un poste opérationnel (où je recrutais pas mal pour des postes en régie pour une grosse équipe, je recevais beaucoup de CV où l'acheteur avait déjà fait un premier tri mais bien insuffisant.
J'étais devenu spécialiste pour rejeter très vite un CV et j'ai lu que les recruteurs faisaient de même (on parle d'un temps moyen très court pour une lecture de CV) . Par contre, je passais parfois plus de temps sur d'autres CV avant de me rendre compte qu'ils ne me convenaient pas. Je ne sais pas si une IA aurait pu m'aider ici.
Je passais aussi pas mal de temps à recevoir les candidats.

fred42 Abonné

Le 13/03/2024 à 10h 52

#1.4

J'ajouterai que quand on lit leur méthodologie à la fin de l'article, leur test a été fait avec des profils quasi identiques sauf les noms prénoms.
C'est compréhensible pour tester s'il y a un biais sur ce point, mais, comme on sait qu'il y a un biais dans les GPT d'OpenAI, il est normal que le biais ressorte si c'est le seul critère qui varie, le reste du CV étant quasiment identique.

Comme tu le dis, il suffit de ne pas entrer les noms prénoms pour l'éviter en grande partie. Comme le dit l'article, il reste des biais raciaux sur d'autres éléments comme le lieu d'habitation ou les hobbies. Faut-il aussi supprimer ce genre d'informations alors qu'elles peuvent apporter des informations utiles aux recruteurs (IA ou humains) sur certains aspects des personnes, c'est plus difficile à dire. Par exemple, le lieu d'habitation peut permettre de savoir à quelle distance du lieu de travail elle habite et une sélection sur une distance limite (en fait, c'est plus le temps de transport et la fatigue liée au mode de transport qui peut jouer) peut être pertinente, mais dans ce cas, il faut bloquer l'utilisation de cette information pour d'autres choses (ou probablement plus facile : transformer la donnée en des informations non discriminantes : mode et temps de transport).

Enfin, oui, il faut utiliser un modèle spécialisé et pas généraliste pour ce genre de tâches. il restera probablement des biais liés à l'entraînement puisqu'il y a aussi des biais chez les RH humains, l'essentiel est qu'il y en ait le moins possible.

SebGF Abonné

Le 13/03/2024 à 13h 02

#1.7

fred42

J'ajouterai que quand on lit leur méthodologie à la fin de l'article, leur test a été fait avec des profils quasi identiques sauf les noms prénoms.
C'est compréhensible pour tester s'il y a un biais sur ce point, mais, comme on sait qu'il y a un biais dans les GPT d'OpenAI, il est normal que le biais ressorte si c'est le seul critère qui varie, le reste du CV étant quasiment identique.

Comme tu le dis, il suffit de ne pas entrer les noms prénoms pour l'éviter en grande partie. Comme le dit l'article, il reste des biais raciaux sur d'autres éléments comme le lieu d'habitation ou les hobbies. Faut-il aussi supprimer ce genre d'informations alors qu'elles peuvent apporter des informations utiles aux recruteurs (IA ou humains) sur certains aspects des personnes, c'est plus difficile à dire. Par exemple, le lieu d'habitation peut permettre de savoir à quelle distance du lieu de travail elle habite et une sélection sur une distance limite (en fait, c'est plus le temps de transport et la fatigue liée au mode de transport qui peut jouer) peut être pertinente, mais dans ce cas, il faut bloquer l'utilisation de cette information pour d'autres choses (ou probablement plus facile : transformer la donnée en des informations non discriminantes : mode et temps de transport).

Enfin, oui, il faut utiliser un modèle spécialisé et pas généraliste pour ce genre de tâches. il restera probablement des biais liés à l'entraînement puisqu'il y a aussi des biais chez les RH humains, l'essentiel est qu'il y en ait le moins possible.

L'info de localisation peut effectivement avoir du sens, surtout si le modèle doit prendre en compte cette donnée (ex : recrutement pour une antenne régionale opérée par un service RH centralisé, critère disant d'idéalement privilégier les candidatures proches).

Par contre, les infos du type nom, prénom, age, sexe, ont zéro intérêt dans le cas d'une classification automatisée de profils sur compétences. Puisque la compétence ne dépend pas de ces caractéristiques.

Ou alors il me manque une notion...

consommateurnumérique Abonné

Le 13/03/2024 à 12h 13

#1.5

Pour faire une analogie, ce n'est pas parce qu'on informe sur le fait que cuire un œuf au four micro-ondes le fait exploser, qu'on refuse la cuisson au micro-ondes. Bien au contraire.

Thorgalix_21 Abonné

Le 13/03/2024 à 15h 28

#1.8

Sur ces histoires de recrutement, j'ai écouté cet épisode de l'émission économique de France Culture : Heureux les beaux, ils seront recrutés.
Il n'y a pas d'IA mais bien des biais.

j34n-r0x0r

Le 13/03/2024 à 20h 42

#1.11

Thorgalix_21

Sur ces histoires de recrutement, j'ai écouté cet épisode de l'émission économique de France Culture : Heureux les beaux, ils seront recrutés.
Il n'y a pas d'IA mais bien des biais.

Ce n’est pas un drame vu que tout les goûts sont dans la nature et que le "beau" n’est pas universel , n’est ce pas ?

😇

vaneck Abonné

Le 13/03/2024 à 16h 05

#1.9

Il est indéniable que l'utilisation de modèles d'IA généralistes comme ChatGPT dans des domaines spécifiques comme le recrutement peut poser des défis en termes de biais et de pertinence. Cependant, il est crucial de reconnaître que ces technologies évoluent constamment et peuvent être adaptées pour répondre à des besoins spécialisés. En fine-tunant ces modèles sur des données pertinentes et en mettant en place des mécanismes pour corriger les biais, il est possible d'améliorer leur efficacité et leur adéquation à des tâches spécifiques telles que le tri de CV.
Plutôt que de rejeter catégoriquement l'utilisation de modèles généralistes, il est important d'explorer des approches qui permettent d'optimiser ces outils pour des cas d'utilisation particuliers. La recherche continue dans le domaine de l'IA vise à rendre les modèles plus éthiques, transparents et adaptés à des applications spécifiques comme le recrutement. En adoptant une approche responsable et en mettant l'accent sur la correction des biais, il est possible d'utiliser ces technologies de manière plus pertinente et précise dans des contextes spécialisés.

SebGF Abonné

Le 13/03/2024 à 19h 00

#1.10

vaneck

Il est indéniable que l'utilisation de modèles d'IA généralistes comme ChatGPT dans des domaines spécifiques comme le recrutement peut poser des défis en termes de biais et de pertinence. Cependant, il est crucial de reconnaître que ces technologies évoluent constamment et peuvent être adaptées pour répondre à des besoins spécialisés. En fine-tunant ces modèles sur des données pertinentes et en mettant en place des mécanismes pour corriger les biais, il est possible d'améliorer leur efficacité et leur adéquation à des tâches spécifiques telles que le tri de CV.
Plutôt que de rejeter catégoriquement l'utilisation de modèles généralistes, il est important d'explorer des approches qui permettent d'optimiser ces outils pour des cas d'utilisation particuliers. La recherche continue dans le domaine de l'IA vise à rendre les modèles plus éthiques, transparents et adaptés à des applications spécifiques comme le recrutement. En adoptant une approche responsable et en mettant l'accent sur la correction des biais, il est possible d'utiliser ces technologies de manière plus pertinente et précise dans des contextes spécialisés.

L'erreur fondamentale du raisonnement est de considérer ChatGPT comme une technologie ou un modèle d'IA.

Non, ChatGPT est une implémentation d'une technologie : le Generative Pre-trained Transformer dans sa version 3.5 et 4. C'est GPT le modèle d'IA générative, pas ChatGPT. Comme toute implémentation d'une techno, il a une finalité particulière.

Saisir cette nuance permet de rapidement comprendre l'absurdité de cette étude.

Pour faire un parallèle simpliste, ChatGPT est le navigateur web (Chromium, Firefox, etc), GPT est le moteur de rendu (Gecko, Blink, etc), ou Debian/RHEL et Linux, ou encore Windows et NT.

Modifié le 13/03/2024 à 19h00

Historique des modifications :

Posté le 13/03/2024 à 19h00

L'erreur fondamentale du raisonnement est de considérer ChatGPT comme une technologie ou un modèle d'IA.

Non, ChatGPT est une implémentation d'une technologie : le Generative Pre-trained Transformer dans sa version 3.5 et 4. C'est GPT le modèle d'IA générative, pas ChatGPT. Comme toute implémentation d'une techno, il a une finalité particulière.

Saisir cette nuance permet de rapidement comprendre l'absurdité de cette étude.

Pour faire un parallèle simpliste, ChatGPT est le navigateur web (Chromium, Firefox, etc), GPT est le moteur de rendu (Gecko, Blink, etc).

alex.d. Abonné

Le 13/03/2024 à 09h 56

#2

Quand les hommes sont favorisés, c'est le signe du sexisme honteux dû à la domination des hommes sur toute la société. Mais ici, les femmes sont mieux classées que les hommes. Du coup, c'est dû à quoi ?

Tab41 Abonné

Le 13/03/2024 à 10h 34

#2.1

Discrimination positive je dirais

fred42 Abonné

Le 13/03/2024 à 10h 56

#2.2

Tab41

Discrimination positive je dirais

Non, ce n'est pas ça la discrimination positive. C'est favoriser volontairement certains groupes. Ici, c'est fait involontairement sur des biais.

Mais la question à laquelle tu réponds est volontairement polémique, don il me semble inutile de poursuivre sur le sujet. L'article apporte déjà la réponse que je donne : c'est dû à un biais.

alex.d. Abonné

Le 13/03/2024 à 12h 04

#2.4

fred42

Non, ce n'est pas ça la discrimination positive. C'est favoriser volontairement certains groupes. Ici, c'est fait involontairement sur des biais.

Mais la question à laquelle tu réponds est volontairement polémique, don il me semble inutile de poursuivre sur le sujet. L'article apporte déjà la réponse que je donne : c'est dû à un biais.

Certes, mais d'où est issu ce biais ? Les IA sont réputées amplifier les biais de la vraie vie, et la vraie vie est réputée hostile pour les femmes. Donc ?

alex.d. Abonné

Le 13/03/2024 à 12h 03

#2.3

Tab41

Discrimination positive je dirais

Je ne pense pas qu'un algo de discrimination ait été implémenté dans l'IA. Je pense que c'est juste dû au biais (de la vraie vie) que les femmes seraient meilleures pour ce job.

fred42 Abonné

Le 13/03/2024 à 12h 48

#2.5

alex.d.

Je ne pense pas qu'un algo de discrimination ait été implémenté dans l'IA. Je pense que c'est juste dû au biais (de la vraie vie) que les femmes seraient meilleures pour ce job.

Oui, c'est le fait que pour certains jobs (il y en avait 4 différents) les femmes sont supposées meilleures (ou plus choisies). Il semble aussi que l'association femme et asiatique sur-performe pour un des postes, ce qui peut influer sur la statistique globale sur les femmes.

L'article de bloomberg est super long mais pas super explicatif.

Ossito

Le 13/03/2024 à 11h 29

#3

Bientôt dans les colonnes de next "Comment planqué des données dans vos CV pour avoir un meilleur classement par les IA de recrutement"

kikoo26

Le 12/04/2024 à 23h 24

#3.1

Comme le SEO à l'ancienne avec des mots clés écrits en taille 1, en blanc sur fond blanc, dans le pied de page ?

consommateurnumérique Abonné

Le 13/03/2024 à 12h 07

#4

Réponse : CV anonyme

127.0.0.1

Le 13/03/2024 à 13h 53

#5

ChatGPT reproduit, voire amplifie des biais existants dans le monde hors ligne. Et lorsqu’on lui demande, à plusieurs reprises, de classer 1 000 CV, la machine tend à privilégier des prénoms caractéristiques de certains types de population.

Si ChatGPT a tort c'est du racisme systémique.
Si ChatGPT a raison c'est du racisme systémique.

"A strange game. The only winning move is not to play"
Joshua (1983)

psikobare

Le 13/03/2024 à 19h 58

#6

C'est pas de la discrimination ça, juste de l'application de probabilités.

Catégories

Nous suivre

À propos

IA et recrutement : un simple prénom peut pousser les modèles génératifs à la discrimination

Tiens, en parlant de ça :

Le fichier des empreintes digitales sera interconnecté avec huit autres fichiers

FAED y verse

Le ciblage publicitaire ne peut pas utiliser des données personnelles récupérées ailleurs

Schrems vs Meta, encore et encore

Windows 11 ajoute des publicités dans le menu Démarrer, comment les supprimer

Rogntudjuuu !

Le fichier des empreintes digitales sera interconnecté avec huit autres fichiers

Le ciblage publicitaire ne peut pas utiliser des données personnelles récupérées ailleurs

Windows 11 ajoute des publicités dans le menu Démarrer, comment les supprimer

Reddit : cas d’école de la pollution par les contenus générés par IA ?

Transhumanisme, long-termisme… comment les courants « TESCREAL » influent sur le développement de l’IA

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

La CNIL fait le bilan de son année 2023, cinquième année après RGPD

#LeBrief : TikTok suspend sa version Lite, Ariane 6 debout, enquête sur Pegasus, l’Europe et la violence numérique aux femmes

Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts

Fiabilité des disques durs HAMR de 30 To et plus : Seagate donne des chiffres

[Màj] Le Congrès des États-Unis vote la loi obligeant ByteDance à vendre TikTok

#LeBrief : Fedora 40, anniversaire Hubble, vidéosurveillance algorithmique à Cannes, Voyager 1, Android 15 bêta 1.1

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

[FAQ] Notre antisèche sur l’informatique quantique

L’Université d’Oxford ferme le Future of Humanity Institute dirigé par Nick Bostrom

#LeBrief : Apple rachète le français Datakalab (IA), propagande de la Russie, fin de partie pour Roccat, Proton Mail vs dark web

Europol milite pour un chiffrement de bout en bout « flexible »

Inclusion dans la tech : critiqué, le CEO de Qovery menace une internaute de poursuites

L’extension des prestataires américains devant collaborer avec la NSA fait polémique

#LeBrief : fuite chez Speedy, Rust pour Thunderbird, Saint Exupéry et PhiFire AI pour le satellite Φsat-2

Des institutions internationales s’engagent pour l’ouverture des données sur la recherche

Commentaires (25)

Historique des modifications :