Le système de production de l’IA reproduit et amplifie les dépendances économiques historiques
Le Sud

Dans une comparaison sociologique des conditions de travail des producteurs d'IA, des chercheurs rappellent le rôle majeur des travailleurs des données. En mettant en parallèle des situations observées au Venezuela, au Brésil, à Madagascar et en France, ils montrent que ce domaine maintient « les dépendances économiques historiques et génère des inégalités qui s'ajoutent à celles héritées du passé ».
Le 20 novembre 2024 à 15h22
9 min
IA et algorithmes
IA
Les entreprises d'IA génératives s'appuient sur un amas de données pour créer de modèles de plus en plus gros. Cette course commence à montrer ses limites, mais OpenAI, Anthropic et leurs concurrents ne l'ont pas abandonnée pour l'instant.
Pour obtenir ces amas de données, il faut : soit se procurer des corpus déjà existants, soit générer des contenus à la pelle. Pour la première solution, si ces entreprises ont facilement sacrifié le Copyright sur l’autel de l’IA sans que cela n'émeuve trop les politiques, les archives déjà créées comme « The Pile » vont commencer à se tarir. Et les entreprises de l'industrie culturelle ont lancé quelques procès qui devraient refroidir d'éventuel nouveaux créateurs d'archives de ce genre.
Pour générer des contenus à la pelle, rien de mieux que l'IA générative qui fait ça en quelques claquements de doigts. Mais, on a vu que si ces entreprises parient sur l'entrainement en utilisant des données synthétiques, ça pourrait devenir le talon d’Achille de leurs outils.
Mais, contrairement à ce qu'on pourrait imaginer parfois derrière nos machines, les entreprises d'IA n'ont pas seulement besoin du travail des scientifiques et ingénieurs qu'elles mettent en avant. Leurs outils ne pourraient pas voir le jour sans le travail essentiel de petites mains qui étiquettent des images, trient des items dans des listes, enregistrent des extraits audio ou en retranscrivent via des plateformes comme Amazon Mechanical Turk, Microworkers, Clickworker ou Yappers (anciennement Foule Factory) en France. Next en a déjà parlé quelques fois.
Nous avons aussi vu que certains d'entre eux utilisent eux-mêmes massivement les grands modèles de langage pour accomplir leurs tâches.
Des journalistes, mais aussi des sociologues comme Antonio Casilli, ont permis de mettre au jour ce travail quotidien qui participe à l'existence des IA. Mais il est encore difficile d'appréhender comment fonctionne le marché mondial des « data workers ».
Comparer le profil des data workers du Venezuela, du Brésil, de Madagascar et de France
Ces derniers font partie des millions de « travailleurs à la demande en ligne » qui existent à travers le monde. Un rapport [PDF] de la Banque mondiale publié l'année dernière estime leur nombre dans une fourchette de 154 millions à 435 millions de travailleurs, soit entre 4,4 % à 12,5 % de la main-d'œuvre mondiale.
Pour un chapitre du livre The Handbook of Digital Labor qui doit paraitre dans les prochains mois, Antonio Casilli et six autres sociologues (Paola Tubaro, Maxime Cornet, Clément Le Ludec, Juana Torres-Cierpe et Matheus Viana Braz), ont entrepris de comparer les conditions de travail et les profils de ces travailleurs des données au Venezuela, au Brésil, à Madagascar, mais aussi dans un pays plus riche, la France. Ils ont mis en ligne récemment ce travail sur la plateforme de prépublication arXiv.
Leur étude repose sur des informations collectées pendant cinq ans (entre 2018 et 2023) dans ces différents pays. Remarquons que ces pays ne sont pas anglophones mais hispanophones, lusophones ou francophones. Les chercheurs ont d'abord travaillé sur ces pays individuellement, mais ici, leur travail permet de comprendre un peu mieux la chaine logistique et les dépendances économiques entre les pays des travailleurs de l'IA en dehors du monde anglophone.
De jeunes hommes vénézueliens diplômés
Ils y détaillent les différences d'implantations qui varient en fonction des conditions historiques de chaque pays. Par exemple, le Venezuela a connu, sous Hugo Chávez, des campagnes de distribution d'ordinateurs aux jeunes et de diffusion de la culture numérique qui « ont été couronnées de succès ». Mais le pays subit une crise économique profonde depuis les années 2010 et quatre Vénézuéliens sur cinq vivent dans la pauvreté.
Selon les travaux des sept sociologues, deux tiers des data workers vénézuéliens sont des hommes, 70 % ont moins de 35 ans et plus de la moitié ont un diplôme universitaire, « souvent dans des disciplines telles que l'ingénierie et l'informatique », précisent-ils. Ce travail est, pour les trois quarts d'entre eux, leur principale source de revenus.
De jeunes femmes brésiliennes diplômées
Du côté du Brésil, le septième pays le plus peuplé au monde, l'économie informelle est très développée (près de 40 % de la population active). Un endroit rêvé pour toute plateforme de travailleurs des données. Plus de 50 plateformes y sont implantées, expliquent les chercheurs. Les data workers brésiliens sont aussi jeunes que les vénézuéliens, mais près de deux tiers sont des femmes.
Pour ces deux pays, les chercheurs constatent que les « les producteurs de technologie d'Amérique du Nord et d'Europe exploitent la privation relative de populations spécifiques [...] pour accéder à un travail de données à faible coût à leurs fins ».
À Madagascar, un système de sous-traitance en lien avec la France
Pour Madagascar, les chercheurs soulignent d'abord que l'île est le deuxième pays exportateur de service informatique d'Afrique francophone tout en étant l'un des pays dont le taux de pauvreté est le plus important au monde. L'accès à Internet y est beaucoup moins développé qu'ailleurs. Les data workers travaillent donc plutôt pour des petites entreprises sous-traitantes de start-ups françaises. « Neuf employés sur dix de ces entreprises ont moins de 35 ans, les trois quarts ont un diplôme de l'enseignement supérieur et plus des deux tiers sont des hommes, qui considèrent souvent le travail sur les données comme leur premier pas dans l'économie formelle après l'université », expliquent les chercheurs.
Dans ce pays où les data workers sont le plus souvent des employés, changer de tâche pour passer de l'annotation à la modération de contenus, par exemple, est plus difficile. Les chercheurs décrivent une hiérarchie sous le contrôle des clients français qui « laissent très peu de postes de direction intermédiaires à la disposition des locaux ». Les data workers de Madagascar ont donc tendance à percevoir leur engagement dans ce domaine d'activité comme temporaire.
En France, un travail présenté comme distrayant pour un salaire complémentaire
La situation n'est évidemment pas la même pour les data workers français. Notre pays a connu une « prolifération de plateformes de travail sur les données (23 en 2019, dont plus de la moitié sont locales), avec la participation d'environ 260 000 travailleurs qui effectuent des tâches nécessitant une langue et une culture locales et qui ne peuvent donc pas être facilement délocalisées ». Pour attirer les potentiels data workers français, « les plateformes se présentent comme des sources distrayantes de revenus supplémentaires à la pointe de la technologie », ajoutent-ils.
« Les travailleurs des données français sont principalement des femmes, souvent avec des enfants, ce qui confirme une tendance observée au Brésil, mais pas au Venezuela ni à Madagascar. Les travailleurs sont plus âgés que dans les trois autres pays, près des deux tiers d'entre eux ayant entre 25 et 44 ans », résument-ils.
Le travail des données, une accentuation des déséquilibres économiques du Monde
En comparant les quatre cas, les chercheurs observent que « les producteurs d'IA puisent dans des réservoirs de désavantages pour trouver des fournisseurs de données abordables, bien que les sources de désavantages soient variées ». Selon eux, les entreprises « identifient un groupe spécifique (plus ou moins grand) à l'intersection des écarts économiques, numériques et de genre, à la fois à travers et au sein des pays ». Dans tous les cas, les compétences et contributions des data workers sont importantes dans la chaine de production de l'IA, mais sont « à peine reconnues ».
Enfin, en agrégeant leurs travaux à ceux de leurs collègues qui ont travaillé sur d'autres pays, les sept sociologues proposent une carte des flux de ce marché :

Ils soulignent que « des pays comme le Venezuela, le Brésil et Madagascar sont des centres d'activités à forte intensité de main-d'œuvre, qui s'appuient sur une jeunesse éduquée mais précaire, qui s'engage sur les marchés du travail internationaux par le biais de tâches de données liées à l'IA ». Ils insistent sur le fait que les pays du Sud ne sont pas assez pris en compte lorsqu'on parle de l'IA : « les contributions du Sud à la production d'IA transcendent la simple rentabilité, dévoilant des modèles organisationnels complexes qui remettent en question les récits simplistes ». Aussi, leurs travaux montrent que, contrairement à ce qui est souvent mis en avant dans le monde du numérique, les pays non-anglophones ont un certain poids dans ce système.
Enfin, ils font un parallèle entre cette carte et « les vestiges des relations coloniales et postcoloniales » dans le monde. Mais ils ajoutent que les dépendances et déséquilibres entre les diverses régions du monde ne se limitent pas à ces vestiges :
« Notamment, ce qui peut être décrit comme une « doctrine Monroe numérique » consolide la dépendance des pays latino-américains à l'égard de l'Amérique du Nord, avec une influence des facteurs politiques dans l'établissement de ces liens. Les liens récents entre les pays africains et la Chine diversifient encore le paysage ».
Le système de production de l’IA reproduit et amplifie les dépendances économiques historiques
-
Comparer le profil des data workers du Venezuela, du Brésil, de Madagascar et de France
-
De jeunes hommes vénézueliens diplômés
-
De jeunes femmes brésiliennes diplômées
-
À Madagascar, un système de sous-traitance en lien avec la France
-
En France, un travail présenté comme distrayant pour un salaire complémentaire
-
Le travail des données, une accentuation des déséquilibres économiques du Monde
Commentaires (8)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousModifié le 20/11/2024 à 20h30
Ça fait vraiment penser au scandale de la vache folle, quand on donnait à manger aux vaches (herbivores au passage,) tout un mélange de granulés, granulés qui contenaient une large proportion de viande de... boeuf...
On a bien vu le résultat ensuite...
.
Modifié le 20/11/2024 à 21h37
Comme toujours d'ailleurs. Plus le métier est indispensable au bon fonctionnement d'un système, quel qu'il soit, plus il est déconsidéré et sous valorisé et ceux qui font ce métier sont souvent regardés de haut.
L'épisode de la Covid a bien illustré ce phénomène avec le personnel médical .......
Le 21/11/2024 à 11h09
Le personnel médical, les salarié.es de la logistique, de l'alimentation, de la distribution...
Ce qui me frappe c'est à quel point la bulle "IA" n'apporte que du rien, et encore de mauvaise qualité, par rapport à tout ce qu'elle fait comme dégats.
Le 21/11/2024 à 14h31
Modifié le 21/11/2024 à 15h23
J'imagine les débats enflammés d'experts d'histoire de dans 100 ans qui se demanderont de qui entre les bulles des crypto-monnaies et l'IA générative a le plus contribué à abîmer le monde.
Consommation dantesque d'énergie et de matériels, pump & dump et autres scams divers, investissements monstrueux et outil de domination et de soumission, fraude, crime organisé... y a de quoi faire.
EDIT : je viens de tomber sur ce truc là:
https://webmarketing.developpez.com/actu/364969/Vous-pourriez-bientot-vous-retrouver-a-parler-aux-publicites-grace-a-une-technologie-d-IA-qui-permet-aux-consommateurs-d-engager-des-conversations-en-temps-reel-directement-dans-les-espaces-publicitaires/
Bientôt pour passer la pub sur Youtube netflix etc... on te forcera à INTERRAGIR avec ta pub pour bien montrer à l'annonceur que si si regarde ils ont kiffé ta pub. je cache ma joie
Le 22/11/2024 à 11h00
Le 22/11/2024 à 11h07
Mais non, voyons, les donneurs d'ordre sont de méchant colonialistes comme ils le laissent entendre :
Le 22/11/2024 à 14h17
Ils vont te dire que les méchants exploiteurs devraient payer la main d’œuvre au prix occidental sinon c'est de l'exploitation, alors qu'ils paient le double du salaire moyen là-bas et offrent de meilleures conditions de travail.