[Édito] Intelligence artificielle, algorithm(iqu)es… comment nommer ce champ étrange ?

Casse-tête

La sortie du podcast Algoritmique a entraîné de nouvelles discussions sur le vocabulaire à employer pour parler d'intelligence artificielle ou d'algorithmes. Et vous, quels sont vos mots ?

Mathilde Saliou

Le 07 octobre à 17h30

9 min

IA et algorithmes

Fin septembre, nous avons lancé un nouveau projet éditorial : un podcast, que j’ai commencé à tourner en janvier dernier et dans lequel il est question d’intelligence artificielle. Le but de l’exercice est d’interviewer une variété d’acteurs et d’actrices aux expertises diverses pour tenter d’éclaircir ce qui se cache, concrètement, derrière l’expression « intelligence artificielle ».

Pour le publier, il m’a fallu un titre. Comme pour tout bon titre, il fallait trouver quelque chose d’efficace. Cela dit, je ne voulais pas qu’il comprenne les termes « intelligence artificielle », d’une part parce que j’allais déjà largement utiliser l’expression au gré des épisodes ; d’autre part parce que s’attaquer à la réalité de ces termes risquait de mettre à mal certaines idées relatives à la capacité humaine de créer, de toutes pièces, une « intelligence » – autrement que par de savants artifices, on s’entend.

Assez rapidement, j’ai proposé au reste de l’équipe de nommer le podcast : Algorithmique. L’idée : faire référence aux systèmes qui font tourner les IA les plus discutées ces derniers temps – les grands modèles de langage, mais aussi d’autres technologies que nous évoquerons sous peu – les modèles de catégorisation d’autorités publiques, ceux de modération de réseaux sociaux, etc.

La rédac a accepté ce choix, nous avons lancé notre trailer, et puis le mastonaute et chercheur en informatique David Monniaux a remarqué : « Ce que je trouve intéressant, c'est à quel point le mot "algorithme" est assimilé à l'IA, et elle-même restreinte aux LLM, aux systèmes de génération d'image et éventuellement aux systèmes de recommandation. »

Et c’est vrai, depuis plusieurs années, les termes algorithmes et systèmes algorithmiques sont devenus plus courants dans les discours sur la tech, sans que les liens directs avec la discipline ne soient toujours évidents. Comme j'aime bien réfléchir aux termes que j'utilise ~~et que c'était l'opportunité parfaite pour faire la publicité d'un podcast en cours de diffusion~~, je me suis dit que ce titre méritait une attention particulière.

IA quoi ?

Comme le rappelait Sébastien dans son édito de la semaine dernière, les définitions de l’intelligence artificielle sont diverses.

Celles du Robert (« ensemble des théories et des techniques développant des programmes informatiques complexes capables de simuler certains traits de l'intelligence humaine (raisonnement, apprentissage…) ») ou du Larousse, cela dit, soulignent bien la double dimension de l’expression. Elle désigne à la fois le domaine de recherche scientifique et l’espace de ses applications, aux contours un peu plus flous, mais souvent économiques.

La page Wikipédia relative au sujet souligne en revanche les différents domaines scientifiques susceptibles d’être convoqués dans la recherche en IA – mathématiques, sciences cognitives –, et souligne que ce champ « vise à résoudre des problèmes à forte complexité logique ou algorithmique ».

On y retrouve aussi la manière dont des travaux philosophiques, économiques, ou même de (science-)fiction se sont emparés de l’expression intelligence artificielle, travaux qui sont pour beaucoup dans la manière dont le grand public se représente l’IA.

Le Robert définit les algorithmes comme un « ensemble des règles opératoires propres à un calcul ; suite de règles formelles ». Le terme « algorithmique » n’est compris que comme adjectif, mais cherchons du côté encyclopédique. Wikipedia définit l’algorithmique comme « l'étude et la production de règles et techniques qui sont impliquées dans la définition et la conception d'algorithmes, c'est-à-dire de processus systématiques de résolution d'un problème permettant de décrire précisément des étapes pour résoudre un problème algorithmique ».

Le CNRTL dessine une discipline « qui appartient aux mathématiques et à la science des nombres », voire, par opposition à la méthode heuristique, comme une « méthode d'exploration de problèmes utilisant des algorithmes permettant d'aboutir directement à la solution ».

Éviter l’anthropomorphisation

Si l’un permet de définir tout ou partie de l’autre, pourquoi parler d’algorithmes (ou, dans notre cas, d’algorithmique) plutôt que d'intelligence artificielle ? Et dans quel contexte ?

Si on s’intéresse au pan économique du domaine, la hype est telle autour du concept que celui-ci peut se retrouver accolé à toutes sortes de projets pour des raisons purement marketing. C’est ce dont témoigne David Monniaux, c’était aussi l’avis d’un lecteur à l’origine de notre précédent édito. Le but : donner au projet un vernis flatteur et attirer, au choix, l’attention, les financements, ou tout autre élément favorisant son expansion.

On a vu d’autres buzz entraîner un usage irraisonné d’autres mots connexes à notre sujet du jour : algorithmes (je vais y revenir), big data, etc. Quitte à parler d’intelligence artificielle et à en vulgariser certains enjeux, me direz-vous peut-être, il aurait été aussi simple de mettre « IA » dans le titre de mon podcast.

Sauf que dans ce cas précis, l’expression est devenue trop porteuse d’imaginaires à mon goût. La science-fiction, les patrons et les grands chercheurs en IA ont trop joué sur l’image d’une entité de câbles et de calculs mathématiques susceptibles de dépasser notre contrôle, voire notre entendement pour qu’elle me permette de parler calmement des tenants et aboutissants d'un champ technico-économique.

AGI, GPAI, modèles de fondation… de quoi on parle ?

Depuis deux ans, certaines des critiques qui me paraissent compter parmi les plus intéressantes de l’intelligence artificielle sont aussi, à l’instar de la linguiste Emily Bender, des critiques de l’anthropomorphisation que poussent ses constructeurs. Il me semble donc important d’éviter les expressions trompeuses (comme hallucination pour dire erreur, comme intelligence artificielle pour certains systèmes précis, etc.) quand je le peux.

Pour l’anecdote, c’est aussi cette logique qui nous a fait discuter, avec Flock, du bien-fondé de représenter l’IA en robot ou en entité comparable à un être humain. Pour éviter cet écueil, nous utilisons quelquefois les images de Better images of AI et, le plus souvent, la représentation désormais classique de notre dessinateur préféré. Celui-ci vient d’ailleurs de m'expliquer qu’il utilisait régulièrement de multiples formes rectangulaires pour évoquer l’IA car celles-ci « représentent visuellement le focus d'une reconnaissance effectuée par un algorithme. On peut observer cette mise en forme sur des reconnaissances de visages par des caméras de surveillance, ou lorsqu'un algorithme décèle un objet qu'il est censé reconnaître. »

Retour de hype algorithmique les dix dernières années

Si j’évacuais « intelligence artificielle » du titre, il me fallait tout de même trouver quelque chose qui permette aux futurs auditeurs et auditrices de comprendre de quoi le podcast parlerait. C’est là que la notion d’algorithmes m’est arrivée en tête.

Il me semble que cette dernière a commencé à être discutée par le grand public à partir des années 2016 - 2018. C’est l’époque de l’élection de Donald Trump aux États-Unis, puis du scandale Cambridge Analytica : systèmes de recommandation et de modération des réseaux sociaux sont longuement analysés et décortiqués dans les médias. Ces années-là sont aussi le moment de publication de Weapons of math destruction de Cathy O’Neil (traduit en français sous le titre : Algorithmes, la bombe à retardement) qui, avec d’autres ouvrages, met dans le débat la question des effets concrets de ces outils déployés dans la banque, l’éducation, la police, etc.

Aussi réducteur soit-il, il m’a donc semblé que le terme permettait de signaler rapidement les enjeux que nous allions évoquer (car, spoiler : dans l’épisode 2 d’Algorithmique, il sera question de biais). Pourquoi algorithmique plutôt qu’algorithme, me demanderont ensuite les plus tatillons ? Ici, mea maxima culpa, je pense que j’ai joué l’argument d’autorité sans même y penser. Algorithmique, c’est scientifique. Et tout ce qui est scientifique ~~est chic~~ demande à être écouté. Non ?

Blague à part, sous la remarque de David Moniaux, le chercheur en IA Ulrich Junker a proposé une autre piste d’explication à l’usage régulier des notions d’algorithmes/algorithmique : « c’est à cause des YouTuber, TikToker etc qui appellent régulièrement leur audience de pousser le bouton like afin que l’algorithme recommande leurs vidéos … »

Cette hypothèse me plaît bien, dans la mesure où, certes piètre influenceuse, j’ai posté l’autre jour une photo de moi sur Instagram, assortie du commentaire : « eh l’algorithme, regarde, je lis en marchant » pour espérer augmenter les vues de la story suivante, où je partageais mon podcast (je vous ai dit de l’écouter et de le partager ?).

Je pensais en terminer là, mais en me relisant, ça me saute aux yeux : cette dernière expérience vient démontrer que malgré l'attention que je porte dans mes articles à ne pas anthropomorphiser des systèmes techniques, j'en viens à parler au système de recommandations de Meta comme s'il était une personne...

Et vous ?

Comment parleriez-vous de ce champ dont même la qualification est complexe ?

Commentaires (17)

JNSON Abonné

Le 07/10/2024 à 18h18

Je pense que "algorithme" est un bon choix. Il y a aussi heuristique, car souvent, les "IA" ressemble à des heuristiques, mais avec un meilleur résultat et avec d'autres notions que les heuristiques n'incluent pas. S'il fallait se passer du terme IA, pour moi, soit il faut utiliser "algorithme" (version courte), soit il faut utiliser des termes plus spécifiques tels que systèmes experts (se base sur logique des propositions et sur des règles logiques, très rigide), logique floue (comble les limites des systèmes experts), réseaux de neurones artificiels (les plus connus, très gourmands en ressources), algorithmes génétiques (très gourmands en ressources), algorithmes du traitement du langage naturel (très connus, très gourmands), systèmes multi-agents (génie logiciel qui augmente la notion d'objet à travers des agents autonomes, parfois fait appel à la notion d'intelligence collective et décentralisée), réseaux bayésien (modèle probabiliste, raisonnement sous incertitude), arbres de décision, etc. Le problème, c'est qu'il faut au préalable introduire les termes, donc "algorithme", c'est bien :)

Mais si les termes précédents sont compris, on comprend beaucoup mieux les avantages/inconvénients. On peut distinguer notamment les algorithmes conçus et pensés par les analystes/développeur⋅ses avec une vue assez précise de ce qu'ils sont censés faire ou ne pas faire, mais parfois avec une méthode qui peut être trop réductionniste pour résoudre des problèmes singuliers. Alors que des algorithmes de type "opaque" dont on peine à comprendre ce qu'il font exactement au moment de la conception, et où l'évaluation est plus empirique que conceptuelle, vont permettre d'être assez efficaces sur des problèmes mal définis, mais avec un "flou relativement artistique" !

Uther Abonné

Modifié le 08/10/2024 à 06h40

Pour le coup je trouve au contraire que "algorithme" ou "heuristique" sont de très mauvais choix quand on parle de Machine Learning car ces termes font traditionnellement référence a des procédures bien définies avec un résultat prédictible, même s'il n'est pas forcément optimal.

Certes, l'apprentissage suit un algorithme défini, mais le programme exécuté au final suit une logique que l'on est incapable d'expliquer précisément.

JNSON Abonné

Le 08/10/2024 à 07h45

"Heuristique", je l'avais écarté dans mon commentaire. Pour le domaine de l'IA, dès fois on peut expliquer très précisément ce qui se passe (système expert, logique floue, SMA, réseaux bayésien). Mais dans le domaine de l'apprentissage automatique que vous citez, cela dépend aussi, mais si c'est de l'apprentissage automatique qui utilise des algorithmes de type "réseau de neurones artificiels", oui, il est difficile d'expliquer ce qui s'y passe (c'est la boite opaque que j'ai évoquée plus haut), J'ai juste gardé "algorithme" pour le terme générique, et pour moi il s'applique à tous les algorithmes, y compris ceux "d'IA". C'est justement LE terme qui englobe tout. Après, ça ne me dérange pas si vous préférez utiliser le terme "apprentissage automatique", c'est même plus précis et même plus clair si c'est de ça dont vous voulez parler. Dans mon texte précédent, j'invite justement à utiliser des termes plus précis, à condition qu'il soit compris et introduits. Personnellement, à choisir, je préfère les termes précis qui existent déjà dans la taxonomie. Mais le débat initial si j'ai bien compris était plutôt de savoir s'il fallait utiliser "IA" ou "algorithme" comme terme générique.

SebGF Abonné

Le 07/10/2024 à 18h21

Pour ma part, je considère que ce genre de débat n'est qu'un détournement d'attention. Au même titre que de pinailler sur le terme "intelligence".

Le sujet est beaucoup plus intéressant qu'un simple débat sémantique sur des noms. Surtout pour une discipline de recherche aux usages et applications aussi vaste.

wagaf Abonné

Le 07/10/2024 à 18h52

Tout à fait

En pays de littéraires on est un peu trop obsédés par les mots.
Effectivement, ce qui compte vraiment c'est la capacité (bien réelle) de ces systèmes à transformer le monde, ce qui se produit déjà. Il faudrait surtout s'intéresser à ça. Ces systèmes existent et continueront à évoluer. Quelles sont leurs capacités actuelles et leurs limitations ? Quels impacts sur la société, à court, moyen et long terme ?

Le terme qui gène le plus est probablement "intelligence", qui met beaucoup de monde sur la défensive, à tort. Il n'y a théoriquement aucune raison qu'une machine ne puisse pas conduire un raisonnement intelligent aussi bien qu'un humain. Le raisonnement intelligent chez l’animal et en particulier l'humain est un miracle de l'évolution, le plus gros de l'activité cérébrale et du processus de prise de décision reste irrationnel et basé sur l’instinct et l'émotion.

« Ce que je trouve intéressant, c'est à quel point le mot "algorithme" est assimilé à l'IA, et elle-même restreinte aux LLM, aux systèmes de génération d'image et éventuellement aux systèmes de recommandation. »

Honnêtement je trouve ce type de remarque complètement inintéressante. Oui, la technologie à la mode.. est à la mode.

Uther Abonné

Le 08/10/2024 à 06h37

Le problème, c'est que débattre quand on est pas d'accord sur le sens des mots qu'on utilise, c'est un bon moyen de finir avec un dialogue de sourds.

fred42 Abonné

Le 07/10/2024 à 18h56

Je me suis déjà prononcé sur l'utilisation du terme algorithme pour parler de l'IA et de la confusion que l'on fait entre les 2.
En particulier, ici, où j'étais d'accord avec @wanou sur le fait que si on parle d'outils de type IA, ce n'est pas des algorithmes. Mais je l'ai dit plusieurs fois avant, en critiquant d'ailleurs que la rubrique sur Next s'appelle "IA et algorithmes" avec comme forme courte seulement "IA".
Pour expliquer la différence, je disais :

Le glissement sémantique du mot algorithme ne doit pas être accepté ici. La rubrique unique "AI et algorithmes" dans laquelle est classée la brève est elle aussi un problème. On est capable de décrire le calcul des différents impôts ou des différentes aides sociales par des algorithmes : c'est un enchaînement déterministe de calculs. Par contre, on n'est pas capable de décrire comment il est décidé par un système à base d'IA de vérifier si quelqu'un fraude la CAF.

Quand il n'y a pas de déterminisme dans le résultat, ce n'est pas un algorithme.
Pour expliquer ma position, toute l'informatique traditionnelle est l'écriture en langage informatique de programmes qui mettent en œuvre des algorithmes. Lors de l'enseignement de l'informatique, on enseigne l'algorithmique pour savoir écrire des programmes.

Alors, oui, ce qui fait tourner les différents outils de type IA, ce sont des algorithmes à la base (les neurones artificiels et autres programmes), mais il y a un aléa d'ajouté qui fait que l'on n'a pas toujours la même réponse et surtout, c'est le contenu des données d'entraînement qui fait un résultat que même l'humain qui a conçu le système ne pourra pas expliquer.

Je suis aussi d'accord que l'on parle depuis un moment d'algorithmes depuis la période citée dans l'édito, peut-être même avant. Mais je soupçonne qu'au début, c'était surtout des algorithmes déterministes qui ont été remplacés de plus en plus par de l'IA, d'où le glissement sémantique. L'IA a probablement été utilisée aussi pour la modération pour remplacer des listes de mots ou d'expressions à signaler aux modérateurs ou à interdire directement.

Le domaine de l'IA est vaste mais on ne parle plus d'IA que pour ce qui est la hype du moment, l'IA générative qui est plus de la poudre aux yeux que véritablement de l'intelligence.

Mais le bon terme pour parler de ce domaine est bien "intelligence artificielle", c'est le terme consacré et il est assez ancien (1956) pour qu'on l'utilise.

Je suis d'accord que les IA dont on parle aujourd'hui n'ont rien d'intelligentes, mais il est fort possible que d'autres parties de l'IA produisent des outils que l'on pourra qualifier d'intelligents parce qu'ils sauront raisonner aussi bien qu'un être vivant (je n'ai pas dit un humain parce que l'on n'est pas la seule espèce intelligente).

J'ai bien peur de me battre contre des moulins à vent comme pour l'utilisation de crypter au lieu de chiffrer.

wagaf Abonné

Modifié le 07/10/2024 à 20h03

D'accord pour presque tout sauf le fait de refuser le qualificatif d'"intelligent" aux modèles actuels ou même passés.

Comme tu fais remarquer l'humain n'est pas la seule espèce intelligente. On qualifie d'"intelligence" des comportements de bactéries ou de plantes dont le fonctionnement est pourtant relativement simple, beaucoup plus simple que les modèles actuels.
Si on veut parler de "raisonnement", on peut dire que les LLM raisonnent dans la mesure où pour calculer chaque mot, l'historique des mots préalablement générés est pris en compte (le modèle "voit" ce qu'il a lui même généré et utilise ça pour générer la suite).

Pour la distinction IA vs algo, plutôt d'accord dans l'ensemble, mais il y a des cas limites, notamment quand l'algo construit et utilise un modèle statistique. Par ex. PageRank est-il un algo ou de l'IA ?

fred42 Abonné

Le 07/10/2024 à 19h27

Bien vu pour les cas limites. En lisant la page Wikipédia de PageRank, je dirais que c'est bien un algo malgré l'aléatoire sur lequel il s'appuie.
Je reste quand même sur ma définition s'appuyant sur le déterminisme en incluant la graine (seed) du générateur d'aléa dans les données d'entrée de cet algo.

Et je comprends ton objection sur "intelligent". Je situais l'intelligence au-dessus des bactéries et des plantes.

fdorin Abonné

Le 07/10/2024 à 19h53

Je comprends ta vision des choses.

Il est vrai qu'il y a un flou sur la notion d'algorithme et d'IA, surtout quand ce dernier est utilisé à toutes les sauces car c'est devenu un buzz word.

Pour ma part, la distinction que je fais entre algorithme et IA est plus simple.

Pour un algorithme, pas de notion de déterminisme. Seulement une suite d'opération qui conduit à un résultat. A ce niveau là, l'IA est un type d'algorithme.

Pour l'IA, c'est un algorithme qui est affiné par des données (je n'emploie pas le terme "apprendre" sciemment, qui relève de l'anthropomorphisation). Sans parler des réseaux de neurones profonds, une simple régression linéaire peut être vu comme une IA.

Une IA, c'est donc un algorithme dont on connait la topologie (autrement dit, la structure principale) mais où on ne connait pas le détail avec précision (le poids des différents coefficients) et qui nécessite donc des données pour trouver des valeurs qui donnent de bons résultats.

Qu'on s'entende bien, ce ne sont pas des définitions officielles. C'est juste mon appréciation des choses ;)

On oublie souvent qu'il existe toute une "taxonomie" des algorithmes depuis fort fort longtemps, comme algorithme adaptatif, algorithme par apprentissage, etc. Mais il est vrai que c'est moins "vendeur" qu'intelligence artificielle, surtout lorsqu'on souhaite faire du bullshit marketing.

Cqoicebordel Abonné

Le 07/10/2024 à 23h44

Rien à voir, mais c'est en lisant cet article que j'ai appris que le podcast était sorti.
Pourquoi le flux RSS "Complet" ne comprend pas le podcast ?

Alexandre Laurent Équipe

Le 08/10/2024 à 08h47

Le podcast est géré comme un objet différent des articles au niveau du CMS, avec son propre flux RSS, il faut qu'on le réintègre au flux principal, c'est identifié (à défaut d'être traité)

Cqoicebordel Abonné

Le 08/10/2024 à 19h44

Je me doutais que c'était un problème du genre. Ma question était semi rhétorique pour lever le problème (j'ai d'ailleurs rempli un bug sur Github dans la foulée).

Mais au delà du problème technique, c'était aussi pour pointer du doigt qu'il n'y a pas eu d'article sur Next-tronc pour annoncer Next-branche (les podcasts), et que ça aurait pu être opportun. Si on utilise pas le site et qu'on passe que par les RSS, quasi rien n'indique l'existence du podcast, et c'est pas cool.

Cqoicebordel Abonné

Le 08/10/2024 à 00h03

Par rapport à l'édito (enfin lu), pour moi, l'algorithmique est l'étude (au sens large) des algorithmes, ça colle donc parfaitement.

Et y'a un débat qu'on a que trop rarement quand on parle d'IA : de quelle intelligence parle-t-on ? Est-ce qu'une fourmi est intelligente ?

L'intelligence est compliquée à définir, et ce serait pourtant primordial dans ce débat de nomenclatures :)

Thoscellen Abonné

Le 08/10/2024 à 09h59

Ah le bon vieux temps sur Âge Of Empire où tu jouais contre des IA

alex.d. Abonné

Le 08/10/2024 à 10h07

Bah l'IA est mise en oeuvre au travers d'algos, donc tout va bien. Il suffit d'envisager une deuxième série sur d'autres algos que l'IA après cette première série sur l'IA pour que le titre prenne toute sa légitimité.

iridium77 Abonné

Le 08/10/2024 à 21h26

Pour ma part, je voudrais revenir sur le terme hallucination vs erreur. J’apprécie le terme d’hallucination car c’est le fruit des X% de taux d’erreur d’un modèle.
Je trouve qu’une erreur, on peut la remonter, en chercher la cause logique plus ou moins facilement, on peut débuger le programme. L’hallucination, elle, bien malin celui qui pourra retracer la cause réelle de son apparition, le contenu et son apparition restent, pour ce que j’en comprends, aléatoire…