La sortie du podcast Algoritmique a entraîné de nouvelles discussions sur le vocabulaire à employer pour parler d'intelligence artificielle ou d'algorithmes. Et vous, quels sont vos mots ?
Fin septembre, nous avons lancé un nouveau projet éditorial : un podcast, que j’ai commencé à tourner en janvier dernier et dans lequel il est question d’intelligence artificielle. Le but de l’exercice est d’interviewer une variété d’acteurs et d’actrices aux expertises diverses pour tenter d’éclaircir ce qui se cache, concrètement, derrière l’expression « intelligence artificielle ».
Pour le publier, il m’a fallu un titre. Comme pour tout bon titre, il fallait trouver quelque chose d’efficace. Cela dit, je ne voulais pas qu’il comprenne les termes « intelligence artificielle », d’une part parce que j’allais déjà largement utiliser l’expression au gré des épisodes ; d’autre part parce que s’attaquer à la réalité de ces termes risquait de mettre à mal certaines idées relatives à la capacité humaine de créer, de toutes pièces, une « intelligence » – autrement que par de savants artifices, on s’entend.
Assez rapidement, j’ai proposé au reste de l’équipe de nommer le podcast : Algorithmique. L’idée : faire référence aux systèmes qui font tourner les IA les plus discutées ces derniers temps – les grands modèles de langage, mais aussi d’autres technologies que nous évoquerons sous peu – les modèles de catégorisation d’autorités publiques, ceux de modération de réseaux sociaux, etc.
La rédac a accepté ce choix, nous avons lancé notre trailer, et puis le mastonaute et chercheur en informatique David Monniaux a remarqué : « Ce que je trouve intéressant, c'est à quel point le mot "algorithme" est assimilé à l'IA, et elle-même restreinte aux LLM, aux systèmes de génération d'image et éventuellement aux systèmes de recommandation. »
Et c’est vrai, depuis plusieurs années, les termes algorithmes et systèmes algorithmiques sont devenus plus courants dans les discours sur la tech, sans que les liens directs avec la discipline ne soient toujours évidents. Comme j'aime bien réfléchir aux termes que j'utilise et que c'était l'opportunité parfaite pour faire la publicité d'un podcast en cours de diffusion, je me suis dit que ce titre méritait une attention particulière.
Il reste 77% de l'article à découvrir. Abonnez-vous pour ne rien manquer.
Déjà abonné ? Se connecter
Commentaires (17)
#1
Mais si les termes précédents sont compris, on comprend beaucoup mieux les avantages/inconvénients. On peut distinguer notamment les algorithmes conçus et pensés par les analystes/développeur⋅ses avec une vue assez précise de ce qu'ils sont censés faire ou ne pas faire, mais parfois avec une méthode qui peut être trop réductionniste pour résoudre des problèmes singuliers. Alors que des algorithmes de type "opaque" dont on peine à comprendre ce qu'il font exactement au moment de la conception, et où l'évaluation est plus empirique que conceptuelle, vont permettre d'être assez efficaces sur des problèmes mal définis, mais avec un "flou relativement artistique" !
#1.1
Certes, l'apprentissage suit un algorithme défini, mais le programme exécuté au final suit une logique que l'on est incapable d'expliquer précisément.
Historique des modifications :
Posté le 08/10/2024 à 06h34
Pour le coup je trouve au contraire que "algorithme" ou "heuristique" est un très mauvais choix quand on parle de Machine Learning car ces termes font traditionnellement référence a des procédure bien définies et prédictibles, même si le résultat n'est pas forcément garanti optimal.
L'apprentissage suit bien un algorithme défini, mais le programme exécuté au final suit une logique que l'on est incapable d'expliquer précisément.
Posté le 08/10/2024 à 06h35
Pour le coup je trouve au contraire que "algorithme" ou "heuristique" sont de très mauvais choix quand on parle de Machine Learning car ces termes font traditionnellement référence a des procédures bien définies avec un résultat prédictible, même s'il n'est pas forcément optimal.
Certes, l'apprentissage suit un algorithme défini, mais le programme exécuté au final suit une logique que l'on est incapable d'expliquer précisément.
#1.2
#2
Le sujet est beaucoup plus intéressant qu'un simple débat sémantique sur des noms. Surtout pour une discipline de recherche aux usages et applications aussi vaste.
#2.1
En pays de littéraires on est un peu trop obsédés par les mots.
Effectivement, ce qui compte vraiment c'est la capacité (bien réelle) de ces systèmes à transformer le monde, ce qui se produit déjà. Il faudrait surtout s'intéresser à ça. Ces systèmes existent et continueront à évoluer. Quelles sont leurs capacités actuelles et leurs limitations ? Quels impacts sur la société, à court, moyen et long terme ?
Le terme qui gène le plus est probablement "intelligence", qui met beaucoup de monde sur la défensive, à tort. Il n'y a théoriquement aucune raison qu'une machine ne puisse pas conduire un raisonnement intelligent aussi bien qu'un humain. Le raisonnement intelligent chez l’animal et en particulier l'humain est un miracle de l'évolution, le plus gros de l'activité cérébrale et du processus de prise de décision reste irrationnel et basé sur l’instinct et l'émotion.
Honnêtement je trouve ce type de remarque complètement inintéressante. Oui, la technologie à la mode.. est à la mode.
#2.2
#3
En particulier, ici, où j'étais d'accord avec @wanou sur le fait que si on parle d'outils de type IA, ce n'est pas des algorithmes. Mais je l'ai dit plusieurs fois avant, en critiquant d'ailleurs que la rubrique sur Next s'appelle "IA et algorithmes" avec comme forme courte seulement "IA".
Pour expliquer la différence, je disais :
Quand il n'y a pas de déterminisme dans le résultat, ce n'est pas un algorithme.
Pour expliquer ma position, toute l'informatique traditionnelle est l'écriture en langage informatique de programmes qui mettent en œuvre des algorithmes. Lors de l'enseignement de l'informatique, on enseigne l'algorithmique pour savoir écrire des programmes.
Alors, oui, ce qui fait tourner les différents outils de type IA, ce sont des algorithmes à la base (les neurones artificiels et autres programmes), mais il y a un aléa d'ajouté qui fait que l'on n'a pas toujours la même réponse et surtout, c'est le contenu des données d'entraînement qui fait un résultat que même l'humain qui a conçu le système ne pourra pas expliquer.
Je suis aussi d'accord que l'on parle depuis un moment d'algorithmes depuis la période citée dans l'édito, peut-être même avant. Mais je soupçonne qu'au début, c'était surtout des algorithmes déterministes qui ont été remplacés de plus en plus par de l'IA, d'où le glissement sémantique. L'IA a probablement été utilisée aussi pour la modération pour remplacer des listes de mots ou d'expressions à signaler aux modérateurs ou à interdire directement.
Le domaine de l'IA est vaste mais on ne parle plus d'IA que pour ce qui est la hype du moment, l'IA générative qui est plus de la poudre aux yeux que véritablement de l'intelligence.
Mais le bon terme pour parler de ce domaine est bien "intelligence artificielle", c'est le terme consacré et il est assez ancien (1956) pour qu'on l'utilise.
Je suis d'accord que les IA dont on parle aujourd'hui n'ont rien d'intelligentes, mais il est fort possible que d'autres parties de l'IA produisent des outils que l'on pourra qualifier d'intelligents parce qu'ils sauront raisonner aussi bien qu'un être vivant (je n'ai pas dit un humain parce que l'on n'est pas la seule espèce intelligente).
J'ai bien peur de me battre contre des moulins à vent comme pour l'utilisation de crypter au lieu de chiffrer.
#3.1
Comme tu fais remarquer l'humain n'est pas la seule espèce intelligente. On qualifie d'"intelligence" des comportements de bactéries ou de plantes dont le fonctionnement est pourtant relativement simple, beaucoup plus simple que les modèles actuels.
Si on veut parler de "raisonnement", on peut dire que les LLM raisonnent dans la mesure où pour calculer chaque mot, l'historique des mots préalablement générés est pris en compte (le modèle "voit" ce qu'il a lui même généré et utilise ça pour générer la suite).
Pour la distinction IA vs algo, plutôt d'accord dans l'ensemble, mais il y a des cas limites, notamment quand l'algo construit et utilise un modèle statistique. Par ex. PageRank est-il un algo ou de l'IA ?
Historique des modifications :
Posté le 07/10/2024 à 19h13
D'accord sauf presque tout sauf le fait de refuser le qualificatif d'"intelligent" aux modèles actuels ou même passés.
Comme tu fais remarquer l'humain n'est pas la seule espèce intelligente. On qualifie d'"intelligence" des comportements de bactéries ou de plantes dont le fonctionnement est pourtant relativement simple, beaucoup plus simple que les modèles actuels.
Si on veut parler de "raisonnement", on peut dire que les LLM raisonnent dans la mesure où pour calculer chaque mot, l'historique des mots préalablement générés est pris en compte (le modèle "voit" ce qu'il a lui même généré et utilise ça pour générer la suite).
Pour la distinction IA vs algo plutôt d'accord dans l'ensemble, mais il y a des cas limites, notamment quand l'algo construit et utilise un modèle statistique. Par ex. PageRank est-il un algo ou de l'IA ?
Posté le 07/10/2024 à 19h54
D'accord pour presque tout sauf le fait de refuser le qualificatif d'"intelligent" aux modèles actuels ou même passés.
Comme tu fais remarquer l'humain n'est pas la seule espèce intelligente. On qualifie d'"intelligence" des comportements de bactéries ou de plantes dont le fonctionnement est pourtant relativement simple, beaucoup plus simple que les modèles actuels.
Si on veut parler de "raisonnement", on peut dire que les LLM raisonnent dans la mesure où pour calculer chaque mot, l'historique des mots préalablement générés est pris en compte (le modèle "voit" ce qu'il a lui même généré et utilise ça pour générer la suite).
Pour la distinction IA vs algo, plutôt d'accord dans l'ensemble, mais il y a des cas limites, notamment quand l'algo construit et utilise un modèle statistique. Par ex. PageRank est-il un algo ou de l'IA ?
#3.2
Je reste quand même sur ma définition s'appuyant sur le déterminisme en incluant la graine (seed) du générateur d'aléa dans les données d'entrée de cet algo.
Et je comprends ton objection sur "intelligent". Je situais l'intelligence au-dessus des bactéries et des plantes.
#3.3
Il est vrai qu'il y a un flou sur la notion d'algorithme et d'IA, surtout quand ce dernier est utilisé à toutes les sauces car c'est devenu un buzz word.
Pour ma part, la distinction que je fais entre algorithme et IA est plus simple.
Pour un algorithme, pas de notion de déterminisme. Seulement une suite d'opération qui conduit à un résultat. A ce niveau là, l'IA est un type d'algorithme.
Pour l'IA, c'est un algorithme qui est affiné par des données (je n'emploie pas le terme "apprendre" sciemment, qui relève de l'anthropomorphisation). Sans parler des réseaux de neurones profonds, une simple régression linéaire peut être vu comme une IA.
Une IA, c'est donc un algorithme dont on connait la topologie (autrement dit, la structure principale) mais où on ne connait pas le détail avec précision (le poids des différents coefficients) et qui nécessite donc des données pour trouver des valeurs qui donnent de bons résultats.
Qu'on s'entende bien, ce ne sont pas des définitions officielles. C'est juste mon appréciation des choses ;)
On oublie souvent qu'il existe toute une "taxonomie" des algorithmes depuis fort fort longtemps, comme algorithme adaptatif, algorithme par apprentissage, etc. Mais il est vrai que c'est moins "vendeur" qu'intelligence artificielle, surtout lorsqu'on souhaite faire du bullshit marketing.
#4
Pourquoi le flux RSS "Complet" ne comprend pas le podcast ?
#4.1
#4.2
Mais au delà du problème technique, c'était aussi pour pointer du doigt qu'il n'y a pas eu d'article sur Next-tronc pour annoncer Next-branche (les podcasts), et que ça aurait pu être opportun. Si on utilise pas le site et qu'on passe que par les RSS, quasi rien n'indique l'existence du podcast, et c'est pas cool.
#5
Et y'a un débat qu'on a que trop rarement quand on parle d'IA : de quelle intelligence parle-t-on ? Est-ce qu'une fourmi est intelligente ?
L'intelligence est compliquée à définir, et ce serait pourtant primordial dans ce débat de nomenclatures :)
#6
#7
#8
Je trouve qu’une erreur, on peut la remonter, en chercher la cause logique plus ou moins facilement, on peut débuger le programme. L’hallucination, elle, bien malin celui qui pourra retracer la cause réelle de son apparition, le contenu et son apparition restent, pour ce que j’en comprends, aléatoire…