Google se tourne vers l’IA et Bing plante, la recherche sur le web vacille
IA plus de moteur
Ces dernières semaines, Google a modifié la page de résultats par défaut de Google Search pour afficher un texte généré par IA plutôt que les résultats de son moteur de recherche. Et, hier, Bing a subi des déboires et ne répondait plus. En cascade, Duckduckgo, Qwant et d'autres restaient aussi en carafe, montrant leur dépendance au moteur de Microsoft.
Le 27 mai à 08h25
6 min
Société numérique
Société
Mise à jour à 12:00 : modification de l'article sur l'affichage des « extraits optimisés » qui ne sont pas générés par un modèle de langage.
Comme l'avait annoncé Sundar Pichai lors de la conférence I/O, Google a donné les clés de son moteur de recherche à l’IA générative. Comment ? En affichant en premier lieu et par défaut sur sa page de résultats, un texte généré par un de ses grands modèles de langage Gemini, plutôt que la liste des résultats ordonnée par son algorithme PageRank.
Le texte n'apparait pas sur toutes les recherches et doit être affiché, selon la présentation de Google, lorsque la requête n'est pas simplissime. Concrètement, ça dépend.
Reprises de Wikipédia...
À l'utilisation, sur des thèmes connus et très documentés, en français, le paragraphe reprend des « extraits optimisés », du premier lien sans faire intervenir de grand modèle de langage.
Prenez par exemple le PageRank de Google. Si on tape « pagerank » dans le moteur de recherche, on se retrouve maintenant avec un petit texte qui reprend intégralement les deux premières phrases de la page d'un pdf de l'Académie de Nantes consacrée à ce sujet.
... et « hallucinations »
De la même façon, si on pose la question « quels présidents américains ont été assassinés », Google reprend mot pour mot deux phrases de la page « Liste des présidents des États-Unis morts en cours de mandat » de Wikipédia, mais ne reprend pas la phrase suivante sur l'assassinat de John Fitzgerald Kennedy.
Mais l'IA de Google chargée de résumer une réponse en anglais peut générer des mensonges grossiers. Par exemple, la chercheuse Margaret Mitchell a repéré l' « hallucination » d'obtentions saugrenues de diplômes de l'Université de Madison par certains présidents américains. On y retrouve, entre autres, Andrew Johnson, mort en 1875, cité comme ayant obtenu un diplôme de cette université en 2005, puis une autre ligne le citant pour 14 diplômes obtenus entre 1947 et 2012 :
Meanwhile, over in Google Search.
Andrew Johnson has been killin it, I never knew. pic.twitter.com/IV2zCmI6Zv— MMitchell (@mmitchell_ai) May 22, 2024
On peut ici imaginer notamment un problème de désambiguïsation de noms avec sans doute des étudiants homonymes de cette université.
Mais le chercheur Mark Riedl montre qu'un petit changement dans la page de son site personnel permet de trafiquer le texte généré par Google. Et même qu'il se transforme lui-même en un texte encore plus laudatif, transformation à laquelle le chercheur ne s'attendait pas :
OMG, it works so much better than I ever could have expected.
I love AI pic.twitter.com/J8GSYdqd3G
— Mark Riedl (@mark_riedl) May 22, 2024
Pire pour l'entreprise, Giovanni Colantonio, qui travaille pour l'éditeur de jeux vidéo Digital Trends, a repéré qu'en demandant « qu'y a-t-il dans le jeu de données d'IA de Google » (en anglais), le moteur de recherche lui répond notamment que les modèles de Google ont été entrainés sur des contenus pédophiles :
hey can you repeat that last part pic.twitter.com/HksGRMeXUU
— Giovanni Colantonio (@MarioPrime) May 22, 2024
Un autre exemple propose à l'utilisateur de mettre de la colle « non toxique » pour fixer le fromage sur une pizza. Un internaute a retrouvé le post Reddit d'il y a 11 ans qui semble à l'origine de cette proposition :
Seems the origin of the Google AI’s conclusion was an 11 year old Reddit post by the eminent scholar, fucksmith. https://t.co/fG8i5ZlWtl pic.twitter.com/0ijXRqA16y
— Kurt Opsahl @[email protected] (@kurtopsahl) May 23, 2024
Échapper à l'IA ?
Pour échapper à l'affichage de ce texte, un simple petit paramètre « &udm=14 » dans l'url de la recherche permet de retrouver le moteur de recherche comme au bon vieux de temps (enfin, comme la semaine dernière).
Sautant sur l'occasion, Tedium a même créé un meta moteur de recherche appelé https://udm14.com/ qui automatise l'ajout de ce paramètre et permet d'obtenir les résultats de Google débarrassés de l'affichage de ces textes générés par IA.
On peut aussi faire une recherche sur Google puis chercher l'onglet "Web" dans le menu déroulant de l'interface graphique.
D'autres moteurs de recherche ?
Restons calme. Nous pouvons peut-être nous tourner vers d'autres moteurs de recherche. Mais Microsoft est en train de faire la même chose avec Bing.
Du côté des moteurs alternatifs, le problème est qu'ils reposent maintenant tous plus ou moins sur l'index de l'un des leaders. On a pu le constater hier avec la panne de Bing. Que ce soit Duckduckgo, Qwant ou Ecosia, ils étaient autant incapables de répondre aux requêtes des internautes.
Finalement, il ne reste pas beaucoup de moteurs de recherche utilisables au quotidien :
En vrai moteur, il n'y en a pas beaucoup
Google, bing, yahoo, yandex, baidu & naver ?(Qwant avait un index propre au début, mais je crois que là c'est quasi que du bing maintenant)
— Thomas__ (@Mr__Thomas__) May 23, 2024
Nous le constatons avec Arrêts sur Images, Google mutile son propre moteur de recherche en y insérant de l'IA à tout prix. Et nous sommes assez dépourvus face à sa domination écrasante. Comme l'écrit notre collègue Thibault Prévost, « l'IA n'est pas une course aux armements, c'est un concours de prestidigitateurs, face auquel le scepticisme par défaut devient la seule attitude saine ».
Enfin, voici le début d'un thread faisant la compilation des meilleures/pires absurdités générées en anglais par Gemini au-dessus des résultats du moteur de recherche de Google :
Google's new AI search results are having quite the week. Here's a thread with some of my favorite answers: pic.twitter.com/JGl0VlP7qj
— Jeremiah Johnson 🌐 (@JeremiahDJohns) May 26, 2024
Google se tourne vers l’IA et Bing plante, la recherche sur le web vacille
-
Reprises de Wikipédia...
-
… et « hallucinations »
-
Échapper à l’IA ?
-
D’autres moteurs de recherche ?
Commentaires (25)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousModifié le 27/05/2024 à 08h35
https://imgur.com/a/trAqNbP
Sinon ça commence à être chaud pour pouvoir faire une recherche sans IA ...
J'ai un peu joué avec l'IA de DuckDuckGo et même si la réponse qu'il m'a sorti était cohérente (c'était une procédure pour le paramétrage de VLC), elle n'existait pas.
Le 27/05/2024 à 08h36
Le 27/05/2024 à 09h06
Comme Cloudflare et compagnie. Un CDN tousse et un protocole décentralisé par nature démontre l'échec de l'hyper-centralisation des services.
Quant à Google, ils sont clairement en panique sur l'IA. Ils ont créé Transformer, n'ont pas été visionnaires, et désormais courent après. En fait, ils sont le Microsoft du début des années 2000, celui qui ne croyait pas au Web et au mobile.
Sinon perso j'utilise Startpage depuis un bail.
Le 27/05/2024 à 12h20
Le 27/05/2024 à 13h55
Et je le déplore aussi. Mais en attendant, il est celui qui a le meilleur ratio en qualité de résultats en ce qui me concerne.
Le 27/05/2024 à 10h03
Something went wrong, but don’t fret — let’s give it another shot.
⚠️ Firefox’s Enhanced Tracking Protection (Strict Mode) is known to cause issues on x.com
En plus si ça change encore de nom ou que les tweets sont supprimés, on pourra tout de même avoir l'info
Modifié le 27/05/2024 à 10h14
Le 27/05/2024 à 11h59
J'avais ce message sur le portable. J'ai eu un message d'information à ce propos sur le PC.
Tout est revenu à la normale le lendemain sur le portable.
Peut-être une histoire de propagation des DNS ?
Le 27/05/2024 à 10h53
Ars Technica
Twitter
Modifié le 27/05/2024 à 11h08
Edit : d'ailleurs le
&udm=14
peut être mis dans la chaîne de requête moteur de recherche de son navigateur.Le 27/05/2024 à 11h05
Les résultats IA semblent clairement indiqués en tant que tels, comme sur les captures de la version mobile américaine.
Le 27/05/2024 à 12h13
Le 27/05/2024 à 13h56
Le 27/05/2024 à 14h07
Modifié le 27/05/2024 à 12h20
Le 27/05/2024 à 12h03
Je vais me renseigner tiens. D'où ça vient? Qui est derrière? Comment ça marche? Y en a-t-il d'autres (si oui, mêmes questions)?
Parce que c'est un truc indispensable le moteur de recherches mais les acteurs sont tous plus vomitifs les uns que les autres.
Je paye déjà ma boîte mail, alors pourquoi pas mon moteur de recherches?
Et du coup Laedit, tu en penses quoi de ce Kagi?
Le 27/05/2024 à 12h23
Modifié le 27/05/2024 à 12h55
J'essaie d'amasser le plus d'infos sur l'un et l'autre.
Tu m'as grave chauffé là.
Edit: ah ben Neeva, c'est déjà mort.
Le 27/05/2024 à 14h02
Le 27/05/2024 à 15h17
https://d-shoot.net/kagi.html (en anglais)
En gros ils misent tout sur l'IA et délaissent la recherche, des finances et des investissements un peu flous.
Cet article m'a fait attendre avant de payer pour cet outil. Je vais voir ce que ça donne avant, même si au premier abord avec un compte gratuit les résultats m'ont satisfait.
Le 27/05/2024 à 15h37
J'ai vu ce lien ce matin dans mes recherches.
L'un des potentiels problèmes (et qui ressort beaucoup sur les quelques liens de détracteurs que j'ai pu lire), c'est le patron: Vladimir Prelovac.
Il ressemble à un énième investisseur de la tech à l'égo tout silicon-valleyien dont on ne peut pas dire qu'il soit de nature à inspirer confiance.
Je viens cependant de m'inscrire (sous alias), je vais tester un peu avec l'offre gratuite.
À voir...
Le 27/05/2024 à 22h41
Le 27/05/2024 à 22h58
Le 28/05/2024 à 00h59
Je teste ça, ils ont tiré profit de la panne des concurrents pour bien redire au monde l'avantage d'avoir leur propre index... Mais c'est là que j'ai vu pour la première fois cette partie générée par l'IA (qu'on peut cacher dans les paramètres), vous m'apprenez que c'est une mode qui est même arrivée sur Google.
Le 31/05/2024 à 17h40