Connexion
Abonnez-vous

Google se tourne vers l’IA et Bing plante, la recherche sur le web vacille

IA plus de moteur

Google se tourne vers l’IA et Bing plante, la recherche sur le web vacille

Ces dernières semaines, Google a modifié la page de résultats par défaut de Google Search pour afficher un texte généré par IA plutôt que les résultats de son moteur de recherche. Et, hier, Bing a subi des déboires et ne répondait plus. En cascade, Duckduckgo, Qwant et d'autres restaient aussi en carafe, montrant leur dépendance au moteur de Microsoft.

Le 27 mai à 08h25

Mise à jour à 12:00 : modification de l'article sur l'affichage des « extraits optimisés » qui ne sont pas générés par un modèle de langage.

Comme l'avait annoncé Sundar Pichai lors de la conférence I/O, Google a donné les clés de son moteur de recherche à l’IA générative. Comment ? En affichant en premier lieu et par défaut sur sa page de résultats, un texte généré par un de ses grands modèles de langage Gemini, plutôt que la liste des résultats ordonnée par son algorithme PageRank.

Le texte n'apparait pas sur toutes les recherches et doit être affiché, selon la présentation de Google, lorsque la requête n'est pas simplissime. Concrètement, ça dépend.

Reprises de Wikipédia...

À l'utilisation, sur des thèmes connus et très documentés, en français, le paragraphe reprend des « extraits optimisés », du premier lien sans faire intervenir de grand modèle de langage.

Prenez par exemple le PageRank de Google. Si on tape « pagerank » dans le moteur de recherche, on se retrouve maintenant avec un petit texte qui reprend intégralement les deux premières phrases de la page d'un pdf de l'Académie de Nantes consacrée à ce sujet.

... et « hallucinations »

De la même façon, si on pose la question « quels présidents américains ont été assassinés », Google reprend mot pour mot deux phrases de la page « Liste des présidents des États-Unis morts en cours de mandat » de Wikipédia, mais ne reprend pas la phrase suivante sur l'assassinat de John Fitzgerald Kennedy.

Mais l'IA de Google chargée de résumer une réponse en anglais peut générer des mensonges grossiers. Par exemple, la chercheuse Margaret Mitchell a repéré l' « hallucination » d'obtentions saugrenues de diplômes de l'Université de Madison par certains présidents américains. On y retrouve, entre autres, Andrew Johnson, mort en 1875, cité comme ayant obtenu un diplôme de cette université en 2005, puis une autre ligne le citant pour 14 diplômes obtenus entre 1947 et 2012 :

On peut ici imaginer notamment un problème de désambiguïsation de noms avec sans doute des étudiants homonymes de cette université.

Mais le chercheur Mark Riedl montre qu'un petit changement dans la page de son site personnel permet de trafiquer le texte généré par Google. Et même qu'il se transforme lui-même en un texte encore plus laudatif, transformation à laquelle le chercheur ne s'attendait pas :

Pire pour l'entreprise, Giovanni Colantonio, qui travaille pour l'éditeur de jeux vidéo Digital Trends, a repéré qu'en demandant « qu'y a-t-il dans le jeu de données d'IA de Google » (en anglais), le moteur de recherche lui répond notamment que les modèles de Google ont été entrainés sur des contenus pédophiles :

Un autre exemple propose à l'utilisateur de mettre de la colle « non toxique » pour fixer le fromage sur une pizza. Un internaute a retrouvé le post Reddit d'il y a 11 ans qui semble à l'origine de cette proposition :


Échapper à l'IA ?

Pour échapper à l'affichage de ce texte, un simple petit paramètre « &udm=14 » dans l'url de la recherche permet de retrouver le moteur de recherche comme au bon vieux de temps (enfin, comme la semaine dernière).

Sautant sur l'occasion, Tedium a même créé un meta moteur de recherche appelé https://udm14.com/ qui automatise l'ajout de ce paramètre et permet d'obtenir les résultats de Google débarrassés de l'affichage de ces textes générés par IA.

On peut aussi faire une recherche sur Google puis chercher l'onglet "Web" dans le menu déroulant de l'interface graphique.

D'autres moteurs de recherche ?

Restons calme. Nous pouvons peut-être nous tourner vers d'autres moteurs de recherche. Mais Microsoft est en train de faire la même chose avec Bing.

Du côté des moteurs alternatifs, le problème est qu'ils reposent maintenant tous plus ou moins sur l'index de l'un des leaders. On a pu le constater hier avec la panne de Bing. Que ce soit Duckduckgo, Qwant ou Ecosia, ils étaient autant incapables de répondre aux requêtes des internautes.

Finalement, il ne reste pas beaucoup de moteurs de recherche utilisables au quotidien :

Nous le constatons avec Arrêts sur Images, Google mutile son propre moteur de recherche en y insérant de l'IA à tout prix. Et nous sommes assez dépourvus face à sa domination écrasante. Comme l'écrit notre collègue Thibault Prévost, « l'IA n'est pas une course aux armements, c'est un concours de prestidigitateurs, face auquel le scepticisme par défaut devient la seule attitude saine ».

Enfin, voici le début d'un thread faisant la compilation des meilleures/pires absurdités générées en anglais par Gemini au-dessus des résultats du moteur de recherche de Google :


Commentaires (25)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar
Pour la reprise de Wikipedia, le texte ne provient pas de Wikipedia mais du lien indiqué juste en dessous (page 6).
https://imgur.com/a/trAqNbP

:yaisse:

Sinon ça commence à être chaud pour pouvoir faire une recherche sans IA ...
J'ai un peu joué avec l'IA de DuckDuckGo et même si la réponse qu'il m'a sorti était cohérente (c'était une procédure pour le paramétrage de VLC), elle n'existait pas.
votre avatar
Perso. je trouve ça génial. Google et d'autres ont dépensé une fortune et se font seppuku.
votre avatar
Les API Bing qui se vautrent et le Web qui part avec, comme à chaque fois que je vois ça : Et SPOF le chien !

Comme Cloudflare et compagnie. Un CDN tousse et un protocole décentralisé par nature démontre l'échec de l'hyper-centralisation des services.

Quant à Google, ils sont clairement en panique sur l'IA. Ils ont créé Transformer, n'ont pas été visionnaires, et désormais courent après. En fait, ils sont le Microsoft du début des années 2000, celui qui ne croyait pas au Web et au mobile.

Sinon perso j'utilise Startpage depuis un bail.
votre avatar
Je ne comprends pas ta remarque sur Startpage. Tu critiques la dépendance aux API de Bing mais Startpage est dépendant des API de Google à moins que ça ait changé dernièrement.
votre avatar
Oui, je sais très bien que c'est un front pour Google. Il a donc le même risque que ceux qui reposent sur Bing.

Et je le déplore aussi. Mais en attendant, il est celui qui a le meilleur ratio en qualité de résultats en ce qui me concerne.
votre avatar
Y aurait moyen de mettre les screenshots des liens twitter incriminés svp ? J'ai cette erreur lorsque je clique sur les liens :

Something went wrong, but don’t fret — let’s give it another shot.
⚠️ Firefox’s Enhanced Tracking Protection (Strict Mode) is known to cause issues on x.com

En plus si ça change encore de nom ou que les tweets sont supprimés, on pourra tout de même avoir l'info
votre avatar
Je confirme, perso je bloque aussi ce contenu pour éviter de me faire renifler le cul par eux.
votre avatar
C'est suite à la bascule vers l'adresse x la semaine dernière.
J'avais ce message sur le portable. J'ai eu un message d'information à ce propos sur le PC.
Tout est revenu à la normale le lendemain sur le portable.
Peut-être une histoire de propagation des DNS ?
votre avatar
"&udm=14" : il y a encore plus simple : cliquer, en haut à droite, sur Plus/More, puis "Web", de sorte d'obtenir les résultats de Google sans les rajouts d'IA, cf :
arstechnica.com Ars Technica
x.com Twitter
votre avatar
Mmmh... Entre le truc à ajouter dans l'URL et les clics pour trouver les machins cachés dans les GUI moisies de Google, j'ai un doute entre ce qui est plus "simple" :transpi:

Edit : d'ailleurs le &udm=14 peut être mis dans la chaîne de requête moteur de recherche de son navigateur.
votre avatar
Je ne suis pas certain que les illustrations françaises de cet article montrent les résultats IA, mais plutôt des extraits de la page dont le lien se situe juste en dessous. Cela fait un bon moment que j'ai ce type de résultat avec également une section "Autres questions" en dessous qui agit de la même manière.

Les résultats IA semblent clairement indiqués en tant que tels, comme sur les captures de la version mobile américaine.
votre avatar
Effectivement, l'affichage peu clair de Google m'a induit en erreur. J'ai mis à jour l'article. Merci
votre avatar
l'affichage peu clair de Google
Pléonasme :p
votre avatar
C'est facile d'accuser l'outil.
votre avatar
Je test kagi depuis peu, qui est un moteur de recherche payant mais qui a son propre index (d'après lui en tout cas).
votre avatar
Ooooooh!

Je vais me renseigner tiens. D'où ça vient? Qui est derrière? Comment ça marche? Y en a-t-il d'autres (si oui, mêmes questions)?

Parce que c'est un truc indispensable le moteur de recherches mais les acteurs sont tous plus vomitifs les uns que les autres.

Je paye déjà ma boîte mail, alors pourquoi pas mon moteur de recherches?


Et du coup Laedit, tu en penses quoi de ce Kagi?
votre avatar
Ça ne fait que deux jours donc c'est un peut tôt pour dire mais les résultats ont l'air correct et rien que le fait de pas avoir de réponse par IA (sauf souhaité explicitement) ou de pubs vaut largement le coup à mes yeux.
votre avatar
En cherchant un peu, les deux qui ressortent sur ce marché sont donc Kagi et Neeva (par 2 anciens de Google, lol).

J'essaie d'amasser le plus d'infos sur l'un et l'autre.

Tu m'as grave chauffé là. :iloveyou:


Edit: ah ben Neeva, c'est déjà mort. :mad2:
votre avatar
Ah mince, en lisant le début de ta réponse je me disais justement que je tenterais bien Neeva aussi :p
votre avatar
J'ai déjà ça comme ressource à propos de Kagi et ce qu'il y a derrière la façade.
https://d-shoot.net/kagi.html (en anglais)
En gros ils misent tout sur l'IA et délaissent la recherche, des finances et des investissements un peu flous.
Cet article m'a fait attendre avant de payer pour cet outil. Je vais voir ce que ça donne avant, même si au premier abord avec un compte gratuit les résultats m'ont satisfait.
votre avatar
Merci. :yes:

J'ai vu ce lien ce matin dans mes recherches.

L'un des potentiels problèmes (et qui ressort beaucoup sur les quelques liens de détracteurs que j'ai pu lire), c'est le patron: Vladimir Prelovac.

Il ressemble à un énième investisseur de la tech à l'égo tout silicon-valleyien dont on ne peut pas dire qu'il soit de nature à inspirer confiance.

Je viens cependant de m'inscrire (sous alias), je vais tester un peu avec l'offre gratuite.

À voir...
votre avatar
Il y a également Mojeek qui semble avoir son propre index (et d'après Wikipédia, Kagi utilise des résultats de Mojeek). La dernière fois que je l'ai testé ce n'était pas trop concluant pour mes recherches au travail, mais je lui redonne régulièrement sa chance :)
votre avatar
Merci, je vais y jeter un oeil. :yes:
votre avatar
https://search.brave.com/

Je teste ça, ils ont tiré profit de la panne des concurrents pour bien redire au monde l'avantage d'avoir leur propre index... Mais c'est là que j'ai vu pour la première fois cette partie générée par l'IA (qu'on peut cacher dans les paramètres), vous m'apprenez que c'est une mode qui est même arrivée sur Google.
votre avatar
Vous devriez vraiment passer à des captures d'écran pour Twitter. :transpi: Nombre de gens l'ont quitté pour de bon, c'est pas pour y revenir pour voir chaque message cité ici...

Google se tourne vers l’IA et Bing plante, la recherche sur le web vacille

  • Reprises de Wikipédia...

  • … et « hallucinations »

  • Échapper à l’IA ?

  • D’autres moteurs de recherche ?

Fermer