Connexion Premium

L’IA de Google réécrit des titres d’articles et pages web de façon putaclic et erronée

Google-boulgIA

L’IA de Google réécrit des titres d’articles et pages web de façon putaclic et erronée

Illustration : Flock

Aux États-Unis, Google expérimente le fait « d’identifier, sur une page, le contenu susceptible de constituer un titre utile et pertinent par rapport à la requête d’un utilisateur », avant de re-générer par IA les titres des pages et articles qu’il indexe. Quitte à ce qu’ils racontent le contraire, voire n’importe quoi.

The Verge a découvert que le moteur de recherche de Google réécrivait par IA les titres de certains articles. « J’ai utilisé l’outil IA “tricher sur tout” et cela ne m’a aidé à tricher sur rien » a par exemple été réduit à seulement cinq mots : « Outil IA “tricher sur tout” », laissant entendre, à tort, que The Verge en ferait la promotion :

« Au cours des derniers mois, plusieurs membres de l’équipe de The Verge ont constaté que des titres que nous n’avions jamais rédigés apparaissaient dans les résultats de recherche Google — des titres qui ne respectaient pas notre ligne éditoriale et sans aucune indication précisant que Google avait remplacé les mots que nous avions choisis. »

Exemples de titres d’articles revus et corrigés par l’IA de Google – The Verge

« Il s’agit d’une expérience « modeste » et « limitée », qui n’a pas encore reçu l’autorisation d’être déployée à plus grande échelle », ont déclaré à The Verge les porte-parole de Google Jennifer Kutz, Mallory De Leon et Ned Adriance.

Ils précisent que l’idée générale était « d’identifier, sur une page, le contenu susceptible de constituer un titre utile et pertinent par rapport à la requête d’un utilisateur ». L’objectif est « de mieux faire correspondre les titres aux requêtes des utilisateurs et de faciliter l’interaction avec le contenu Web », selon Jennifer Kutz. Ned Adriance souligne que ce test « ne concerne pas spécifiquement les publications d’actualité, mais vise à déterminer comment améliorer les titres de manière générale ».

Google a par ailleurs confirmé que le test utilisait l’IA générative, mais Mallory De Leon précise que « si nous devions réellement lancer un produit basé sur cette expérience, celui-ci n’utiliserait pas de modèle génératif et nous ne créerions pas de titres à l’aide de l’IA générative ». Google n’a pas détaillé, cela dit, comment il pourrait remplacer les titres d’articles sans recourir à l’IA générative.

« Nous passons beaucoup de temps à essayer de rédiger des titres qui soient véridiques, intéressants, amusants et dignes de votre attention, sans pour autant recourir au « clickbait », mais Google semble considérer que nous n’avons pas le droit de promouvoir notre propre travail de cette manière », déplore de son côté The Verge.

Nos confrères sont d’autant plus en colère que le lancement de ce « test » intervient après qu’ils aient déjà documenté, par deux fois ces derniers mois, que l’IA de Google « hallucinait » de nombreux titres racoleurs et erronés dans son algorithme de recommandation Discover.

Google nous prive de notre liberté de promouvoir notre propre travail

Il reste 56% de l'article à découvrir.

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Commentaires (22)

votre avatar
Le risque, c'est pas tant que les gens ne fassent plus confiance à Google (ce qui ne peut pas faire grand mal), mais plutôt que leur confiance dans le journalisme "sérieux" soit encore détérioré.
votre avatar
Je me suis fait la même réflexion. Les « gens » ont déjà souvent la conviction bien ancré qu’Internet c’est Google et que si Google dit un truc c’est que c’est vrai et ont aussi une énorme défiance dans le journalisme donc c’est assez utopiste de croire que la masse populaire va défendre le journaliste et fuir Google.
votre avatar
Je n'arrive même pas à comprendre comment une entreprise peut se dire que "Tiens, et si on changeait les titres des articles avant de les présenter à nos clients ?" est une super idée.
Parce que tant qu'à y aller à fond, autant changer aussi le contenu de l'article ... ah, on me dit dans l'oreillette que des centaines/milliers de site sont déjà générés par l'IA et mettent en ligne des articles àlakon.
votre avatar
Précisément pour ça qu'elles finissent (les ia) par ressortir des articles alakon, à force de manger le caca qu'elles produisent...
votre avatar
Ils ne modifient pas le titre de l'article. Ils modifient l'intitulé des résultats de recherche presentés aux utilisateurs. On s'est habitués à ce que ce soit le titre qui soit repris tel-quel mais, sur le fond, l'initiative n'est pas nécessairement idiote. Ils font, depuis longtemps déjà, une sélection pour choisir l'extrait présenté dans les resultats. Les intitulés excessivement longs nuisent à l'exploitation des résultats et les titres sont parfois trompeurs par rapport aux contenus correspondants. Sur ces points, dans certains cas, une recherche d'amélioration de la pertinence de la présentation des résultats fait sens.

Pour l'instant, l'expérimentation n'est vraiment pas probante. Dans les cas cités ici, la modification n'est pas justifiée et/ou produit l'effet inverse de celui recherché. Sur certains contenus, on aimerait cependant qu'elle fonctionne...
votre avatar
C'est rigolo, je viens de voir passer une news Google intitulée "Next démonte l'IA de Google"
votre avatar
« Je ne vais pas faire confiance à Google bien longtemps s’ils continuent », explique à RSF Sean Hollister,
Tant mieux, que Google continue de se suicider. Un peu de sang frais sur le marché de la recherche en ligne ne fera pas de mal.
votre avatar
Next en PLS : Google change les sous-titres de ses articles :eeek2:

Bon, j'en rigole, mais je rigole jaune. On peut se demander comment ils ont pu penser que :
1) c'était une bonne idée
2) qu'il n'y allait pas y avoir une fronde de la part des rédacteurs humains (journaliste, créateur de contenu, etc.)
3) que cela n'allait pas non plus poser de problèmes légaux (indexer un article et le reprendre tel quel, c'est loin d'être la même chose que de le modifier, et en le modifiant, Google n'est plus une "simple" plateforme, mais pourrait éventuellement être tenu comme responsable des contenus référencés)

Ce monde se barre vraiment en couille...
votre avatar
Je me pose surtout la question de : ça leur apporte quoi, à Google, de faire ça ?
votre avatar
J'imagine qu'ils ont eu la réflexion suivante :
- les gens ne lisent plus les articles, ne mettons qu'un résumé
- les gens ne lisent plus les résumés, ne mettons que le titre
- les gens ne lisent plus les titres, ne mettons qu'un titre abrégé…
votre avatar
OK, mais Google y gagne quoi ?
Comment ça leur rapporte de l'argent ?
Ça leur permet d'éviter que les gens n'utilisent plus Google ? Si c'est le cas, ils utilisent quoi à la place ?
votre avatar
C'est un questionnement rationnel - pareil pour moi, à quoi ça peut bien servir?! Meilleure rétention pour vendre de la pub (après tout c'est le business model) ? Ca reste à prouver.

Et puis j'ai eu cette idée : ils font n'importe quoi. Juste ça.
Google gagne l'équivalent d'un PIB, ils dépensent autant, et des concurrents sur l'IA qui sont aussi gros que eux.
Alors maintenant c'est simple : faite n'importe quoi avec de l'IA, tant qu'on est les premiers à le faire. Et dans le lot, y aura bien 2/3 trucs qui vont accrocher.

Et c'est pas une nouveauté chez Google, les projets à la con sans aucune rentabilité ou business model au lancement. Parce qu'ils gagnent (trop) d'argent et s'en foutent.
votre avatar
Si c'est le cas, ils utilisent quoi à la place ?
Perso ça fait longtemps que je n'utilise plus que Duckduck
votre avatar
On est déjà passé « j’ai demandé à Google » à « j’ai demandé à ChatGPT » donc on a la réponse de ce qui est utilisé à la place.
votre avatar
En y réfléchissant, c'est peut-être un moyen de d'éviter in fine de payer des droits en reformulant tout.
S'il n'y a pas de citation mot pour mot, il n'y a peut-être pas de droits associés.

En faisant ainsi, Google emploie les mêmes recettes que les sites à clic mais en renvoyant tout de même sur un site et sans copier mot pour mot, un peu comme une revue de presse qui reformule les éléments importants.

Il faudrait avoir un éclairage du côté légal de cette pratique pour savoir si cette hypothèse est plausible
votre avatar
J´aime beaucoup le "gloubiboulgia".

Je ne le vois que maintenant. Joli! :yes:
votre avatar
L'AI slop vient de passer à un niveau supérieur, Merci Google...
votre avatar
Vive la démocratisation de l'IA pour notre bien.
votre avatar
Mais vous savez bien que l'IA, c'est super pour la santé ... comme la 5G (référence aux opérations chirurgicales à distance grâce à la 5G).
votre avatar
Nous passons beaucoup de temps à essayer de rédiger des titres qui soient véridiques
en même temps, la définition de "vérité" est très alambiquée ces derniers temps en idiocracy...
votre avatar
C'est grave, vraiment très grave. La confiance dans l'information va être minée.
Et le pire c'est qu'ils s'en rendent même pas compte, probablement perdus dans leurs indicateurs qui montrent juste que les utilisateurs cliquent plus.
Cette fonctionnalité est très appréciée des utilisateurs, et nous continuons à tester l’interface utilisateur afin d’aider les utilisateurs à cliquer et à explorer du contenu sur le web.
Si au lieu de juste suivre les indicateurs de clics, ils présentaient avec transparence la fonctionnalité et les risques, pas sûr qu'elle serait "trés appréciée".
votre avatar
je n'aime pas la tournure «L’IA de Google réécrit» qui personnalise la machine comme «la voiture a renversé» je préfèrerais «Google réécrit les titres avec son IA/LLM»