Google autorise les sites web à refuser explicitement les résumés IA
Merci, mais non merci
Le 03 juin à 17h04
Depuis un peu plus de deux ans, Google affiche ses AI Overviews tout en haut d’une recherche web, autrement dit un résumé des résultats généré par IA. Ils ne tombent pas du ciel : les informations qu’ils contiennent proviennent de sites web qui vont finalement avoir la possibilité explicite d’exclure leurs contenus du moissonnage effectué par le moteur de recherche. Trop peu, trop tard ?
Google autorise les sites web à refuser explicitement les résumés IA
Merci, mais non merci
Depuis un peu plus de deux ans, Google affiche ses AI Overviews tout en haut d’une recherche web, autrement dit un résumé des résultats généré par IA. Ils ne tombent pas du ciel : les informations qu’ils contiennent proviennent de sites web qui vont finalement avoir la possibilité explicite d’exclure leurs contenus du moissonnage effectué par le moteur de recherche. Trop peu, trop tard ?
IA et algorithmes
IA
4 min
Les AI Overviews, visibles aux États-Unis depuis leur lancement en mai 2024, sont maintenant présents dans une centaine de pays (la France est toujours exclue). Ces résumés ont été complétés un an plus tard par l’AI Mode, qui tente de concurrencer directement les moteurs de recherche IA comme Perplexity ou ChatGPT.
Google demande enfin la permission d’aspirer le web
Durant la dernière édition de la Google I/O, le géant américain en a remis une couche avec une avalanche de nouveautés IA pour son moteur de recherche – offrant au passage au mode « No AI » de DuckDuckGo un joli coup de pouce. Aussi incroyable que cela puisse paraitre, il existe des internautes qui apprécient peu le forcing IA de Google. C’est le cas aussi pour plusieurs éditeurs de sites web, qui refusent obstinément que leurs contenus soient collectés sans autorisation ni rémunération pour se transformer en données d’entraînement.
Il existe des mécanismes qui empêchent les robots de scraping de moissonner les contenus du web ouvert. Le fichier robots.txt est le plus commun, il permet à un site de refuser l’accès à certaines de ses pages pour l’indexation web et la collecte IA. Voilà pour la théorie, mais en pratique rien n’empêche un bot mal élevé d’ignorer ces consignes et de parcourir l’intégralité d’un site. Perplexity est régulièrement pointé du doigt à ce sujet.
Google a commencé à déployer un nouvel outil qui va permettre aux éditeurs web de décider, depuis la Search Console, si leurs sites peuvent apparaitre dans les résumés générés par IA. C’est un changement de taille, le groupe ayant plutôt cherché à flouter la frontière entre l’indexation et le scraping. Il promet la main sur le cœur que cela n’aura aucun impact sur l’indexation traditionnelle. En activant ce bouton depuis la console de recherche, un site ne recevra « ni trafic ni impressions provenant de nos fonctionnalités d’IA générative », martèle Google. Est-ce pour autant un drame ?
Google affirme régulièrement que les résumés IA dans les résultats de recherche ne font pas diminuer le trafic des sites d’où les informations sont extraites. Une étude du Pew Research Center, publiée en juillet dernier, affirmait le contraire. L’entreprise s’était d’ailleurs pris les pieds dans le tapis en évoquant un web ouvert en « déclin rapide » en raison du marché publicitaire chamboulé par l’IA.
La mise en place de ce bouton n’a rien d’un geste désintéressé ou d’une branche d’olivier lancé aux éditeurs, car sinon pourquoi avoir attendu deux ans ? C’est simplement le résultat d’une obligation réglementaire imposée par la CMA, l’autorité de la concurrence britannique. « Pour la première fois au monde, les éditeurs disposeront d’outils leur permettant d’empêcher l’utilisation de leurs contenus par les fonctionnalités d’IA de la recherche Google », se réjouit le régulateur.
Ce dernier ajoute que les éditeurs seront ainsi « mieux armés pour négocier des accords de licence avec Google, notamment dans le secteur de la presse ». L’intention est louable, mais rien n’empêchera Google d’utiliser les contenus provenant d’autres sites web plus conciliants pour générer ses résumés IA.
Commentaires (1)
Abonnez-vous pour prendre part au débat
Déjà abonné ou lecteur ? Se connecter
Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles d'un média expert
Profitez d'au moins 1 To de stockage pour vos sauvegardes
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousAujourd'hui à 17h21
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?