Connexion
Abonnez-vous

Les chatbots IA ne ramènent quasiment pas de trafic aux éditeurs de sites

Pwned?

Les chatbots IA ne ramènent quasiment pas de trafic aux éditeurs de sites

User/Chimera – Clarote & AI4Media – Better Images of AI

De nombreux éditeurs de presse ont signé des accords avec OpenAI et autres entreprises d'IA génératives, obtenant notamment que leurs chatbots renvoient vers leurs articles. Mais, selon un rapport de Tollbit, ces outils « génèrent en moyenne 95,7 % de clics en moins que les recherches traditionnelles sur Google ».

Le 06 mars à 14h33

« Malgré les affirmations des entreprises d'IA, [nous] constatons que les bots IA génèrent en moyenne 95,7 % de trafic de clics en moins que la recherche traditionnelle sur Google », affirme la plateforme de monétisation de contenus Tollbit dans un rapport [PDF] publié la semaine dernière.

Très peu de clics venant des outils d'IA

Cette startup, créée en 2023, peut mesurer ce trafic puisque sa principale activité est justement, comme l'explique la newsletter Twipe, de négocier pour des éditeurs comme TIME et Adweek le scraping de leurs contenus par les entreprises d'IA génératives. Elle a donc aussi tout intérêt à ce que ces chiffres sortent.

TollBit fait la part des choses entre les moteurs de recherche qui ne s'appuient que sur l'IA et les chatbots basés sur l'IA génératives. Elle affirme que, d'après ses données, « les moteurs de recherche IA offrent un taux de référencement de 0,74 % par scrap, soit le double du taux de 0,33 % pour les chatbots ». Elle précise que « ces chiffres doivent être considérés comme un maximum ; l'utilisation de user agents tiers et cachés peut gonfler artificiellement le taux des produits de recherche d'IA ».

« Ces taux restent extrêmement faibles par rapport au référencement à partir d'une page de résultats du moteur de recherche Google conventionnelle (sans IA). Même en prenant le taux moyen de clics sur les 10 premiers résultats de recherche organique (8,63 %), les interfaces de moteur de recherche IA génèrent 91 % de renvois en moins et les chatbots 96 % », constate Tollbit, en renvoyant au schéma ci-dessous :

Des sites visités 2 millions de fois par un bot en un trimestre

Dans le même temps, Tollbit explique qu'en analysant les données de ses clients, elle a remarqué que les bots des entreprises d'IA sont passés en moyenne 2 millions de fois sur un site pendant le quatrième trimestre 2024, en passant 7 fois sur une même page :

Premiers visés : les sites de ventes dont une page a été visitée plus de 16 fois pendant ce quatrième trimestre par ces bots. La presse nationale américaine voit ses pages visitées plus de 10 fois chacune lors de cette même période :

Scraping levels per page by content category in Q4

L'entreprise a aussi analysé une cohorte de sites de ses clients en gardant la même stratégie de blocage de bots pendant le deuxième semestre de l'année dernière. Elle a remarqué que, sur le trafic total que ces sites accueillent, le taux lié aux bots des entreprises d'IA générative a plus que doublé entre le troisième et le quatrième trimestre de 2024 :

« Nous constatons un afflux de bots sur ces sites chaque fois qu'un utilisateur pose une question », explique le CEO de Tollbit, Toshit Panigrahi, à Forbes : « la demande de contenu des éditeurs n'est pas négligeable ».

Difficile de se couper de ces bots sans perdre en SEO quand même

Il pointe aussi le fait qu'il est difficile pour les éditeurs de site de s'y retrouver dans les différents bots utilisés par ces entreprises pour scraper leur site : « certains, comme Google, semblent utiliser les mêmes robots à des fins multiples, notamment pour indexer le web et récupérer des données pour leurs outils d'intelligence artificielle ».

« Il est très difficile pour les éditeurs de vouloir bloquer Google. Cela pourrait avoir un impact sur leur référencement, et il nous est impossible de déduire exactement à quoi servent leurs robots », ajoute Olivia Joslin, cofondatrice de TollBit.

Commentaires (16)

votre avatar
Incroyable, qui l’eut cru ? 🤣🤣
votre avatar
>Il est très difficile pour les éditeurs de vouloir bloquer Google. Cela pourrait avoir un impact sur leur référencement, et il nous est impossible de déduire exactement à quoi servent leurs robots
C'est peut-être comme ça que Google va gagner la bataille de l'IA : si les sites d'infos bloquent les IAs sauf le Google Bot, Google sera le seul à avoir un IAbot réellement à jour.
votre avatar
Surprenant ! (non) 😂
votre avatar
La surprise est totale.
votre avatar
C'était couru d'avance, je ne sais pas ce qu'ils s'imaginaient.
Le chatbot fait un résumé de la demande, même s'il donne les sources comme l'utilisateur a sa réponse il n'y a pas de raison qu'il aille voir la source.
Avec une recherche Google, on a juste un extrait donc forcément un utilisateur clique pour avoir le détail.
votre avatar
Cette news me fait penser aux articles Wikipédia. Je serai intéressé de connaitre le nombre de clics sur une référence qui ont lieu pour chaque consultation d'un article. Je suppose que c'est dans le même ordre de grandeur ; les gens veulent juste l'info et une fois qu'ils l'ont, la prenne pour acquise sans prendre la peine d'aller vérifier la source.
votre avatar
Le principe du chatbot n'est-il pas de récupérer les infos pertinentes afin d'éviter à l'utilisateur de visiter le site ?
Un peu comme Google News, en fait.
votre avatar
Avec des utilisateurs moyens qui se contentent d'un titre d'article et la mise en captivité de ceux-ci par les plateformes, ça n'a rien d'étonnant. Ce sont les mêmes problématiques que les services d'agrégation type Google News.

Tout comme le comportement de Google qui utilise les mêmes robots d'indexation était déjà une alerte levée il y a plusieurs mois disant que la SEO des sites serait impactée.

Tout ceci ne fait que rappeler la main-mise de Google sur le Web.

Et ce modèle de consommation des contenus au travers de chat bot en mode RAG est aussi un rappel que le modèle économique basé sur l'audience publicitaire est fini. Ca va finir en extension des droits voisins, ou alors c'est déjà dans le périmètre.
votre avatar
Le pire parmi ces bots est celui de Bytedance.
Pas de requêtes sur robots.txt, crawl extrêmement agressif provenant de plus de 10 000 adresses IP.
Bloqué au niveau du FW en ce qui me concerne.
votre avatar
Les 10000 IP sont dans une étendue particulière ?
votre avatar
Je pige pas trop ce que tu veux dire mais les IP proviennent de l'AS 16509 (Amazon02) très difficile à ban bloc vue le nombre de services légitimes qui s'y trouvent.
C'est aussi AS d’où proviennent le plus de "nuissances" sur les serveurs d'hébergerment.
votre avatar
mais les IP proviennent de l'AS 16509 (Amazon02) très difficile à ban bloc vue le nombre de services légitimes qui s'y trouvent.
Ok, c'était un peu le sens de ma question (du coup, c'est difficile à bloquer de manière efficace sans nuire à d'autres services).
votre avatar
Le deuxième sens de sa question (enfin comme je l'ai comprise), c'est comment tu as fait alors pour les bloquer au niveau du firewall ?
votre avatar
Sur une machine Linux, les IPs sont collectées depuis le log (va un petit script Bash) et ajoutées dans un set Ipset.
votre avatar
Mais attendez donc on a disposition des outils d'IA générative ou des requêteur de scrapbots qui foncent en gigabit sur les index? Bah ça alors...
votre avatar
Le modèle économique est encore à bâtir. J'ai demandé à 2 IA (Claude et ChatGPT) de me conseiller pour un petit routeur managé. C'est un domaine où des "accords" avec des marchands peut tout à fait avoir sa place. Après, dans quelle mesure cela va "déformer" la qualité des résultats, comme on le voit avec la recherche Google qui n'a plus aucune pertinence entre les pages sponsorisées et les truqueurs de SEO... l'avenir le dira.
Dans les "conseils d'achat", les accords avec des sites passeront bien sûr par du scraping à défaut d'API propres et ouvertes !

Les chatbots IA ne ramènent quasiment pas de trafic aux éditeurs de sites

  • Très peu de clics venant des outils d'IA

  • Des sites visités 2 millions de fois par un bot en un trimestre

  • Difficile de se couper de ces bots sans perdre en SEO quand même

Fermer