Connexion Abonnez-vous

Ibou : comment le moteur de recherche « made in France » veut indexer le web

Y aura-t-il des ads ibou ?

Ibou : comment le moteur de recherche « made in France » veut indexer le web

Est-il possible de créer aujourd'hui un moteur de recherche sans faire partie des plus grosses entreprises du secteur ? Pour explorer ce thème, nous nous sommes entretenus avec Sylvain Peyronnet, PDG de Babbar.

Le 24 septembre à 10h22

Depuis quelques semaines, Next a repéré sur les réseaux sociaux un nouveau projet français de moteur de recherche (conversationnel, cette fois) porté par l'entreprise Babbar : Ibou. Connaissant un autre projet de moteur de recherche dont les résultats se sont trouvés datés et limités, nous étions curieux de savoir s'il était possible d'en monter un avec un index correct, à jour et qui pourrait profiter des nouvelles technologies comme les LLM pour améliorer son fonctionnement.

Nous avons interrogé Sylvain Peyronnet, PDG de Babbar. Son entreprise est spécialisée dans les outils permettant aux spécialistes du SEO d'améliorer leurs stratégies. Lui est un ancien enseignant-chercheur en intelligence artificielle, mais aussi l'ancien responsable scientifique de Qwant, parti en 2019.

>> Qu’est-ce qu’il y a derrière ce nom d’Ibou à l’apparence très française ?

C’est un projet de moteur de recherche de l’entreprise Babbar. Celle-ci fait, depuis que j’ai quitté Qwant et qu’on l’a montée, des outils qui font tourner en arrière-plan un moteur recherche, pour comprendre ce que fait Google et fournir de la data aux gens qui font du référencement web. Pour différentes raisons, nous avons décidé de pivoter. Nous avons commencé à créer un moteur de recherche conversationnel depuis quelques mois. Et nous l’avons annoncé quasiment dès qu’on a commencé le travail.

Ibou, même si on joue beaucoup avec des logos liés à l’oiseau parce qu’on est en France, ça n’a rien à voir : c’est un mot d’égyptien ancien qui veut dire « les cœurs », car, dans l’Égypte ancienne, le cœur était le siège du raisonnement et de la mémoire.

>> Qu'est-ce qui vous a amenés à imaginer ce projet ?

En travaillant dans le secteur du moteur de recherche depuis longtemps, nous nous sommes rendu compte de plusieurs choses.

Déjà, jusqu'au paradigme conversationnel, les moteurs n’étaient pas vraiment faits pour de la recherche d’information, mais pour de la recherche documentaire : ils renvoyaient des pages web. Pourtant, quand les gens tapent une requête dans un moteur, la plupart du temps, ils s’en fichent un peu. Ce qu’ils attendent, c’est une réponse qui les satisfait et qui leur permet de réaliser les tâches qu’ils veulent réaliser.

« L’émergence des LLM a permis de faire percoler des informations humaines dans des objets mathématiques »

Ensuite, pour faire un bon moteur, le nerf de la guerre était d'avoir beaucoup de données utilisateurs pour comprendre l’être humain et affiner ce que faisaient les algorithmes et qui n’était jamais parfait. Et pour parfaire les résultats d’un moteur, il fallait beaucoup de comportements humains.

Il reste 88% de l'article à découvrir.

Déjà abonné ? Se connecter

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Commentaires (23)

votre avatar
Je souhaite toute réussite et bonheur à cette initiative et à ses équipes. Je ne suis absolument pas un public pour les « moteur de recherche conversationnel » donc pas client, mais j'imagine que d'autres le sont.
votre avatar
J’ai du mal à faire confiance à un moteur de recherche fait par une boite spécialisée dans la fraude aux classement, oups SEO…

D’autant plus avec le passif Qwant…
votre avatar
Du coup, tu ferais confiance à quel moteur ? :keskidit:
votre avatar
Je crois que tu confonds avec Google.
votre avatar
Je n'ai jamais dit que je faisais confiance à Google…
votre avatar
Super trouvaille si les promesses sont tenues.

J'aime bien plusieurs points :
- la séparation de la connaissance (moteur de recherche) et de l'interface avec l'humain (LLM).
- la publicité ciblée par le contexte et pas les données personnelles.
- l'analyse de la demande par le LLM pour ensuite attaquer le moteur de recherche.
- la synthèse que peut faire le LLM à partir de plusieurs sources.
- le fait de renvoyer aux sources.

J'aime moins que la même société fasse un outil pour le SEO : à un moment donné, qui sera privilégié les clients SEO ou les utilisateurs du moteur ?
votre avatar
Les clients SEO, pardi.
votre avatar
Je pense qu'il est difficile d'avoir la réponse aujourd'hui parce que le moteur de recherche n'est pas public. Si le moteur de recherche fait le plus de bénéfices, il n'y a pas de raison que ta réponse soit la bonne. En plus, s'ils favorisaient leurs clients SEO, la qualité de leur moteur s'en ressortirait et ça pourrait tuer le produit.

Vu le discours, je suis prêt à penser qu'ils sont honnêtes. S'il y avait ce dilemme, le mieux serait de séparer en 2 sociétés et revendre une des activités.
votre avatar
Ils semblent respecter le robots.txt sur le papier ce qui est bien : https://www.babbar.tech/crawler

Mais en pratique je les ai quand même bloqués car pas intéressé de figurer dans les recherches d'ia.
votre avatar
Les infos pour le crawler de Ibou : https://ibou.io/iboubot.html
votre avatar
Tiens, je profite de cette intervention pour poser une question hors sujet mais qui me trotte dans la tête depuis un moment :
vos illustrations reproduisant un portrait des personnes interviewées sont faites comment ? Quels droits (de reproduction, de propriété intellectuelle) s'appliquent ?
votre avatar
La plupart du temps, on demande une photo à la personne interviewée.
votre avatar
J'avais bien compris que ça partait d'une photo, mais il me semble qu'il y a un traitement de l'image assez important dans le sens où ça modifie pas mal la photo initiale en plus de la duplication de l'image. Ma question portait là-dessus. Quel outil, traitement d'image classique, IA ?
votre avatar
Je laisse @Flock répondre sur ça :)
votre avatar
Pourquoi sortir la grosse artillerie ? Surtout que le traitement photo ici c'est la plupart du temps un coup de Gimp, traitement noir et blanc + 3 calques.
votre avatar
C’est exactement ça, c’est un traitement basique, tout simple.
votre avatar
Comme pour cdn.next.ink Next c'est un traitement basique, tout simple aussi ?

Krkrkrkr.

Bon, c'est une blague hein, je présente mes excuses si elle de mauvais goût.
votre avatar
Je ne répondrai qu’en présence de mon chirurgien. :windu:
votre avatar
Et un crawler d'IA de plus à bloquer. Comme chaque semaine.
votre avatar
Ce n'est pas un crawler d'IA mais un crawler classique de moteur de recherche. Il explique suffisamment ce qu'ils font.
L'IA n'est utilisée que pour interpréter les demandes des utilisateurs et restituer les résultats trouvés sur les pages Web. Elle n'indexe pas tout le Web.
votre avatar
Déjà, jusqu'au paradigme conversationnel, les moteurs n’étaient pas vraiment faits pour de la recherche d’information, mais pour de la recherche documentaire : ils renvoyaient des pages web. Pourtant, quand les gens tapent une requête dans un moteur, la plupart du temps, ils s’en fichent un peu. Ce qu’ils attendent, c’est une réponse qui les satisfait et qui leur permet de réaliser les tâches qu’ils veulent réaliser.
J'aime les nouvelles boites qui arrivent et disent à tout le monde "vous faites mal, je vais vous montrer comment il faut faire". Il n'y a pas de raison que cela se passe mal.
J'ai hâte de voir la réaction des zayant-droits et autres sites qui publient sur le web et râlent de se faire piller.
votre avatar
Interview très intéressante, notamment sur la partie usage des LLM qui sont utilisés pour analyser les sites webs pour faire la partie ranking et non regurgiter les données contenues en son sein.
Une approche complètement différente de ce pourquoi on entend parler des LLM en général.

Bon maintenant c'est un beau discours, des belles intentions, on verra d'une part si c'est vraiment performant et d'autre part si le grand public sera intéressé par quelque chose qui ne s'appuie pas sur la dopamine.
votre avatar
babar, (ad)ibou... un projet vu a la télé :D

Ibou : comment le moteur de recherche « made in France » veut indexer le web

  • « L’émergence des LLM a permis de faire percoler des informations humaines dans des objets mathématiques »

  • « On veut aussi garantir un pluralisme »

  • « Quelqu’un qui fait 20 ou 30 millions d’euros par an en France peut faire un moteur de recherche très rentable »

  • « La connaissance, c’est du ressort du moteur de recherche et des sources, pas du LLM »

  • « Faire un index qui classe les bonnes pages dans les premières, c’est ça qui est difficile »

Fermer