Qwant, un vrai faux moteur de recherche ? Des accusations aux explications
La société revendique développer son propre système d’indexation
Le 19 février 2013 à 18h19
7 min
Internet
Internet
Disponible en bêta depuis la semaine dernière, le moteur de recherche Qwant a beaucoup fait parler de lui au cours des derniers jours, et pas forcément toujours dans le bon sens. Afin de répondre, mais en partie seulement, aux critiques formulées par un blogueur qui se présente sous le pseudonyme de Lucien Théodore, la société a publié un billet détaillé.
Sorti de l'ombre en début de semaine dernière, Qwant se présente comme « un moteur de recherche nouvelle génération ». Il vient donc se poser comme une alternative à Bing et à Google par exemple, mais avec une mise en page qui se veut différente.
Peu de temps après son lancement, un blogueur qui souhaite visiblement rester anonyme a pointé de grosses similitudes entre les résultats fournis par ce dernier et ceux de Yahoo (qui exploite la base de données de Bing). Il annonce également que les résultats de la recherche sociale seraient identiques à ceux de Kurrently, tandis que le Shopping ne proviendrait que d'Amazon.
Il finit par conclure que, « en fin de compte, Qwant est une vraie déception ce n’est pas un nouveau moteur de recherche et encore moins un moteur de recherche « made in France ». C’est juste une interface, pas forcément réussie, qui utilise les technologies d’autres moteurs de recherche et qui les présente à sa sauce ». De son côté, Qwant a décidé de répondre... mais en partie seulement.
Qwant a son propre système d'indexation, mais complète ses résultats avec d'autres
Tout d'abord, le service annonce avoir « développé un système propre d’indexation à partir de la technologie apportée par Pertimm, une des sociétés à l’origine de la création de Qwant » avant d'ajouter que « les moteurs d’indexation nécessitant non seulement de gigantesques puissances de calcul et de stockage, mais également un historique important, Qwant complète ses propres données avec des données obtenues auprès d’autres moteurs de recherches durant la phase de montée en puissance de son infrastructure. Ces mélanges disparaîtront dès lors que le déploiement sera finalisé et l’ensemble des résultats proposés proviendront dès lors du seul travail d’indexation et de ranking effectué par Qwant ».
La société confirme donc s'appuyer sur d'autres moteurs de recherches, mais ne dévoile malheureusement aucun nom, ni le pourcentage de requêtes qui sont traitées de la sorte. Nous l'avons évidemment contacté afin d'obtenir de plus amples informations. Nous n'avons pour le moment eu aucune réponse sur ce point.
Interrogé par nos confrères du Figaro, Éric Léandri (directeur général de Qwant), reconnait que ce manque de communication était une « erreur » en ajoutant que « c'était une façon de faire pour que tous les mots donnent immédiatement des résultats ». Quoi qu'il en soit, certains regretteront surement que la situation n'ait pas été clarifiée dès le début.
Voici les résultats retournés par Qwant, Bing et Yahoo avec la requête Android
Comme vous pouvez le constater sur les images ci-dessus, les résultats fournis par Yahoo et Qwant sont très proches sur la requête Android (nos tests ont été effectués au même moment, sous Chrome et en navigation privée), mais pas totalement identiques. En effet, le premier propose en septième position le Play Store, tandis que pour le second il se trouvera à la deuxième page. Dans d'autres cas par contre, il ne semble pas y avoir de différences.
La recherche sociale est maison, mais pas celle sur les médias (audio / vidéo)
La situation est par contre différente sur la recherche sociale (via Facebook, Twitter et Google+) puisque « les moteurs d’indexation et de classement ont été intégralement développés par Qwant ». Notez qu'un système en temps réel est en préparation, mais aucun détail supplémentaire n'a été évoqué.
De notre côté, nous avons comparé les résultats avec ceux de Kurrently.com afin de vérifier s'ils étaient identiques et cela ne semble pas être le cas. N'hésitez pas à nous faire part de vos retours sur la question si vous tentez d'utiliser Qwant.
La recherche d'images et de vidéos passe pour le moment par YouTube et Bing. La société précise avoir donné la priorité à la recherche web, live et sociale, mais « ce n’est que temporaire et notre technologie sera très rapidement mise en place ». Pour le vérifier, il suffit d'ouvrir une miniature dans un nouvel onglet et de regarder sa provenance (Bing) :
Exemple d'une recherche dans l'onglet Media avec la provenance de la miniature
Sachez ensuite que le Qnowledge Graph exploite des données provenant de chez Wikipedia et un lien vers la source a été ajouté depuis peu, ce qui n'était pas le cas lors de son lancement.
Shopping : une colonne qui bouge beaucoup
Reste le cas de la dernière colonne : Shopping. Comme nous vous l'avions annoncé la semaine dernière, elle propose des liens affilés vers certains revendeurs. Jeudi dernier, plusieurs boutiques étaient présentes, tandis que ce week-end Amazon semblait être seule en lice.
Hier, la situation avait encore évolué et les résultats sont plus variés avec une liste de boutiques plus importante, mais dont certaines semblaient provenir de Google Shopping. Aujourd'hui, sur une même requête (Galaxy SIII), Amazon est de nouveau seul. La société précise que de nouveaux changements devraient encore avoir lieu en fonction des accords qu'elle pourrait signer avec de nouveaux partenaires.
Qwant : une faille XSS mise en évidence et rapidement corrigée
Sachez enfin qu'une faille XSS a récemment été mise en évidence et qu'elle est d'ores et déjà corrigée. En effet, comme le précise @Chtitux, avec une requête bien précise, il était possible d'insérer une image sur le site. Voic un exemple :
"%20>
Qwant, qui es-tu vraiment ?
Au final, Qwant n'est donc pas (encore ?) autonome étant donné qu'il s'appuie beaucoup sur des services externes pour fournir ses résultats (Amazon, Bing, YouTube, et.). Encore en version bêta, il faudra donc suivre de près son évolution afin de savoir ce qu'il en sera dans les semaines et mois à venir. Une chose semble par contre acquise : son manque de transparence lors de son lancement pourrait lui coûter cher...
Sachez enfin que les CGU d'utilisations ont été mises à jour. En effet, lors de la mise en ligne de Qwant, il était précise qu'il n'était pas autorisé de créer un lien vers Qwant. En fait, la société précise que cela avait été mis en place lors de la bêta fermée, mais que cela n'est désormais plus le cas : « vous pouvez donc bien entendu faire des liens vers Qwant sans modération ».
Pour finir, voici une interview d’Éric Léandri réalisée par Laurent Bourrelly (consultant en référencement). Notez que ce dernier avoue sans complexe que « personnellement, j’ai pris le parti de défendre Qwant car j’ai été convaincu par les explications » :
Qwant, un vrai faux moteur de recherche ? Des accusations aux explications
-
Qwant a son propre système d'indexation, mais complète ses résultats avec d'autres
Commentaires (54)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 19/02/2013 à 19h31
et bah c’est pas glorieux tout ça " />
Le 19/02/2013 à 19h46
Je suis aussi réservé quant à ce moteur de recherche, fut-il français.
J’ai voulu faire une recherche dessus pour un élève sur un sujet précis (le satellite SOHO) et en haut, dans les images, il y avait plusieurs photos érotiques… " /> " /> Pas glop…
D’autre part, les élucubrations d’ados dans la colonne “Social” ’m’insupportent au plus haut point : rien à faire en première page d’un moteur de recherche quand je ne le sollicite pas.
Bref, copie à revoir, et vite !
Le 19/02/2013 à 20h18
Le 19/02/2013 à 20h23
Très sympa ce fameux Laurent B, qui fait l’itw de Qwant.
Je cite son commentaire sur le blog :
Quel travail ?
Ouvrir un blog anonyme d’une page en dénonçant un produit ?
Cela permet de se concentrer sur le manque de courage d’afficher son opinion publiquement.
Surtout que tu n’as apparemment pas toutes les cartes en mains pour juger. Tout ce que tu dis n’est pas faux, mais largement biaisé et pour certaines parties c’est effectivement hors jeu.
Si tu veux légitimer un « travail », cela doit être autre chose qu’un article biaisé sous couvert d’anonymat.
Rien de personnel, mais le fait de se planquer derrière les possibilités d’anonymat d’Internet me fait gerber. En plus, ton argument pour légitimer ce choix est naze et peu crédible.
Et si en plus tu veux impliquer ma baseline dans ton argument, ça ne va pas faire trois pirouettes avant que je rue dans les brancards.
Mon tweet t’a amené +400 vu. Ton 1/4h de gloire est passé maintenant.
Tu peux rentrer à la niche ou choisir de te faire pousser une paire de couilles (ce que je dis à chaque courageux anonyme).
Disparais aussi vite que tu es apparu car tu ne fais pas le bon choix.
La grande classe.
Le 19/02/2013 à 20h30
Le 19/02/2013 à 20h37
Le 19/02/2013 à 20h38
non pas besoin d’être pété de thune, il suffit d’être compétent
Le 19/02/2013 à 20h47
Un truc avec les algos de moteurs de recherche: ils apprennent beaucoup de l’utilisation que font les visiteurs du-dit moteur. Par exemple, le temp avant de cliquer sur un lien, le fait de revenir sur la page du moteur (cela veut dire que le lien précédent n’était pas assez pertinent), etc etc.
En plus, le moteur fait du profiling: avec un cookie ou votre login, il retourne des résultats potentiellement plus pertinent pour “vous”. Ce que DuckDuckGo propose de ne PAS faire.
http://dontbubble.us/
Au final, une grosse part de la performance d’un moteur de recherche vient du nombre de visiteurs unique à partir desquels il peut “apprendre”.
Le meilleur exemple, c’est Google en Chine: 15% du marché et des résultats moins pertinents que Baidu pour l’utilisateur chinois.
Ça signifie que le coût du ticket d’entrée sur le marché des moteurs de recherche pour un nouvel acteur est TRÈS élevé!
Donc je comprends tout à fait que le premier reflexe d’un nouveau moteur soit d’essayer de diminuer ce prix au démarrage, quitte à pomper passer un accord avec d’autres moteurs.
De ce coté, je préfère la stratégie d’autres types de moteurs qui essayent de se placer sur une niche: DuckDuckGo, feu Yauba, etc. Même si cela les limites à un usage réduit et donc, les empêche d’atteindre la taille critique nécessaire pour être pertinent.
Morale de l’histoire: la recherche en ligne est un monopole obligé.
À moins que quelqu’un débarque avec un systême distribué… (peut-être).
Le 19/02/2013 à 20h55
Le 19/02/2013 à 20h55
Le 19/02/2013 à 21h01
Le 19/02/2013 à 21h07
Le 19/02/2013 à 21h09
Le 19/02/2013 à 21h32
Je me forçais à utiliser un moteur français en lieu et place des mastodontes américains, mais à la lecture de l’article et des commentaires de ceux qui soutiennent le projet, je m’en retourne vers les moteurs de recherche de l’oncle Sam.
Déçu. " />
Le 19/02/2013 à 21h51
Le 19/02/2013 à 22h20
En France les gens adorent taper sur les entreprises, particulièrement quand elles sont françaises.
Le 19/02/2013 à 18h39
Pour finir, voici une interview d’Éric Léandri réalisée par Laurent Bourrelly (consultant en référencement). Notez que ce dernier avoue sans complexe que « personnellement, j’ai pris le parti de défendre Qwant car j’ai été convaincu par les explications »
D’un oeil professionnel peut être mais ca ne m’empêche pas d’être suspicieux sur la réalité du traitement.
Serait ce là une tentative osée de developpeurs ambitieux ?
Ou bien sont-ils clairement nuls en com ? " />
Le 19/02/2013 à 18h41
Une chose m’échappe. Ont-ils vraiment cru que personne ne s’en apercevrai ? Ou bien ont-ils cru que personne n’en parlerai ? C’est clairement mal connaître Internet il me semble…
Soit ils manquent d’expérience, soit ils sont naïfs ?
Enfin bon, personnellement, je trouve que le dossier “manque de transparence” est pour le moment un peu mince.
Ce n’est pas la première société à avoir des difficultés avec une communication claire et précise.
Je leur accorde le bénéfice du doute.
Le 19/02/2013 à 18h41
Il faut bien qu’ils se constituent une base de référence. Pour le moment je le trouve pertinent dans les résultats des recherches que j’ai faites avec.
Le 19/02/2013 à 18h46
Le 19/02/2013 à 18h46
Et quid de l’exploitation des données utilisateur ?!
Quoi qu’il en soit, là où le monsieur Léandri affirme voir une erreur de communication, je vois moi un manque de transparence et une forme malhonnêteté, du coup j’ai viré ce qwant de mes moteurs de recherche… " />
Le 19/02/2013 à 18h51
" /> bizarre tout à l’heure c’était planté Qwant .. quand je l’adressais il me renvoyais sur la page admin de la livebox .. (qui n’est pas la mienne rassurez vous … en fait j’en ai pas .. )
Le 19/02/2013 à 18h52
Perso j’ai vraiment du mal avec Qwant, j’ai réessayé dernièrement et l’interface est pour moi imbitable, avec ses photos/vidéos au dessus sans intérêt. C’est vraiment dommage j’aurais aimé voir un acteur français faire un truc vraiment sympathique pour moi c’est complètement raté " />
Mais bon on mettra sur le compte de la béta hein … " />
Le truc que j’ai trouvé cool à la limite c’est pouvoir affiner une recherche, ça permet de pouvoir rechercher par thème plus facilement.
Le 19/02/2013 à 18h53
Bon, laissons-leur le benefice du doute pour le moment.
Je suis d’accord sur le fait qu’un moteur de ce type necessite du temps pour “apprendre”, mais ils auraient du etre transparent sur leur utilisation de services-tiers.
Ca ne presage rien de bon de partir sur un mensonge (meme par omission).
Le 19/02/2013 à 18h54
Le 19/02/2013 à 18h56
" /> je me suis pas inscrit
" />
Le 19/02/2013 à 18h57
Le 19/02/2013 à 19h01
Le 19/02/2013 à 19h03
A la toute fin du dev, j’aurais de mon côté fait tourner pendant quelques jours/semaines un gros batch avec mon algo perso, ce batch simulant des requêtes et clics d’utilisateurs différents.
Car dans ce cas, tout moteur sera meilleur que les autres si ils pompent à chaque fois comme démarrage les résultats des autres.
J’espère que leurs “partenaires” ont reçu des royalties.
Le 19/02/2013 à 19h14
il se veut Quantic ?
Le 19/02/2013 à 19h14
Tant que ça ne devient pas Ask " />
Un truc assez marrant à lire ici:http://www.howtogeek.com/138516/the-shameful-saga-of-uninstalling-the-terrible-a…
Le 19/02/2013 à 19h20
En clair, seront facilement trouvable les requêtes que beaucoup de gens veulent et moins celles que les gens veulent pas, au détriment de la justesse ?
Sachant que les gens cliqueront d’abord et/ou souvent sur les pages en premières pages…
Le 20/02/2013 à 14h24
Le 20/02/2013 à 14h38
Le 20/02/2013 à 14h47
Le 20/02/2013 à 14h56
Je l’avais senti a 10km… C’est petit je trouve (enfin français quoi " />)
Le 20/02/2013 à 15h53
Le 21/02/2013 à 21h57
Depuis quand “français” est un argument de qualité ?
depuis qu’il est associé a la cuisine, ou quand on a besoin de gens têtu (pour pas dire autre chose " /> )
Le 19/02/2013 à 22h35
Ça me fait penser à Red Taureau, on ne sait jamais, c’est quel moteur " /> (à moins d’être au courant) " />" />
Le 19/02/2013 à 23h35
Le 20/02/2013 à 01h24
Le 20/02/2013 à 04h05
Depuis quand “français” est un argument de qualité ?
Le 20/02/2013 à 06h14
Et bing ! juste après le cheval à la place du boeuf,
Le 20/02/2013 à 07h42
Pour ma part, ça ne me choque pas plus que ça qu’un moteur de recherche avec seulement quelques semaines d’existence, et toujours en beta, s’appuie sur les résultats des voisins…
Le contraire aurai été plus que surprenant même.
Par contre, j’ai été faire un tour dessus, et l’interface me convient pas du tout.
Le mélange des types de recherche ne m’intéresse pas du tout, et par rapport à mes recherches, je trouve que ça gène en lisibilité plutôt qu’autre chose.
Surtout avec la colonne “live” et “qnowledge graph” qui sont désespérément vide (a quoi servent elles d’ailleurs ?), qui font un gros bloc vide en milieu de page avec des colonnes bien fourni sur les cotés de la page…
Et puis la recherche sociale… Le truc qui va être complètement pollué par les twitt et commentaires facebook des prépubères de 10 ans ? meh !
J’ai pas vraiment cherché, mais j’espère qu’il y a/aura des options de personnalisation pour virer certains types de recherche ou permettre de faire spécifiquement qu’un type de recherche…
Le 20/02/2013 à 07h55
Le 20/02/2013 à 09h02
À tout le moins, la séquence de communication de Qwant est ratée : je ne sais pas ce qui a été dit par Qwant aux médias mais je pense que s’ils avaient modestement présenté leur méta-moteur avec un plus gros logo “beta” et sans mentionner “2 ans de travail secret” et “des millions d’euros investis”, cela aurait fait moins de buzz vendredi dernier et moins de polémique depuis.
Il est un peu dommage que tous les médias, y compris les pros de l’IT soient tombés dans le panneau du “Google français”. Le souci c’est que même quand on ne leur parle pas de Google, les médias y reviennent dès qu’il s’agit de technologies de moteurs de recherche, comme Antidot en a aussi fait l’expérience il n’y a pas longtemps avec cet article du Progrès de Lyon titré : “Fabrice Lacroix a bien failli créer le Google lyonnais” que vous pouvez lire ici : http://www.leprogres.fr/economie/2012/04/10/fabrice-lacroix-a-bien-failli-creer-…
Si vous vous intéressez aux méta-moteurs et agrégateurs de recherches, je vous invite à essayer le service Pickanews –http://www.pickanews.com – un “moteur de veille” français disponible pour plusieurs langues et pays. Pickanews utilise des technologies avancées de « speech to text » pour trouver des mots-clés prononcés dans des journaux d’info TV ou des émissions de radio. Avec en parallèle la recherche des ces mots-clés sur le web et les réseaux sociaux ainsi que dans toute la presse écrite, grand public et professionnelle, qui est numérisée et OCRisée chaque matin puisque c’est le métier de base de PressIndex qui a créé Pickanews.
Le « speech to text » n’est évidemment pas parfait mais cela rend un vrai service. Exemple de veille Pickanews sur la marque “Qwant” : http://www.pickanews.com/resultat.php?media=2&recherche=Qwant&pays=FRA
Pickanews utilise les logiciels développés par l’éditeur français Antidot chez qui je travaille et qui développe des technologies de moteurs de recherche depuis 1999 pour des clients comme TF1, Le Point, LexisNexis, Decathlon, Service-Public.fr etc etc. Vous trouverez des explications techniques sur cette page web :http://antidot.net/fr/References/Medias-et-Presse/Pickanews
et dans ce PDF de 3 pages : http://www.antidot.net/content/download/1276/9885/version/1/file/CasClient-Picka…
Le 20/02/2013 à 10h10
Le 20/02/2013 à 10h10
Le 20/02/2013 à 10h45
Le 20/02/2013 à 11h22
Pour le design de la page c’est vrai que c’est minable et très peu pratique… Il parait que tout le pognon est passé dans le logo " />
En tout cas, ce n’est pas aujourd’hui qu’on aura un concurrent valable aux américains. " />
Le 20/02/2013 à 11h37
Le 20/02/2013 à 12h36
Ça la fout mal pour une bêta.
Espérons que ça soit rapidement corrigé.
Le 20/02/2013 à 12h56
Le 20/02/2013 à 13h02