Connexion Premium

Booster les sondages avec l’IA générative, une (fausse) bonne idée ?

IFlop

Booster les sondages avec l’IA générative, une (fausse) bonne idée ?

Illustration : Flock

Avec l’arrivée de l’IA générative, un fantasme de sondeur arrive : et si on pouvait augmenter un échantillon de sondage avec l’IA générative pour le rendre plus représentatif ? Et même, allons-y, et si on pouvait sonder la population sans faire aucune enquête ? Les chercheurs en statistiques Arthur Charpentier et Guillaume Chauvet nous répondent.

Si peu d’entreprises de sondages ont passé le pas publiquement, elles lorgnent toutes sur l’IA générative pour booster leur production d’études. En effet, quoi de mieux pour faire baisser les coûts et augmenter la productivité de ce genre d’entreprise si l’IA générative leur permettait d’interroger beaucoup moins de personnes via téléphone ou questionnaires autoadministrés sur Internet ?

En 2024, l’IFOP a publié un premier sondage de cette espèce en s’associant avec l’entreprise FAIRGEN [PDF] dont un extrait de la notice a circulé de nouveau sur les réseaux sociaux récemment. Celui-ci s’intéressait à l’intention de vote des enseignants aux élections européennes. Il affichait s’appuyer sur « un échantillon de 8 000 personnes représentatif de la population française âgée de 18 ans et plus » incluant « l’équivalent statistique » de 580 enseignants de collège et de lycée. De fait, ce ne sont pas 580 enseignants qui ont été interrogés mais 116, dont les interviews ont été « extrapolées par la technologie DataBoostAI » développée par FAIRGEN.

« Basée sur l’IA générative, elle repose sur un principe de mise en relation holistique des données recueillies lors du terrain de façon à améliorer la précision statistique des résultats par génération d’échantillons synthétiques », ajoutait la notice sans plus de précision. Si l’entreprise de sondage avertissait sur le côté non prédictif des résultats le jour du vote de son travail, elle ne faisait aucune remarque dans ses avertissements concernant l’utilisation de l’IA générative. Si la méthodologie de ce sondage a eu de nouveaux échos récemment sur les réseaux sociaux, nous n’avons pas trouvé d’autre sondage en France de cette entreprise utilisant ce genre de technique.

Interrogé par Next, l’Ifop n’a pour l’instant pas donné suite à notre email. Elle se vante toujours sur son site d’être les « pionniers de la donnée synthétique » et d’être, « depuis 2023, le design partner de Fairgen ». « Ensemble, nous contribuons à fiabiliser cette technologie en nous appuyant sur des échantillons réels, dans le respect de la rigueur scientifique qui caractérise le Groupe Ifop », ajoute-t-elle.

Son concurrent en France, Ipsos/Bva, semble prendre un peu plus de recul avant de publier des sondages utilisant ce genre de données synthétiques. « Dans le domaine des sondages d’opinion publique, sur des enjeux électoraux, politiques ou au débat d’actualité, ce ne sont pas des choses que nous avons mises en place jusqu’à présent », nous assure Mathieu Gallard, directeur d’études chez Ipsos. Il ne rejette cependant pas totalement la possibilité d’utiliser ce genre de techniques : « Ça ne nous empêche pas pour autant de réfléchir, de faire des tests et de voir comment ça fonctionne soit sur d’autres types d’applications plus marketing soit dans d’autres pays ». À ce stade, il ne peut pas dire si cela sera le cas pour la campagne électorale qui s’ouvre dans le cadre de l’élection présidentielle de 2027.

L’intérêt ? Ce serait moins cher et plus rapide

Il reste 76% de l'article à découvrir.

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Commentaires (1)

votre avatar
Que dire ???

Just checking : C'est totalement chtarb ?

Right... Right...