Connexion
Abonnez-vous

T@LC : En 2 h, on a créé un site d’actualités alimenté par IA, venez voir le résultat !

Spéciale dédicace aux devs de moji qui ont mis des semaines

T@LC : En 2h, on a créé un site d’actualités alimenté par IA, venez voir le résultat !

C’est une certitude : le web francophone est pollué par des milliers de sites GenAI. Next veut aussi en être… mais à travers un test à la con : on s’est donnés 2 h pour monter un site et créer un script qui va automatiquement traduire, réécrire et publier des reprises de communiqués de presse.

Le 11 février à 12h34

En marge de l’enquête de Jean-Marc sur les médias francophones utilisant de l’intelligence artificielle générative (GenAI) pour écrire tout ou partie de leurs contenus, nous avons voulu tenter l’expérience. Autant le dire tout de suite : ce T@LC (alias Test à la con) n’est pas un tuto : le code source ne sera pas publié, pas plus que la méthode exacte pour y arriver. Il n’empêche que la mise en place est extrêmement simple, bien plus qu'on ne pouvait l’imaginer au premier abord.

L’idée est simplement de vous permettre de lire des contenus 100 % générés par IA – et clairement identifié comme tel – dans les thématiques de Next afin de vous rendre compte du résultat. Vous pourrez ainsi voir ce qu’il en est et comparer. Il existe certainement des extensions pour WordPress et des outils automatisés, mais nous voulions mettre les mains dans le cambouis.

Sans plus tarder, le résultat (le script continue de tourner, de nouvelles actualités sont publiées régulièrement) :

Un WordPress et un script… le tour est joué

Comme pour notre extension (et d’autres projets), nous avons utilisé l’IA générative pour nous aider à concevoir ce site… alimenté par une autre IA générative. Afin de ne pas partir dans tous les sens (et éviter de perdre trop de temps), nous nous sommes imposés une règle : un délai de 2 h pour obtenir un résultat correct. Notre but n’est pas d’inonder le web et Google et donc d’optimiser les articles ainsi que le référencement, nous avons donc simplement laissé de côté ces étapes.

Première étape, installer un WordPress sur lequel nous avons la main pour y faire un peu ce que l’on souhaite (autant prévoir large). Deuxième étape, demander à Claude de créer un script pour automatiser la création et la publication d’actualité. Troisième étape… en fait il n’y en a pas. C’est terminé, il n’y a plus qu’à lire les actus créées par l’IA Gemini de Google.

Des dizaines d’articles « gratuits » par jour

Depuis maintenant plusieurs semaines, le script tourne dans le coin d’un petit VPS et ne consomme quasiment rien en ressource processeur, mémoire et réseau. Nous avons utilisé l’intelligence artificielle générative Gemini de Google. Claude nous a proposé par défaut ChatGPT d’OpenAI, mais le script n’a pas fonctionné du premier coup. Plutôt que passer trop de temps à le débuguer (le chrono tourne), nous avons demandé à Claude des alternatives. Gemini a fonctionné très rapidement.

Le script vit sa vie et publie automatiquement quelques dizaines d’actualités par jour. Hier, plus de 50 articles ont ainsi été mis en ligne, sans aucune intervention humaine. Parfois, c'est plus, parfois moins.

Nous avons testé une montée en charge à plusieurs centaines de contenus par jour, sans aucun problème. Si la version gratuite de Gemini nous suffit au quotidien, à plusieurs centaines d’actus (on est monté jusqu’à près de 2000 actualités en 24 h), il a fallu payer (quelques dizaines de centimes par jour) car nous dépassions les quotas.

Traduction, putaclic, liens… tout est possible

Les articles sont générés via un prompt proposé par Claude, que nous avons ajusté avec des paramètres maison : traduire automatiquement en français si le communiqué est dans une autre langue, ajouter des intertitres, des mots-clés en fin d'actualité, des images en tête, écrire un titre « accrocheur », ou putaclic ça dépend des visions de chacun. Tout cela est dans le prompt (qui est relativement long).

Comme source, nous avons sélectionné quelques dizaines de pages de communiqués de presse ou de blog officiels d’entités comme Google, Facebook, Dropbox, Mozilla, Ubuntu, l’ESA, le CNRS, la Commission européenne, Raspberry Pi, Steam… Pour résumer, une petite partie des centaines de sites que nous suivons au quotidien.

Le script tourne en tâche de fond et se relance plusieurs fois par jour pour faire le tour des sources. Les heures de publications sont donc variées tout au long de la journée en fonction des nouveautés détectées. Cela nous donne une belle réactivité, il faut bien l’avouer… mais une piètre qualité de contenu.

Un exemple récent avec l’histoire du Golfe du Mexique/d’Amérique : la version GenAI publiée hier soir vs le brief d’Alexandre sur Next ce matin.

Sous le capot

Bien évidemment, quelques ajustements ont été nécessaires, car une IA générative ne fait pas toujours exactement ce qu’on lui demande. Sur les intertitres, par exemple, Gemini nous les renvoie régulièrement sous la forme « ** intertitre ** » au lieu de les mettre en gras. Les liens sur les mots-clés sont parfois absents, les images placées les unes à la suite des autres en tête d’article, etc.

Modifier le prompt ne permet pas d’avoir à coup sûr un résultat correct. Pas grave, on tente une autre approche avec l’aide de Claude AI qui nous propose de modifier le fichier de configuration du thème pour effectuer des changements à la volée dans les articles, au moment de l’affichage.

Claude nous a donné les scripts à ajouter pour transformer les « ** intertitre ** » en « <strong> intertitre </strong> », gérer les images et créer une galerie, ajouter des liens manquants, etc. Le tout en restant dans les 2 h qu’on s’était fixés.

Coûts récurrents : 1,2 euro par mois

Alors que la première version fonctionnait bien (mais sur un WordPress avec une offre d’essai gratuite d’un mois), nous avons décidé de migrer l’ensemble du site pour profiter d’une promotion en début d’année chez Ionos : un hébergement avec un WordPress préconfiguré pour 1,2 euro par mois, pendant un an.

Au final, ce site entièrement GenAI nous coûte donc 1,2 euro par mois (nous avions déjà un VPS sur lequel faire tourner notre script). Si on voulait publier des centaines d’articles il faudrait surement ajouter quelques euros pour l’IA.

Notre objectif d’un site GenAI d’actualités est réalisé, mais ce n’est qu’une partie du travail pour ceux qui veulent en tirer des bénéfices. Notre site n’a, en effet, aucune visite de manière naturelle, n’est pas repris dans Google News ni dans Discover ; il n’a donc pas d’explosion du nombre de pages vues qui serait utile pour augmenter les revenus publicitaires.

C’est là qu’entrent en jeux les pros du SEO, mais c’est une autre histoire. Elle passe souvent par le rachat d’anciens noms de domaines ayant une « réputation » pour gagner plus rapidement en visibilité dans Google.

Pour rappel, nous n’avons aucune publicité (sous quelque format que ce soit) sur notre site GenAI, pas plus que sur Next d’ailleurs.

Commentaires (47)

votre avatar
Spéciale dédicace aux devs de moji qui ont mis des semaines
C'est vilain comme pique :sm: :mdr:
votre avatar
Et comme j’aime vivre dangereusement, demain je vais chez moji à Nanterre ^^
Si vous n’avez plus de nouvelles, faudra pas chercher très loin :o
En vrai, ils sont top de chez top, vraiment :)
votre avatar
Ça sent le raccrochage acrobatique aux branches, là !
votre avatar
Toi t'aime pas ta vie.

Tu montres comment se défaire de ton job pour 1,2€/mois et comme ça ne suffit pas tu attaques les dev... Mais comme t'es vraiment joueur tu vois le boss demain.

Tu sais qu'il va te mettre au coin avec les dev' derrière toi avec les fouets?
votre avatar
:mrgreen: je suis joueur en effet
Bon après si j’avais peur de me faire remplacer par une IA pour 1,2 euro par mois je n'aurais pas de quoi être fier de mon boulot et faudrait vite que je pense à me reconvertir :D

Et, pour les dev, qui aime bien châtie bien et je les aime à hauteur du châtiment et même plus encore :love: :love: :love:
votre avatar
Bravo !
votre avatar
Il serait intéressant de voir aussi comme ça se passe en terme de visite que vous recevez, histoire de comparer avec celles de Next.

Je constate qu'il y a déjà 217 pages d'articles (vous n'avez pas chaumé :p). La quantité apportera peut être des visiteurs, maintenant que vous en avez parlé et surement mis le lien sur des réseaux sociaux (pas encore regardé ^^)
votre avatar
Moi j’ai rien fait, c’est l’IA qui a bossé depuis quelques semaines en tache de fond.
J’ai connecté le domaine à ma Google Search console, on verra ce que ça donne, ça m’intéresse aussi de voir ça. Et si c’est intéressant comme résultat, ça pourra donner lieu à un autre article :)

Le site GenAI n’est branché à aucun réseau social. Le but n’était pas de partir sur la partie conquête de visiteur, mais de montrer ce qu’il est possible de faire en 2h.
votre avatar
J'ai bien compris l'objectif, mais avec la ferme de 1500 site que vous avez trouvé, le lien va vite se retrouver un peu partout ^^

[edit]
J'ai supprimé une fake news de ma part. Mea culpa :sm:
votre avatar
Sans quelques liens entrants, le référencement naturel démarre très très lentement, surtout quand le site n'est pas identifié comme pertinent sur une niche sémantique spécifique (or ici tu ratisses large niveau sujet).

La publication de cet article amène en revanche un lien depuis le domaine Next, qui sera suivi par les robots, et déclenchera donc peut-être une accélération du référencement !
votre avatar
Par défaut, wordpress (le logiciel) envoi le lien des articles publiés sur pingomatic, qui doit lui-même envoyer le lien vers une multitude de services.

Donc même sans communiquer sur le lien, le site pourra être trouvé plus ou moins rapidement.
votre avatar
C'est bien le "rapidement" dont il est question, la découverte est considérablement accélérée dès que tu as quelques liens faisant autorité.
votre avatar
Personnellement, je préfère un site comme next et avant next-inpact et encore avant pc-inpact parce que tout simplement ce sont des Humains qui sont derrière les recherches d'articles pas des machines qui ne vérifient pas l'authenticité des infos ni de leurs véracités.
votre avatar
Moi aussi et l’idée n’est pas du tout de tendre vers de la GenIA je te rassure :chinois:
votre avatar
À quoi correspond le Copyright en bas de page puisque l'on ne peut pas protéger une production d'une IA ?

Sinon, les devs de moji ont été plus long mais on a un mode sombre et on peut commenter.
votre avatar
fayot :o
votre avatar
De toute façon, plus c'est long, plus c'est bon.

Autant dire que les devs de Moji sont... ouuuuuuuh... :rem:
votre avatar
Le site n'est pas signalé par l'extension... :cartonjaune: :mrgreen:
votre avatar
quelle horreur... n'empeche le rendre rentable ca ne doit pas être si évident quand on met faca à face le cout de l'API IA et la renta ADS... Je ne suis pas spécialiste de la question, je me demande si google se rend compte du duplicate content ou pas?
votre avatar
Rentabiliser, aller, disons 5e/mois pour intégrer le tout dans un VPS chez OVH), ça se fait rapidement. 😉
votre avatar
je ne pensais pas vraiment à l'hébergement mais au cout de l'api pour regénérer le texte, sur une telle industrialisation ce n'est pas gratuit et les revenus pubs sont pauvres
votre avatar
Comme indiqué dans l'article, ça peut se faire avec les versions gratuites.
votre avatar
Merci de bien le laisser ouvert au crawl afin d'alimenter la consanguinité des IA 🍿
votre avatar
On peut aussi les bannir dans un labyrinthe perpétuel de fausses pages web

Come for the content to steal, stay for the infinite wander
votre avatar
Oui, incroyable ces projets là ! 😹
votre avatar
Un article de T@LC Next.ink correspond à un article unique d'un autre site ? Si oui, il serait intéressant d'avoir l'URL d'origine (éventuellement cachée dans un tag meta du HTML) pour permettre de comparer la source et la "copie" ou de chercher des hallucinations.
votre avatar
Oui, c’est un article unique d’un communiqué de presse/billet de blog officiel comme expliqué dans l’actu. Je peux en effet modifier le script pour ajouter la source, bonne idée. J’essaye de faire ça ce soir (Sommet IA toussa)
votre avatar
Ah cool, mais il n'y a pas le feu, il faut aussi se reposer 😴
votre avatar
C’est ajouté pour la source, en bas de l’article.
Ce n’est forcément dispo que pour les dernières publications (et celles à venir) :chinois:
votre avatar
Super, une dernière question sur le contenu du fichier sitemap : c'est voulu ou un bug ?
votre avatar
C'est quoi le problème avec le fichier sitemap ?
votre avatar
Il ne liste aucun article il me semble.
[EDIT]
Ok, je viens de voir il faut aller dans celui là : https://nextai.talc.online/post-sitemap.xml
votre avatar
Si si, il les liste. Pas directement, mais il liste des "sous sitemap" dont l'un liste les articles : https://nextai.talc.online/post-sitemap.xml
votre avatar
Oui je viens de m'en rendre compte, merci.
votre avatar
Sinon grâce à cela je viens de comparer l'article de T@LC : Le Parlement européen vote en faveur de l’accord UE-Mercosur avec l'original et j'ai l'impression que l'IA est en mode "délire complet" non ?

Que je sache (ceci dit je n'ai pas trop suivi) le parlement européen n'a pas encore voté pour l'accord UE-Mercosur ?
votre avatar
Il ne reste plus qu'à remplacer les lecteurs par des bots (et quelques trolls pour que ce soit plus vrai), et on y sera : plus besoin d'humanité.
votre avatar
Je note que pour l'article sur le Golf du Mexique / Amérique, la version IA corrige une coquille de l'article d'origine : vous parlez de l'US Geographic Names System et l'IA a bien corrigé en Geographic Names Information System 😄
votre avatar
Ah je vois que vous avez corrigé l'article de Next, donc ce commentaire peut être supprimé.
votre avatar
Ah ...



La connexion a été refusée par le serveur proxy

Une erreur est survenue pendant une connexion à nextai.talc.online.

Vérifiez que les paramètres du proxy sont corrects ;
Contactez votre administrateur réseau pour vous assurer que le serveur proxy fonctionne.
votre avatar
Je pense que tu es au boulot !
votre avatar
Et donc l'extension "Alerte sur les sites GenAI, par Next.ink" ne detecte pas que c'est du contenue générer par IA ?
votre avatar
La liste de l'extension est faite à la main par next. L'extension ne détecte rien toute seule.
votre avatar
+1 sur la liste manuelle : il n’y a aucune auto détection dans l‘extension. Et le site mis en place pour ce T@LC indique clairement que ce sont des actus GenAI en haut de toutes les pages, avec aussi un auteur explicite, donc pas besoin de l’indiquer dans l’extension.
votre avatar
nous avons décidé de migrer l’ensemble du site pour profiter d’une promotion en début d’année chez Ionos : un hébergement avec un WordPress préconfiguré pour 1,2 euro par mois, pendant un an
Ho punaise cette merde de "click and build" de chez Ionos.
Vous auriez dû me contacter, je vous aurai fait un tarif au petit oignon avec un Matomo en plus :D
votre avatar
Hello, elle part pas un peu en vrille l'api IA ?
ce matin au moins 4 pages d'articles avec le même titre (sur un tumblr)....
votre avatar
Il doit y avoir un bug quelque part, car le dernier article remonte au 25 février, et depuis le 6 mars c'est le même article tumblr 😅

T@LC : En 2 h, on a créé un site d’actualités alimenté par IA, venez voir le résultat !

  • Un WordPress et un script… le tour est joué

  • Des dizaines d’articles « gratuits » par jour

  • Traduction, putaclic, liens… tout est possible

  • Sous le capot

  • Coûts récurrents : 1,2 euro par mois

Fermer