[Édito] Mais où est passée la modération ?

Stay a while and listen

Asseyons-nous quelques instants et discutons de modération. Parce que c'est fou un peu : il n'y en a presque plus. Délit de fuite ? Que nenni !

Vincent Hermann

Le 25 novembre à 17h49

10 min

Société numérique

Société

Le 15 décembre, cela fera officiellement 20 ans que je travaille chez Next. Très vite, les liens avec la communauté sont devenus un sujet que j’ai affectionné. Les premiers émois des réactions sur mes propres articles bien sûr, mais surtout la manière dont les commentaires sont devenus un incroyable vivier d’informations. Avec le temps, vos messages sont devenus partie intégrante de « l’expérience Next ». Et quelle partie ! Plus de deux millions de commentaires dans nos archives depuis 2012, excusez du peu.

Le revers de la médaille, que l’on pourrait généraliser à tout fonctionnement un tant soit peu démocratique, est que l’on n’est pas toujours d’accord avec tout ce qu’on y lit. Ce n’est en général pas un problème. Ça peut même être une source d’immense richesse : la confrontation des idées, l’arrivée de points de vue originaux, le déferlement des arguments. Du moins tant que le respect reste présent.

Rogntudju !

Beaucoup parmi nos lecteurs les plus anciens me connaissent. On peut dire que je fais partie des meubles et que j’ai été très actif dans les commentaires pendant de longues années. On m’a également donné un surnom : « la sword ». Un vieux, très vieux sobriquet, parfois donné affectueusement (cœur sur vous), parfois beaucoup moins.

Il reste 86% de l'article à découvrir.

Déjà abonné ? Se connecter

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

Commentaires (29)

fdorin Abonné

Aujourd'hui à 17h52

Stay a while and listen

Ce sous-titre... Une référence au paladin Vincent et à sa sword ? C'est diablolique

Bourrique

Aujourd'hui à 18h06

Comme quoi, quand on n'astique pas la sword, elle rouille.

Patch Abonné

Aujourd'hui à 20h24

Ne t'inquiète pas, il passe du temps à l'astiquer, sa Sword

swiper Abonné

Aujourd'hui à 18h13

C'est personnellement une des choses qui ont fait que je ne m'exprimais presque jamais. La qualité de certains commentaires était intimidante et mon syndrome de l'imposteur me criait dans l'oreille que je n'avais pas la qualité de ces gens là.
J'ai rarement été l'objet de trolls mais je fais partie de ces gens pour qui ce qui est dit sur le net est la résultante d'une trajectoire de vie propre et que quand on vient déverser sa bile dans les commentaires c'est qu'on est pas en demande de changement de pensée mais plutôt pour affirmer son point de vue sur les autres. A ceux là, je dis bon courage et je plains leur entourage.
Peut être que les chiffres des gens qui ont été sanctionnés nous montrerait que ceux-là sont une minorité écrasante.
Merci pour votre travail attentionné pour notre bien être, en tout cas.

Patch Abonné

Aujourd'hui à 20h27

Alors qu'ici il n'y a en réalité aucun syndrome de l'imposteur à avoir. On a tous été des noobs un jour (et certains le sont toujours

). On dit tous des conneries (parfois volontairement, parfois non), du noob au grand expert. Ca n'empêche pas de participer quand on veut dire quelque chose :)
(Et ce message s'adresse aussi aux autres personnes qui agissent comme toi avant : n'hésitez pas à venir, on ne mord pas! Enfin, pas trop fort...)

fred2vienne Abonné

Aujourd'hui à 18h18

C'est tellement plus agréable d'échanger ici que sur Twitter.
On a les codes et on se respecte (enfin, on essaie 😅).
Mais oui, c'est agréable !!

Neliger Abonné

Aujourd'hui à 18h21

Je pense que la modération est, a toujours été, et sera toujours, un enfer pavé de subjectivité. Aussi bien pour les personnes qui la subissent que pour les personnes qui doivent l'appliquer.

Mais impossible de faire sans, courage à l'équipe !

lemon_dice Abonné

Aujourd'hui à 19h34

C’est rassurant qu’ils prennent du temps pour y réfléchir et choisir ce qui est accepté ou non
La modération, c’est souvent soit le vide complet, soit une grande censure (surtout sur les critiques et débats, peu importe si ils sont construits ou non)

SebGF Abonné

Modifié le 25/11/2024 à 18h22

Durant cette période, à force de répéter qu’il fallait s’exprimer poliment, certains étaient même devenus experts dans l’art d’écrire des horreurs sous couvert d’une forme agréable, brouillant les signaux.

La condescendance qu'on peut lire dans des propos visant à rabaisser les interlocuteurs, par exemple.

Par rapport à l'avant et après COVID, perso j'ai aussi observé une explosion de la rhétorique binaire : si t'es pas d'accord avec moi c'est que tu es contre moi. Fortement utilisée par des personnalités très médiatiques de l'époque, comme un certain Président des USA.

Et j'ai l'impression que c'est devenu un standard de discussion.

L'autre élément qui est prompt à envenimer les débats, c'est aussi ce que j'aime appeler l'étiqueteuse. Il s'agit de balancer tout un tas d'étiquette en -isme ou -phobe (et on arrive encore à lire du "fanboy", mais lui je le classe plus dans la condescendance) et itérer dessus. Non seulement c'est faire une erreur fondamentale d'attribution, mais en plus, c'est à la limite (voire réellement) de la diffamation pour d'autres. Et sur ce point, on en revient à la responsabilité pénale du site citée dans l'édito. Si je signale un commentaire comme diffamant à mon égard et qu'il n'est pas modéré, je peux porter plainte contre l'éditeur du site.

À cela, j'ajouterai un autre point que je constate souvent qui fusionne les deux premiers : l'impression que tout le monde doit prendre parti. Désormais, chercher à comprendre un point de vue, ou un concept, sans y adhérer, semble être impossible.

Bref, j'ai l'impression d'observer une forme de radicalisation des modes de pensée. Je n'essayerai pas de chercher l'origine, nombre de sociologues plus qualifiés que moi sur le sujet doivent l'avoir ou le faire. Mais ce que je constate, c'est que c'est rapidement lassant.

Sinon, à ce sujet, ça donne quoi l'usage de @Ness_01 dans l'analyse des messages pour la modération, comme vous en parliez au poing Dev 12 ? Un petit retour d'expérience serait très intéressant :)

Wosgien Abonné

Aujourd'hui à 18h45

Non, pas d'accord, tout faux😁

SebGF Abonné

Aujourd'hui à 19h48

Dans ce cas t'es contre moi !

Tanyuu Abonné

Aujourd'hui à 18h47

C'est quelque chose que je trouve de plus en plus fatiguant moi aussi. Trop souvent cette impression d'assister à des "discussions" entre 2 tribus qui se provoquent l'une l'autre à coup de préjugés et d'idées toutes faites...
On dirait que certains veulent surtout appartenir à un groupe qui va partager un ennemi commun.

SebGF Abonné

Aujourd'hui à 19h50

Je me rappellerai toujours un propos entendu lors des gilets jaunes : "je suis de gauche, donc je pense que...". J'étais un peu étonné qu'on considère avoir un modèle de pensée selon une affinité politique, et non une affinité selon son modèle de pensée.

hezirem Abonné

Modifié le 25/11/2024 à 22h51

Sinon, à ce sujet, ça donne quoi l'usage de @Ness_01 dans l'analyse des messages pour la modération, comme vous en parliez au poing Dev 12 ? Un petit retour d'expérience serait très intéressant :)

Ce projet est le mien, donc je vais me charger de te répondre.
Je prévoyais de faire un post plus détaillé, mais je vais essayer de synthétiser mon approche dans ce commentaire.
On fera un post à part si nécessaire.

Premièrement, un disclaimer.
Je n'ai pas de certification en Machine Learning (pour l'instant) et je me suis lancé dans ce projet par pure passion pour ce domaine que je découvre. Le développement est + / - en standby pendant que je me familiarise avec des techniques plus avancées en ML. Parallèlement, je travaille également sur d'autres projets chez Moji.

La première étape a été de concevoir un plugin pour WordPress qui émet un event à chaque commentaire posté. Cet event initie une requête HTTP vers un service interne avec un payload contenant le commentaire, ses parents éventuels et le titre de l'article. Puis de coder la logique de gestion du retour du LLM pour réaliser une action (autoriser ou non la publication d'un commentaire)

Ça c'était la partie facile. On a vu cet outil comme un outil de pré modération dans un premier temps, toujours un humain dans la boucle qui valide ou non la décision.

La deuxième étape, setup un serveur d'inférence.
La plupart des gens sont maintenant familiers avec des solutions comme Ollama, setup avec lequel j'ai commencé à explorer les LLMs après que les possibilités offertes par l'API d'OpenAI m'aient révélé leurs limitations.

(Parenthèse : Aucun de vos commentaires n'est passé chez OpenAI. Je parle uniquement de mon utilisation sur d'autres intégrations à mon workflow.)

J'ai très vite été confronté à deux problèmes.

- La limitation des modèles génératifs offerts disponibles à ce moment sur huggingface
- La génération structurée

Bien que des efforts conséquents aient été faits par la communauté open source, la différence de qualité était encore flagrante. J'ai cependant obtenu des résultats qui se défendaient très bien avec les modèles de Nous Research (big up à eux), notamment Hermès 2.

La question est : comment encoder nos valeurs éthiques dans ce modèle ? Chaque modèle est entraîné sur un corpus censé lui fournir l'ajustement des paramètres idéal pour lui faire remplir toutes les tâches basiques type Q/A, synthèse de texte, extraction d'informations, etc.
Qui plus est, les corpus choisis portent tous indirectement des biais

Mais avant de réfléchir à cela, comment traiter l'output généré par les modèles de langage (LLM) avec du code ?
PHP est loin d'être un langage naturel, et notre modèle est entraîné à produire du texte qui l'est

Je me suis fait les dents sur plusieurs solutions plus ou moins optimales.
La première, proposée sur le cookbook Haystack était lente, couteuse en ressources et peu flexible.
Le principe : demander gentiment au LLM de générer un output correspondant à un schéma json validé via Pydantic
Si le validateur retourne des erreurs, on demande à nouveau au LLM de traiter ces erreurs en lui fournissant le schéma et les erreurs détectées.
Ensuite, on espère qu'en moins de 5 à 10 boucles, le LLM arrivera à générer un output valide. Éventuellement, j'ai mis en place des regex qui pourraient extraire uniquement le JSON si un message supplémentaire était inséré.
Vous vous doutez que c'était loin d'être optimal.

Après un certain temps de pérégrination et d'expérimentations, j'ai choisi llama.cpp comme stack pour mon serveur d'inférence. C'est un projet open-source qui mérite d'être bien plus connu.

En plus d'offrir une perspective plus avancée du fonctionnement d'un modèle et du processus d'inférence, llama.cpp m'offre des possibilités de personnalisation bien plus poussées, comme par exemple la grammaire GBNF.

J'ai lu récemment cet article de blog qui explique visuellement le principe de fonctionnement pour la contrainte de l'output en créant une Finite State Machine. Cette machine implémente la regex de validation du JSON que l'on souhaite générer.

En plus de cela, llama.cpp offre un temps d'inférence bien supérieur à ce que peut faire Ollama.

La rédaction de ce commentaire m'a déjà pris plus de temps que je n'avais prévu, et je dois aller me préparer à dîner.

Si le sujet vous intéresse, je pourrais décrire comment j'utilise ensuite FastAPI pour interagir avec llama.cpp, comment j'injecte du contexte et crée une pipeline d'agents pour décomposer la tâche de modération en étapes distinctes.

Ou bien la façon d'encoder des valeurs éthiques dans une surcouche sur le modèle fondationnel pour intégrer la charte constitutionnelle de sa communautée.

Cette étape est, in fine, la plus intéressante, à mon avis. Comment adapter ? Comment tolérer une certaine limite d'humour noir pour ne pas être contraint par le puritanisme qu'on pourrait trouver dans un modèle trop politiquement correct du fait de son statut de produit ? Comment exprimer ses valeurs en vecteurs ?

Qu'est ce qui constitute du discours toxique, jusqu'ou la liberté d'expression peut aller ?

Taxonomie d'un commentaire toxique
Ingénierie automatique de prompts

Actuellement je bloque sur la création d'un golden dataset destiné à fine tuner une surcouche (QLORA) sur le modèle de fondation choisi.

Pour cela, j'ai besoin de finaliser une pipeline utilisant argilla pour annoter des commentaires destinés à une phase de reinforcement learning via RLHF ou RLAIF . J'aimerais également ajouter la génération de rationales qui permettront d'expliquer les décisions de modération prises par le modèle et de les ajuster au besoin.

augustus Abonné

Modifié le 25/11/2024 à 21h15

Bon courage à l'équipe !

Je commente assez peu en fait car je pense que d'autres ici ont bien plus d'expertise que moi. De plus, je n'ai pas une opinion sur tous les sujets, voire j'y suis indifférent.

Beaucoup de sites ont évacué leurs commentaires vers les réseaux sociaux, solution sans doute radicale mais je ne suis pas sûr que ça soit la meilleure.

le hollandais volant Abonné

Aujourd'hui à 18h43

Je vous souhaite de réussir dans cette optique, bien que mais mon expérience avec les commentaires en ligne m’empêche d’être pleinement optimiste

J’attends de voir, j’espère que le "monde d’après covid" est plus sage effectivement :)

JK Abonné

Modifié le 25/11/2024 à 20h53

Eh les keufs, eh les meufs, dans le RER
La (zone commentaires) c'est pas rose
La (zone commentaires) c'est morose
Alors prends-toi en main
…
Écoute mon frère, te laisse pas faire
Écoute bien ce qu'il te dit
Ouais, c'est le monde à l'envers
Faut pas qu'tu désespères
La vie, c'est la jungle
…
Allez mes frères et mes sœurs, tous ensemble
C'est ton destin

C'est Ton Destin (Les Inconnus)

linkin623 Abonné

Aujourd'hui à 19h41

Berbe Abonné

Modifié le 25/11/2024 à 19h43

[insérer commentaire rageur au prétexte d'une mauvaise journée ici]

JK Abonné

Aujourd'hui à 20h55

Rogntudju !

SebGF Abonné

Modifié le 25/11/2024 à 19h52

Un point qui m'est revenu aussi en parlant de modération : je trouve souvent regrettable des propos qui l'assimilent à de la censure. C'est dommage de voir le sens des mots se perdre ainsi.

trytodosth Abonné

Aujourd'hui à 20h41

le nouveau site lancé en fin d’année dernière réclame d’être abonné ou qu'un compte gratuit ait au moins trois ans d'ancienneté pour commenter

Je ne savais pas mais je trouve que c'est une super solution pour un premier filtre.
Je fais parfois l'erreur de cliquer sur les commentaires de france info et je regrette immédiatement avant de me rouler en boule en me disant que la Terre devrait être suffisamment grande pour que je puisse garder mes distances. J'espère.

Heureusement il y a Next. J'y contribue régulièrement avec plaisir, mais surtout je lis presque toujours au moins une partie des commentaires !

Trapklap Abonné

Aujourd'hui à 22h51

Je concours à tes propos, de même au sujet de FranceInfo.
Etant devenu "l'une des" dernière source francophone non payante ( et sans cookie-wall). Je me demande comment ils font pour laisser leurs espace de commentaires être aussi nauséabond par les temps qui courent...

Ici sur Next je me lache à commenter et surtout poser des questions si elles me viennent 😉

Arcy Abonné

Aujourd'hui à 21h11

J'avoue que l'espace commentaire est beaucoup plus calme, ça fait plaisir.
Mais sur certains sujets, certains ne se privent pas voire colle des propos qui n'ont jamais été tenus. Provocateur ou emmerdeur, j'ignore quel nom attribuer mais l'option de filtrage fait du bien.

Non pas que je sois un adepte de tout filtrer et de vivre qu'avec mes semblables, une bulle de la pensée unique / similaire, mais de discuter avec une personne qui pense différemment permet d'aborder un certain débat qu'on ne peut pas avoir sur tous les espaces commentaires. Bref, une discussion respectueuse.

Je suis pas spécialement dérangé par les trolls (les gentils hein, ceux du vendredi

), il faut savoir être joueur par moment (je suis le premier à taper sur Apple quand il manque un outil ou une fonctionnalité

).

Bref, comme les gâteaux, tout est qu'une question de dosage.

Erwan123 Abonné

Aujourd'hui à 21h40

Breizhad Abonné

Aujourd'hui à 22h08

Une chose que je regrette dans le nouveau site est de ne plus voir nul part le formidable slogan du forum : si tu sais pas apprends, si tu sais partage. Bon qqch d'approchant, j'ai connu inpact hardware, je suis vieux avec des trous de mémoires

benspx Abonné

Aujourd'hui à 22h20

« Si tu ne sais pas, demande. Si tu sais, partage. »

Fitz557 Abonné

Aujourd'hui à 22h45

Je commente rarement, mais s'il y a un truc que j'apprécie vraiment sur next, c'est la modération dans l'espace commentaire. Le fait que ce soit payant change vraiment la donne. Quand je compare aux interactions dans les espaces commentaires sur les sites gratuits, je préfère largement payer quelques euros et garder ma santé mentale.

sitesref Abonné

Aujourd'hui à 22h52

C'est vrai que ça s'est bien calmé par rapport il y a quelques années. Y'avait eu une sale période... Merci 🥰