[Édito] Mais où est passée la modération ?
Stay a while and listen
Asseyons-nous quelques instants et discutons de modération. Parce que c'est fou un peu : il n'y en a presque plus. Délit de fuite ? Que nenni !
Le 25 novembre à 17h49
10 min
Société numérique
Société
Le 15 décembre, cela fera officiellement 20 ans que je travaille chez Next. Très vite, les liens avec la communauté sont devenus un sujet que j’ai affectionné. Les premiers émois des réactions sur mes propres articles bien sûr, mais surtout la manière dont les commentaires sont devenus un incroyable vivier d’informations. Avec le temps, vos messages sont devenus partie intégrante de « l’expérience Next ». Et quelle partie ! Plus de deux millions de commentaires dans nos archives depuis 2012, excusez du peu.
Le revers de la médaille, que l’on pourrait généraliser à tout fonctionnement un tant soit peu démocratique, est que l’on n’est pas toujours d’accord avec tout ce qu’on y lit. Ce n’est en général pas un problème. Ça peut même être une source d’immense richesse : la confrontation des idées, l’arrivée de points de vue originaux, le déferlement des arguments. Du moins tant que le respect reste présent.
Rogntudju !
Beaucoup parmi nos lecteurs les plus anciens me connaissent. On peut dire que je fais partie des meubles et que j’ai été très actif dans les commentaires pendant de longues années. On m’a également donné un surnom : « la sword ». Un vieux, très vieux sobriquet, parfois donné affectueusement (cœur sur vous), parfois beaucoup moins.
Il reste 86% de l'article à découvrir.
Déjà abonné ? Se connecter
Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vous[Édito] Mais où est passée la modération ?
-
Rogntudju !
-
Les années folles
-
Les années covid
-
Le grand calme
-
Next, le refuge
Commentaires (29)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousAujourd'hui à 17h52
Aujourd'hui à 18h06
Aujourd'hui à 20h24
Aujourd'hui à 18h13
J'ai rarement été l'objet de trolls mais je fais partie de ces gens pour qui ce qui est dit sur le net est la résultante d'une trajectoire de vie propre et que quand on vient déverser sa bile dans les commentaires c'est qu'on est pas en demande de changement de pensée mais plutôt pour affirmer son point de vue sur les autres. A ceux là, je dis bon courage et je plains leur entourage.
Peut être que les chiffres des gens qui ont été sanctionnés nous montrerait que ceux-là sont une minorité écrasante.
Merci pour votre travail attentionné pour notre bien être, en tout cas.
Aujourd'hui à 20h27
(Et ce message s'adresse aussi aux autres personnes qui agissent comme toi avant : n'hésitez pas à venir, on ne mord pas! Enfin, pas trop fort...)
Aujourd'hui à 18h18
On a les codes et on se respecte (enfin, on essaie 😅).
Mais oui, c'est agréable !!
Aujourd'hui à 18h21
Mais impossible de faire sans, courage à l'équipe !
Aujourd'hui à 19h34
La modération, c’est souvent soit le vide complet, soit une grande censure (surtout sur les critiques et débats, peu importe si ils sont construits ou non)
Modifié le 25/11/2024 à 18h22
Par rapport à l'avant et après COVID, perso j'ai aussi observé une explosion de la rhétorique binaire : si t'es pas d'accord avec moi c'est que tu es contre moi. Fortement utilisée par des personnalités très médiatiques de l'époque, comme un certain Président des USA.
Et j'ai l'impression que c'est devenu un standard de discussion.
L'autre élément qui est prompt à envenimer les débats, c'est aussi ce que j'aime appeler l'étiqueteuse. Il s'agit de balancer tout un tas d'étiquette en -isme ou -phobe (et on arrive encore à lire du "fanboy", mais lui je le classe plus dans la condescendance) et itérer dessus. Non seulement c'est faire une erreur fondamentale d'attribution, mais en plus, c'est à la limite (voire réellement) de la diffamation pour d'autres. Et sur ce point, on en revient à la responsabilité pénale du site citée dans l'édito. Si je signale un commentaire comme diffamant à mon égard et qu'il n'est pas modéré, je peux porter plainte contre l'éditeur du site.
À cela, j'ajouterai un autre point que je constate souvent qui fusionne les deux premiers : l'impression que tout le monde doit prendre parti. Désormais, chercher à comprendre un point de vue, ou un concept, sans y adhérer, semble être impossible.
Bref, j'ai l'impression d'observer une forme de radicalisation des modes de pensée. Je n'essayerai pas de chercher l'origine, nombre de sociologues plus qualifiés que moi sur le sujet doivent l'avoir ou le faire. Mais ce que je constate, c'est que c'est rapidement lassant.
Sinon, à ce sujet, ça donne quoi l'usage de @Ness_01 dans l'analyse des messages pour la modération, comme vous en parliez au poing Dev 12 ? Un petit retour d'expérience serait très intéressant :)
Aujourd'hui à 18h45
Aujourd'hui à 19h48
Aujourd'hui à 18h47
On dirait que certains veulent surtout appartenir à un groupe qui va partager un ennemi commun.
Aujourd'hui à 19h50
Modifié le 25/11/2024 à 22h51
Je prévoyais de faire un post plus détaillé, mais je vais essayer de synthétiser mon approche dans ce commentaire.
On fera un post à part si nécessaire.
Premièrement, un disclaimer.
Je n'ai pas de certification en Machine Learning (pour l'instant) et je me suis lancé dans ce projet par pure passion pour ce domaine que je découvre. Le développement est + / - en standby pendant que je me familiarise avec des techniques plus avancées en ML. Parallèlement, je travaille également sur d'autres projets chez Moji.
La première étape a été de concevoir un plugin pour WordPress qui émet un event à chaque commentaire posté. Cet event initie une requête HTTP vers un service interne avec un payload contenant le commentaire, ses parents éventuels et le titre de l'article. Puis de coder la logique de gestion du retour du LLM pour réaliser une action (autoriser ou non la publication d'un commentaire)
Ça c'était la partie facile. On a vu cet outil comme un outil de pré modération dans un premier temps, toujours un humain dans la boucle qui valide ou non la décision.
La deuxième étape, setup un serveur d'inférence.
La plupart des gens sont maintenant familiers avec des solutions comme Ollama, setup avec lequel j'ai commencé à explorer les LLMs après que les possibilités offertes par l'API d'OpenAI m'aient révélé leurs limitations.
(Parenthèse : Aucun de vos commentaires n'est passé chez OpenAI. Je parle uniquement de mon utilisation sur d'autres intégrations à mon workflow.)
J'ai très vite été confronté à deux problèmes.
- La limitation des modèles génératifs offerts disponibles à ce moment sur huggingface
- La génération structurée
Bien que des efforts conséquents aient été faits par la communauté open source, la différence de qualité était encore flagrante. J'ai cependant obtenu des résultats qui se défendaient très bien avec les modèles de Nous Research (big up à eux), notamment Hermès 2.
La question est : comment encoder nos valeurs éthiques dans ce modèle ? Chaque modèle est entraîné sur un corpus censé lui fournir l'ajustement des paramètres idéal pour lui faire remplir toutes les tâches basiques type Q/A, synthèse de texte, extraction d'informations, etc.
Qui plus est, les corpus choisis portent tous indirectement des biais
Mais avant de réfléchir à cela, comment traiter l'output généré par les modèles de langage (LLM) avec du code ?
PHP est loin d'être un langage naturel, et notre modèle est entraîné à produire du texte qui l'est
Je me suis fait les dents sur plusieurs solutions plus ou moins optimales.
La première, proposée sur le cookbook Haystack était lente, couteuse en ressources et peu flexible.
Le principe : demander gentiment au LLM de générer un output correspondant à un schéma json validé via Pydantic
Si le validateur retourne des erreurs, on demande à nouveau au LLM de traiter ces erreurs en lui fournissant le schéma et les erreurs détectées.
Ensuite, on espère qu'en moins de 5 à 10 boucles, le LLM arrivera à générer un output valide. Éventuellement, j'ai mis en place des regex qui pourraient extraire uniquement le JSON si un message supplémentaire était inséré.
Vous vous doutez que c'était loin d'être optimal.
Après un certain temps de pérégrination et d'expérimentations, j'ai choisi llama.cpp comme stack pour mon serveur d'inférence. C'est un projet open-source qui mérite d'être bien plus connu.
En plus d'offrir une perspective plus avancée du fonctionnement d'un modèle et du processus d'inférence, llama.cpp m'offre des possibilités de personnalisation bien plus poussées, comme par exemple la grammaire GBNF.
J'ai lu récemment cet article de blog qui explique visuellement le principe de fonctionnement pour la contrainte de l'output en créant une Finite State Machine. Cette machine implémente la regex de validation du JSON que l'on souhaite générer.
En plus de cela, llama.cpp offre un temps d'inférence bien supérieur à ce que peut faire Ollama.
La rédaction de ce commentaire m'a déjà pris plus de temps que je n'avais prévu, et je dois aller me préparer à dîner.
Si le sujet vous intéresse, je pourrais décrire comment j'utilise ensuite FastAPI pour interagir avec llama.cpp, comment j'injecte du contexte et crée une pipeline d'agents pour décomposer la tâche de modération en étapes distinctes.
Ou bien la façon d'encoder des valeurs éthiques dans une surcouche sur le modèle fondationnel pour intégrer la charte constitutionnelle de sa communautée.
Cette étape est, in fine, la plus intéressante, à mon avis. Comment adapter ? Comment tolérer une certaine limite d'humour noir pour ne pas être contraint par le puritanisme qu'on pourrait trouver dans un modèle trop politiquement correct du fait de son statut de produit ? Comment exprimer ses valeurs en vecteurs ?
Qu'est ce qui constitute du discours toxique, jusqu'ou la liberté d'expression peut aller ?
Taxonomie d'un commentaire toxique
Ingénierie automatique de prompts
Actuellement je bloque sur la création d'un golden dataset destiné à fine tuner une surcouche (QLORA) sur le modèle de fondation choisi.
Pour cela, j'ai besoin de finaliser une pipeline utilisant argilla pour annoter des commentaires destinés à une phase de reinforcement learning via RLHF ou RLAIF . J'aimerais également ajouter la génération de rationales qui permettront d'expliquer les décisions de modération prises par le modèle et de les ajuster au besoin.
Modifié le 25/11/2024 à 21h15
Je commente assez peu en fait car je pense que d'autres ici ont bien plus d'expertise que moi. De plus, je n'ai pas une opinion sur tous les sujets, voire j'y suis indifférent.
Beaucoup de sites ont évacué leurs commentaires vers les réseaux sociaux, solution sans doute radicale mais je ne suis pas sûr que ça soit la meilleure.
Aujourd'hui à 18h43
J’attends de voir, j’espère que le "monde d’après covid" est plus sage effectivement :)
Modifié le 25/11/2024 à 20h53
La (zone commentaires) c'est pas rose
La (zone commentaires) c'est morose
Alors prends-toi en main
…
Écoute mon frère, te laisse pas faire
Écoute bien ce qu'il te dit
Ouais, c'est le monde à l'envers
Faut pas qu'tu désespères
La vie, c'est la jungle
…
Allez mes frères et mes sœurs, tous ensemble
C'est ton destin
C'est Ton Destin (Les Inconnus)
Aujourd'hui à 19h41
Modifié le 25/11/2024 à 19h43
Aujourd'hui à 20h55
Modifié le 25/11/2024 à 19h52
Aujourd'hui à 20h41
Je fais parfois l'erreur de cliquer sur les commentaires de france info et je regrette immédiatement avant de me rouler en boule en me disant que la Terre devrait être suffisamment grande pour que je puisse garder mes distances. J'espère.
Heureusement il y a Next. J'y contribue régulièrement avec plaisir, mais surtout je lis presque toujours au moins une partie des commentaires !
Aujourd'hui à 22h51
Etant devenu "l'une des" dernière source francophone non payante ( et sans cookie-wall). Je me demande comment ils font pour laisser leurs espace de commentaires être aussi nauséabond par les temps qui courent...
Ici sur Next je me lache à commenter et surtout poser des questions si elles me viennent 😉
Aujourd'hui à 21h11
Mais sur certains sujets, certains ne se privent pas voire colle des propos qui n'ont jamais été tenus. Provocateur ou emmerdeur, j'ignore quel nom attribuer mais l'option de filtrage fait du bien.
Non pas que je sois un adepte de tout filtrer et de vivre qu'avec mes semblables, une bulle de la pensée unique / similaire, mais de discuter avec une personne qui pense différemment permet d'aborder un certain débat qu'on ne peut pas avoir sur tous les espaces commentaires. Bref, une discussion respectueuse.
Je suis pas spécialement dérangé par les trolls (les gentils hein, ceux du vendredi ), il faut savoir être joueur par moment (je suis le premier à taper sur Apple quand il manque un outil ou une fonctionnalité ).
Bref, comme les gâteaux, tout est qu'une question de dosage.
Aujourd'hui à 21h40
Aujourd'hui à 22h08
Aujourd'hui à 22h20
Aujourd'hui à 22h45
Aujourd'hui à 22h52