votre avatar Équipe

Martin Clavey

est avec nous depuis le 9 avril 2020 ❤️

Bio

Journaliste scientifique. Ancien d'Owni et de la platforme de blogs en SHS Hypothèses.

Site personnel

https://soundofscience.fr

Le 04/11/2024 à 10h 45

Du coup, le pic de l'auteur de cet article sur le fait que GPT a tendance à créer de faux liens n'a pas spécialement lieu d'être ici, car ce ne sont pas des liens générés par GPT qui sont présentés ici, mais bien des vrais liens, sortant d'un moteur de recherche.
J'allais faire les mêmes remarques que vous 2 sur cette pique journalistique.

Du coup, je me pose des questions sur le pourquoi de ce genre de piques infondées : incompréhension, incompétence, parti-pris, malveillance ou je ne sais quoi d'autre ?

Bonjour. C'est le seul rappel d'un fait établi par notre rédaction concernant un partenariat dont parle ce brief. Dans cette dernière phrase, il est bien écrit ChatGPT et non searchGPT. Sur ce, je vous laisse à vos suppositions sur mes compétences, partis-pris etc. Bonne journée,

Le 29/10/2024 à 16h 33

Pour le sous-titre, j'étais prêt à sortir un "quand Meta fachée, Meta toujours cracher" 😅 (oui, j'ai lu le sous-titre après coup).

Ahah, presque envie de le reprendre. Peut être pour une prochaine sur Meta ;)

Le 28/10/2024 à 12h 43

Le Monde a trouvé la solution : pouvoir partager 5 articles gratuitement par mois à ses amis. Les amis doivent s'inscrire, avec un compte gratuit, mais ça marche bien.

Bonjour. Nous avons deja une fonctionnalité similaire. Tous les articles de Next peuvent être partagés à vos amis via le lien cadeau en bas de l'article.

Le 22/10/2024 à 10h 51

Possiblement non car la directive européenne DANUM confère un "droit de fouille" à des fins scientifiques.

En cherchant un peu, j'ai d'ailleurs vu passer une décision du tribunal régional de Hambourg dans un litige opposant LAION (l'organisme à but non lucratif derrière les data set ayant notamment permis d'entraîner Stable Diffusion) et Robert Kneschke.

La reproduction d’une photographie dans un set de données n’est pas contrefaisante car couverte par l’exception de fouille de textes et de données à des fins scientifiques.
Le lien vers la décision (en allemand) est disponible dans l'article pour les intéressés ( @MartinClavey si jamais vous voulez étudier la décision) . Apparemment c'est la première rendue dans le cadre de cette directive.

Ah, merci, je vais regarder ça.

Le 18/10/2024 à 16h 44

Ils ne savent pas, justement. Tous les serveurs concernés par un signalement, sauf 1, n'étaient pas en .onion.

Le 18/10/2024 à 10h 33

Attention, le premier lien concerne l'ambiance actuelle avec "el drama" en ligne de fond.

Les autres, c'est en réalité le témoignage d'une seule personne. Il ne faut pas tomber dans le piège de faire une généralisation sur la base d'un seul témoignage pour une boite qui emploie près de 2000 personnes (que le témoignage soit positif ou négatif, ça marche dans les deux sens).

C'est même le premier lien du brief ;)

Le 15/10/2024 à 14h 52

Petit ajout en commentaire après publication : les informaticiens verront quand même dans la deuxième vidéo que le modèle d'Adobe considère que le cable RJ-45 se débranche juste en tirant dessus sans appuyer sur le clips et que ça fait quand même bien bouger le câble d'à côté ;)

Edit : et que le bout du câble s'allume quand il est débranché. Étrange 🤔

Le 11/10/2024 à 17h 11

J'avoue, j'ai été tenté aussi.

Le 08/10/2024 à 16h 09

Voilà une réponse à toutes nos questions, une seule rubrique dans Next : « Physique » !

Le 08/10/2024 à 13h 57

Dans ce cas, on pouvait aussi les classer en "physiologie et médecine" pour avoir utilisé des concepts de biologie que sont les neurones ;)

Le 04/10/2024 à 10h 09

D'ailleurs, question au journaliste : Automattic à l'usage commercial exclusif de la marque Wordpress (autrement dit, Automattic est le seul à pouvoir commercialiser un produit sous la marque Wordpress, ce qu'il fait via Wordpress.com).

Mais en cas de violation de la marque, ne serait-ce pas plutôt au propriétaire de la marque, et donc à la WordPress Foundation, d'agir ? Automattic ne risque-t-il pas d'être débouté pour cette simple raison ?

Difficile de trancher si facilement, en tout cas de ma part alors que je ne suis pas spécialiste du droit US et que les deux entreprises ont plusieurs avocats chacune qui se penchent évidemment sur la question. Automattic a publié récemment un billet en répondant (donc de leur point de vue) à cette question.

Le 04/10/2024 à 09h 24

@fred42 merci pour le repérage ;)

Le 04/10/2024 à 09h 33

"On a vraiment encore du boulot pour éduquer nos garçons."

C'est gentil ça. On aurait pu dire enfant, mais c'est écrit "garçon". Parce qu'on ne peut se faire agresser que par un garçon voyons.

"Concernant les agresseurs, « dans 90 à 95% des cas, quelles que soient les violences subies, les auteurs désignés sont de sexe masculin » "

Le 03/10/2024 à 21h 03

Comme indiqué dans le graphique, il y a des viols sous menaces physiques et aussi des viols sous menaces psychologiques.

Il existe aussi un phénomène appelé "sidération". Vous pouvez regarder cette vidéo qui l'explique.

Le 03/10/2024 à 17h 03

Merci. Comme dit dans l'article, l'étude est inédite. Et l'auteur précise : « c’est la première fois en Europe que nous avons pu les spécifier sur un échantillon d’une telle ampleur en milieu étudiant », donc non, il n'y a pas eu d'étude menée antérieurement. Quant à la répétition les années suivantes, ce n'est pas précisé.

Le 27/09/2024 à 15h 44

C'est précisément la question qu'on s'est posée en discutant rapidement de ce sujet en interne (on en reparlera dans la journée), mais on n'a pas la réponse :D

Voilà donc, à propos des drones Shahed

Le 23/09/2024 à 09h 36

😅 j'en profite pour mettre un lien dessus à propos de l'actu publiée juste après

Le 19/09/2024 à 16h 09

Bonjour, vous pouvez lire, par exemple, ce brief.

Le 18/09/2024 à 08h 08

Merci, effectivement, mon cerveau a dû mélanger les deux entreprises dont le nom finit par "zon".

Le 05/09/2024 à 11h 32

Remarque, je suis quand même curieux de savoir si un process d'entraînement d'IA est aussi sujet au shit in, shit out.

Voir sur le sujet L’entrainement sur des données synthétiques, talon d’Achille de l’IA générative (avec son sous-titre et Les IA génératives tournent mal quand elles sont entraînées sur leurs propres données ;)

Le 03/09/2024 à 09h 45

Oui, j'ai ajouté le lien qui aurait dû être dans l'article dès la publication (oubli avant de publier ;) )

Le 30/08/2024 à 15h 20

Alors, Guillaume Cabanac travaille beaucoup sur le sujet, mais ce n'est pas le même outil dont il était question. Celui de 2021 signalait des articles problématiques en repérant des « phrases torturées ». On aura sans doute l'occasion d'en reparler un de ces jours ici ;)

Le 30/08/2024 à 14h 07

Un "annuaire", je sais pas si on peut appeler ça comme ça, y a Google Scholar depuis longtemps et j'ai récemment parlé ici de Matilda

Le 29/08/2024 à 14h 10

Dans la citation, on parle bien de "Data information" pas des data en elles-mêmes et le " or similar data" introduit un flou rendant possible de seulement décrire les données.

Le 27/08/2024 à 10h 10

Petite correction dans le titre : Philippe Teuwen est belge

Le 27/08/2024 à 07h 55

Pour les affiliations pour les articles, la consigne n'est pas du tout de privilégier l'université, mais de donner toutes les affiliations du labo complet et pas seulement de la personne.

Et de mettre l'Université en première, en tout cas dans nombre de temoignages, c'est ce qu'on m'a dit. Sachant que le classement prend la première affectation de la liste.

Le 26/08/2024 à 18h 46

Et concrètement, comment on fait pour choisir ? Tu aurais une source ?

Chaque chercheur signe ses articles et indique ses affiliations à l'éditeur de la revue dans laquelle il va publier. Il peut choisir à ce moment là. Et le classement est ok pour ça (désolé pas de source là, je suis dans un train)

Édit : le classement récupère les affiliations via les métadonnées des articles.

Le 26/08/2024 à 17h 10

Pour le premier point, ce n'est plus le cas depuis quelques années. Les chercheurs ont le droit (donné par le classement) de choisir une affectation et ont pour consigne de choisir l'Université plutôt que les institutions de recherche (qui ne sont pas intéressées par le fait d'apparaître au classement).

Le 22/08/2024 à 17h 39

Justement, ça permet de dire que l'université Paris-Saclay est entrée dans cette norme .

Quant au constat, sans aucune information sur l'infrastructure, ce n'est qu'une supposition.

Edit: jusqu'à récemment, les universités françaises utilisaient soit des services de communication internes, soit des petites entreprises de communication.

Le 22/08/2024 à 11h 39

Je te suis dans ton analyse, mais le fait que C2 soit privé n'est pas clair dans l'article.
De ce que je comprends : tu peux obtenir via slack des infos via des canaux publics dont tu n'es pas membre (et donc les envoyer à l'extérieur).
tu peux envoyer des infos provenant de canaux privés dont tu es membre.
Partager une clé API via Slack, est-ce une bonne pratique de sécurité ?

Bonjour, @maps a bien résumé la situation. Et comme je le dis dans l'article : les chercheurs "supposent que Jon Cefalu (un utilisateur hypothétique) a partagé cette clé API dans un canal privé avec un message du genre « EldritchNexus API key: hjOshe0123456789 »", C2 est donc bien privé.

Désolé si ça n'était pas assez clair.

Le 19/07/2024 à 10h 26

Oui, c'est la même chose. Le nom du programme est "beta.gouv" mais l'url où il se trouve est "beta.gouv.fr" ;)

Le 03/07/2024 à 15h 05

Comme dit dans l'article "Dans ce document, Google confirme que l'IA est une des causes principales de cette augmentation. "

Le 03/07/2024 à 15h 04

L'article n'est pas clair sur l'origine de l'émission. A priori on ne serait pas ou peu sur l'électricité (qui n'a augmenté que de 17%, 100% renouvelable - ce qui ne veut pas dire 0% CO2).

Le sous entendu est que ce serait dû à d'autres sources (construction de datacenters et cycle de vie des machines ? tout n'est que supposition).

L'augmentation modérée de la conso vient presque en contradiction avec l'affirmation que la cause est l'IA...

Et pour reprendre l'argument des promoteurs des datacenters, n'y a t il pas des économies réalisées sur d'autres datacenters grâce à la centralisation de certaines activités chez Google ?

Il manque un peu de profondeur dans l'article par rapport à la dépêche déjà publiée partout :(

Petite précision tant que je suis ici : les 17 % sont par rapport à 2022 (donc ne pas faire de comparaison directe avec les 48 % par rapport à 2019)

Je viens d'ajouter la précision dans le brief.

Le 03/07/2024 à 14h 53

Vous prévoyez une analyse plus détaillée ultérieurement ?

Peut-être dans un article plus global sur le sujet de l'augmentation en général. Le document peut être une des sources sur lesquelles s'appuyer.

Le 03/07/2024 à 14h 10

L'article n'est pas clair sur l'origine de l'émission. A priori on ne serait pas ou peu sur l'électricité (qui n'a augmenté que de 17%, 100% renouvelable - ce qui ne veut pas dire 0% CO2).

Le sous entendu est que ce serait dû à d'autres sources (construction de datacenters et cycle de vie des machines ? tout n'est que supposition).

L'augmentation modérée de la conso vient presque en contradiction avec l'affirmation que la cause est l'IA...

Et pour reprendre l'argument des promoteurs des datacenters, n'y a t il pas des économies réalisées sur d'autres datacenters grâce à la centralisation de certaines activités chez Google ?

Il manque un peu de profondeur dans l'article par rapport à la dépêche déjà publiée partout :(

C'est un brief ;)

Le 28/06/2024 à 16h 53

Tu devrais aller voir la dernière brève que Martin vient de publier :D

😅

Le 27/06/2024 à 12h 44

« A la limite, on aurait un article qui reprend les avis ou positions des différents partis sur le numérique, ce serait constructif et intéressant. »

D'ailleurs j'étais déçu aux Européennes.
Sur Next on a eu des articles qui disaient que l'uniformisation du Roaming c'était l'Europe, l'USB-C encore l'Europe, la GDPR toujours l'Europe, etc, etc.
Mais au final dans les tracts il n'y a pas un seul parti qui a dit que cétait grâce à lui…
On a des trucs fait par l'Europe et personne ne s'en est vanté. Même si ça a fait l'unanimité, mais pas quelqu'un pour dire "moi preums"…C'était pas une promesse, c'était un fait.
Dommage dommage

@dvr-x Bonjour, vous avez peut-être loupé cet article

Le 21/06/2024 à 11h 53

Bonjour, alors concernant l'excès d'aluminium, il y a bien une notion d'échelle ici : « le taux d'excès d'aluminium au sommet de la mésosphère pourrait atteindre un excès annuel de plus de 640 % par rapport aux niveaux naturels ».

Le 20/06/2024 à 17h 55

J'ai rajouté un paragraphe d'explication. Oui, ce n'est pas chiffré mais l'ajout important d'alumine crée bien des réactions qui vont endommager la couche d'ozone.

Le 13/06/2024 à 11h 13

J'étais content de mon "thuriféraires du pachyderme", oui 😅

Le 05/06/2024 à 13h 28

Heuu pour qu'une vidéo se retrouve dans Stream, ce n'est pas par l'opération du Saint esprit... Il faut que le meet Teams soit enregistré et donc c'est stream qui supporte l'enregistrement et le met à dispo via une Rbac ou alors que le fichier soit uploadé manuellement et toujours protégé via une Rbac.

Je n'ai pas écrit le contraire. Il en reste néanmoins qu'il y a bien des données enregistrées via Microsoft 365 Education dont il est difficile de déterminer qui est " responsable du traitement des données".

Le 05/06/2024 à 10h 01

Des vidéos enregistrées via le service "Microsoft Stream" inclus dans Microsoft 365 Education (précision ajoutée dans l'actu, merci de la question ;) )

Le 31/05/2024 à 13h 17

quelqu'un qui utilise ChatGPT (comme beaucoup de devs)
Quelle est la source de cette affirmation ?
Je n'ai rien vu de tel dans l'étude.

Franchement, quelqu'un qui utilise un perroquet statistique pour écrire du code est-il un dev ? Si oui, est-il un bon dev ?

Je parle de "là", dans le sens ici dans Next. Bref, j'explique ma décision de publier sur cette étude. Je pense qu'effectivement ce n'est pas dans l'étude que tu trouveras l'info ;)

Le 31/05/2024 à 12h 59

Si cette étude est là pour montrer que le problème est dans l'interface chaise clavier qui cherche à utiliser le mauvais outil, OK. Mais ça ne ressort pas de l'article.

Elle est là pour montrer à la personne qui est entre la chaise et le clavier ce qui peut l'aider...

Je ne me suis peut-être pas mis à la place de Fred42 mais est-ce que Fred42 s'est mis à la place de quelqu'un qui utilise ChatGPT pour répondre à ses questions de code (comme beaucoup de devs) ?

Le 31/05/2024 à 12h 05

Par contre, si on se pose un peu et qu'on regarde le fait que la plupart des erreurs sont d'ordre conceptuel, ça va dans le sens de modèles de langage qui font très bien des tâches assez classiques et répétitives (syntaxes etc) et beaucoup moins « intellectuelles » comme la conception logicielle. Bref, ça reste des machines :)
Bah on compare ChatGPT, généraliste et qui doit grosso modo avoir un niveau d'étudiant à la fac sur ces sujets, à des professionnels qui ont une légitimité (expertise, expérience ...) sur des sujets pointus. J'espère bien que l'avantage est aux humains face aux machines.

C'est là que je mets un gros doute sur l'intérêt de ce papier : le choix de la machine. Est-ce que ChatGPT est vraiment la cible à considérer dans une telle étude ?

Comme répondu avant : les devs utilisent en masse ChatGPT pour ça. Ici, l'intérêt n'est pas de "savoir lequel a la plus grosse" mais de répondre face à une pratique qui existe en vrai.

Le 31/05/2024 à 12h 00

Je vous propose d'écrire une review de la présentation scientifique au board de la Conference on Human Factors in Computing Systems ;)

De mon côté, je trouve cet article très intéressant. Et ce n'est pas le côté putaclic qui m'intéresse.

Par contre, si on se pose un peu et qu'on regarde le fait que la plupart des erreurs sont d'ordre conceptuel, ça va dans le sens de modèles de langage qui font très bien des tâches assez classiques et répétitives (syntaxes etc) et beaucoup moins « intellectuelles » comme la conception logicielle. Bref, ça reste des machines :)

Quant au CV de la jeune chercheuse Samia Kabir, il est plutôt cohérent avec le sujet https://samiakabir.com/papers/

Le 31/05/2024 à 11h 51

Je vous propose d'écrire une review de la présentation scientifique au board de la Conference on Human Factors in Computing Systems ;)

De mon côté, je trouve cet article très intéressant. Et ce n'est pas le côté putaclic qui m'intéresse.

Par contre, si on se pose un peu et qu'on regarde le fait que la plupart des erreurs sont d'ordre conceptuel, ça va dans le sens de modèles de langage qui font très bien des tâches assez classiques et répétitives (syntaxes etc) et beaucoup moins « intellectuelles » comme la conception logicielle. Bref, ça reste des machines :)

Le 31/05/2024 à 11h 22

D'ordre générale, une étude qui évoque GPT 3.5 est à prendre avec du recul pour moi. Ce modèle est dépassé, c'est donc une information à prendre en compte quand on met en avant les résultats de celle-ci.

Et oui, la recherche prend du temps et a du mal à suivre la vitesse à laquelle les modèles évoluent. Chaque jour on a une actualité dans le domaine qui parle du nouveau modèle TopMoumoutx64b parameters qui poutre tout et se fait détrôner le lendemain par un autre.

C'est donc quelque chose à garder en tête lorsqu'on traite le sujet.

Là c'est comme si on me disait que le moteur de rendu de IE6 est moins performant dans les benchmark de 2024. Normal, c'est un produit obsolète (presque depuis sa naissance histoire d'anticiper le troll).

On peut le voir autrement aussi : Pourquoi utiliser un truc qui n'est même pas correctement évalué et dont on ne connaît pas les perfs réelles ? ;)

Le 31/05/2024 à 10h 42

Copilot a depuis quelques temps un chat de disponible. De même que Jetbrains AI.

Ok, mais la recherche prend du temps et de même pour l'adoption et l'adaptation des pratiques...

Le 31/05/2024 à 10h 33

Sauf que Copilot ne répond pas à des questions, comme l'expliquent bien les auteurs de l'étude :

"One of the main advantages of ChatGPT over GitHub Copilot is that ChatGPT works as a conversational chatbot that allows users to ask questions and give feedback beyond code completion. For instance, programmers can ask a conceptual question about a data type used in a program, ask for a code explanation, and ask how to fix an error message".

Ils renvoient aussi à cet article pour expliquer que les développeurs utilisent réellement ChatGPT mais pas pour les mêmes raisons que Copilot : https://www.itprotoday.com/development-techniques-and-management/github-copilot-vs-chatgpt-which-tool-better-software