Équipe

Martin Clavey

est avec nous depuis le 9 avril 2020 ❤️

Bio

Journaliste scientifique. Ancien d'Owni et de la platforme de blogs en SHS Hypothèses.

Site personnel

https://soundofscience.fr

505 articles
96 commentaires

IA

SearchGPT ouvre ses portes aux utilisateurs Plus et Team de ChatGPT

IA

04/11/2024

10

Le 04/11/2024 à 10h 45

Du coup, le pic de l'auteur de cet article sur le fait que GPT a tendance à créer de faux liens n'a pas spécialement lieu d'être ici, car ce ne sont pas des liens générés par GPT qui sont présentés ici, mais bien des vrais liens, sortant d'un moteur de recherche.

J'allais faire les mêmes remarques que vous 2 sur cette pique journalistique.

Du coup, je me pose des questions sur le pourquoi de ce genre de piques infondées : incompréhension, incompétence, parti-pris, malveillance ou je ne sais quoi d'autre ?

Bonjour. C'est le seul rappel d'un fait établi par notre rédaction concernant un partenariat dont parle ce brief. Dans cette dernière phrase, il est bien écrit ChatGPT et non searchGPT. Sur ce, je vous laisse à vos suppositions sur mes compétences, partis-pris etc. Bonne journée,

IA

L’IA open-source a sa définition 1.0 qui exclut les modèles Llama de Meta

IA

29/10/2024

13

Le 29/10/2024 à 16h 33

Pour le sous-titre, j'étais prêt à sortir un "quand Meta fachée, Meta toujours cracher" 😅 (oui, j'ai lu le sous-titre après coup).

Ahah, presque envie de le reprendre. Peut être pour une prochaine sur Meta ;)

IA

Raisonnement des IA génératives : les benchmarks nous désinforment

IA

25/10/2024

33

Le 28/10/2024 à 12h 43

Le Monde a trouvé la solution : pouvoir partager 5 articles gratuitement par mois à ses amis. Les amis doivent s'inscrire, avec un compte gratuit, mais ça marche bien.

Bonjour. Nous avons deja une fonctionnalité similaire. Tous les articles de Next peuvent être partagés à vos amis via le lien cadeau en bas de l'article.

IA

L’éditeur Penguin Random House refuse que ses livres servent à entrainer des IA

IA

22/10/2024

14

Le 22/10/2024 à 10h 51

Possiblement non car la directive européenne DANUM confère un "droit de fouille" à des fins scientifiques.

En cherchant un peu, j'ai d'ailleurs vu passer une décision du tribunal régional de Hambourg dans un litige opposant LAION (l'organisme à but non lucratif derrière les data set ayant notamment permis d'entraîner Stable Diffusion) et Robert Kneschke.

La reproduction d’une photographie dans un set de données n’est pas contrefaisante car couverte par l’exception de fouille de textes et de données à des fins scientifiques.

Le lien vers la décision (en allemand) est disponible dans l'article pour les intéressés ( @MartinClavey si jamais vous voulez étudier la décision) . Apparemment c'est la première rendue dans le cadre de cette directive.

Ah, merci, je vais regarder ça.

IA

Un « point de bascule » concernant les images d’abus sexuels d’enfants générées par IA

IA

18/10/2024

26

Le 18/10/2024 à 16h 44

Ils ne savent pas, justement. Tous les serveurs concernés par un signalement, sauf 1, n'étaient pas en .onion.

Logiciel

Automattic : Matt Mullenweg a proposé une nouvelle offre de départ aux salariés

Logiciel

18/10/2024

30

Le 18/10/2024 à 10h 33

Attention, le premier lien concerne l'ambiance actuelle avec "el drama" en ligne de fond.

Les autres, c'est en réalité le témoignage d'une seule personne. Il ne faut pas tomber dans le piège de faire une généralisation sur la base d'un seul témoignage pour une boite qui emploie près de 2000 personnes (que le témoignage soit positif ou négatif, ça marche dans les deux sens).

C'est même le premier lien du brief ;)

IA

Adobe Firefly Video : un modèle entrainé en respectant les licences des contenus utilisés

IA

15/10/2024

10

Le 15/10/2024 à 14h 52

Petit ajout en commentaire après publication : les informaticiens verront quand même dans la deuxième vidéo que le modèle d'Adobe considère que le cable RJ-45 se débranche juste en tirant dessus sans appuyer sur le clips et que ça fait quand même bien bouger le câble d'à côté ;)

Edit : et que le bout du câble s'allume quand il est débranché. Étrange 🤔

Économie

OpenAI ne prévoit pas d’être rentable avant 2029

Économie

11/10/2024

16

Le 11/10/2024 à 17h 11

J'avoue, j'ai été tenté aussi.

Sciences

Prix Nobel de physique pour John Hopfield et Geoffrey Hinton, pionniers des réseaux de neurones

Sciences

08/10/2024

8

Le 08/10/2024 à 16h 09

Voilà une réponse à toutes nos questions, une seule rubrique dans Next : « Physique » !

Le 08/10/2024 à 13h 57

Dans ce cas, on pouvait aussi les classer en "physiologie et médecine" pour avoir utilisé des concepts de biologie que sont les neurones ;)

Droit

Automattic réclame une redevance de 8 % à WP Engine pour utilisation abusive de la marque WordPress

Droit

04/10/2024

25

Le 04/10/2024 à 10h 09

D'ailleurs, question au journaliste : Automattic à l'usage commercial exclusif de la marque Wordpress (autrement dit, Automattic est le seul à pouvoir commercialiser un produit sous la marque Wordpress, ce qu'il fait via Wordpress.com).

Mais en cas de violation de la marque, ne serait-ce pas plutôt au propriétaire de la marque, et donc à la WordPress Foundation, d'agir ? Automattic ne risque-t-il pas d'être débouté pour cette simple raison ?

Difficile de trancher si facilement, en tout cas de ma part alors que je ne suis pas spécialiste du droit US et que les deux entreprises ont plusieurs avocats chacune qui se penchent évidemment sur la question. Automattic a publié récemment un billet en répondant (donc de leur point de vue) à cette question.

Le 04/10/2024 à 09h 24

@fred42 merci pour le repérage ;)

Société

Violences sexuelles : informatique, physique, mécanique, plus de 30 % des étudiantes victimes

Société

03/10/2024

72

Le 04/10/2024 à 09h 33

"On a vraiment encore du boulot pour éduquer nos garçons."

C'est gentil ça. On aurait pu dire enfant, mais c'est écrit "garçon". Parce qu'on ne peut se faire agresser que par un garçon voyons.

"Concernant les agresseurs, « dans 90 à 95% des cas, quelles que soient les violences subies, les auteurs désignés sont de sexe masculin » "

Le 03/10/2024 à 21h 03

Comme indiqué dans le graphique, il y a des viols sous menaces physiques et aussi des viols sous menaces psychologiques.

Il existe aussi un phénomène appelé "sidération". Vous pouvez regarder cette vidéo qui l'explique.

Le 03/10/2024 à 17h 03

Merci. Comme dit dans l'article, l'étude est inédite. Et l'auteur précise : « c’est la première fois en Europe que nous avons pu les spécifier sur un échantillon d’une telle ampleur en milieu étudiant », donc non, il n'y a pas eu d'étude menée antérieurement. Quant à la répétition les années suivantes, ce n'est pas précisé.

Internet

Starlink revendique 4 millions d’utilisateurs

Internet

27/09/2024

23

Le 27/09/2024 à 15h 44

C'est précisément la question qu'on s'est posée en discutant rapidement de ce sujet en interne (on en reparlera dans la journée), mais on n'a pas la réponse

Voilà donc, à propos des drones Shahed

IA

Google crée un fonds de 120 millions de dollars pour l’IA dans l’éducation

IA

23/09/2024

3

Le 23/09/2024 à 09h 36

😅 j'en profite pour mettre un lien dessus à propos de l'actu publiée juste après

Social

Les vidéos TikTok ont de réelles conséquences sur l’image qu’ont les femmes d’elles-mêmes

Social

19/09/2024

22

Le 19/09/2024 à 16h 09

Bonjour, vous pouvez lire, par exemple, ce brief.

Logiciel

Linus Torvalds, Rust et le futur du noyau Linux

Logiciel

17/09/2024

6

Le 18/09/2024 à 08h 08

Merci, effectivement, mon cerveau a dû mélanger les deux entreprises dont le nom finit par "zon".

IA

X n’entrainera plus son IA Grok avec les données de ses utilisateurs européens

IA

05/09/2024

12

Le 05/09/2024 à 11h 32

Remarque, je suis quand même curieux de savoir si un process d'entraînement d'IA est aussi sujet au shit in, shit out.

Voir sur le sujet L’entrainement sur des données synthétiques, talon d’Achille de l’IA générative (avec son sous-titre et Les IA génératives tournent mal quand elles sont entraînées sur leurs propres données ;)

IA

LAION-5B revient sans contenus pédocriminels (promis), quid des autres problèmes ?

IA

03/09/2024

11

Le 03/09/2024 à 09h 45

Oui, j'ai ajouté le lien qui aurait dû être dans l'article dès la publication (oubli avant de publier ;) )

Sciences

Recherche scientifique : un outil pour éviter les « colosses aux pieds d’argile »

Sciences

30/08/2024

8

Le 30/08/2024 à 15h 20

Alors, Guillaume Cabanac travaille beaucoup sur le sujet, mais ce n'est pas le même outil dont il était question. Celui de 2021 signalait des articles problématiques en repérant des « phrases torturées ». On aura sans doute l'occasion d'en reparler un de ces jours ici ;)

Le 30/08/2024 à 14h 07

Un "annuaire", je sais pas si on peut appeler ça comme ça, y a Google Scholar depuis longtemps et j'ai récemment parlé ici de Matilda

IA

Vers des critères plus clairs pour l’« IA ouverte » ?

IA

29/08/2024

3

Le 29/08/2024 à 14h 10

Dans la citation, on parle bien de "Data information" pas des data en elles-mêmes et le " or similar data" introduit un flou rendant possible de seulement décrire les données.

Sécurité

Un chercheur belge identifie une porte dérobée dans les cartes sans contact MIFARE

Sécurité

26/08/2024

22

Le 27/08/2024 à 10h 10

Petite correction dans le titre : Philippe Teuwen est belge

Sciences

[Édito] Classement de Shanghai des universités : poudre aux yeux et pseudo-science

Sciences

26/08/2024

35

Le 27/08/2024 à 07h 55

Pour les affiliations pour les articles, la consigne n'est pas du tout de privilégier l'université, mais de donner toutes les affiliations du labo complet et pas seulement de la personne.

Et de mettre l'Université en première, en tout cas dans nombre de temoignages, c'est ce qu'on m'a dit. Sachant que le classement prend la première affectation de la liste.

Le 26/08/2024 à 18h 46

Et concrètement, comment on fait pour choisir ? Tu aurais une source ?

Chaque chercheur signe ses articles et indique ses affiliations à l'éditeur de la revue dans laquelle il va publier. Il peut choisir à ce moment là. Et le classement est ok pour ça (désolé pas de source là, je suis dans un train)

Édit : le classement récupère les affiliations via les métadonnées des articles.

Le 26/08/2024 à 17h 10

Pour le premier point, ce n'est plus le cas depuis quelques années. Les chercheurs ont le droit (donné par le classement) de choisir une affectation et ont pour consigne de choisir l'Université plutôt que les institutions de recherche (qui ne sont pas intéressées par le fait d'apparaître au classement).

Société

Cyberattaque contre l’Université Paris-Saclay : les serveurs emails, intranet et d’inscription touchés

Société

22/08/2024

19

Le 22/08/2024 à 17h 39

Justement, ça permet de dire que l'université Paris-Saclay est entrée dans cette norme .

Quant au constat, sans aucune information sur l'infrastructure, ce n'est qu'une supposition.

Edit: jusqu'à récemment, les universités françaises utilisaient soit des services de communication internes, soit des petites entreprises de communication.

IA

L’assistant IA de Slack peut fuiter des infos de canaux privés via une injection de prompt

IA

21/08/2024

8

Le 22/08/2024 à 11h 39

Je te suis dans ton analyse, mais le fait que C2 soit privé n'est pas clair dans l'article.
De ce que je comprends : tu peux obtenir via slack des infos via des canaux publics dont tu n'es pas membre (et donc les envoyer à l'extérieur).
tu peux envoyer des infos provenant de canaux privés dont tu es membre.
Partager une clé API via Slack, est-ce une bonne pratique de sécurité ?

Bonjour, @maps a bien résumé la situation. Et comme je le dis dans l'article : les chercheurs "supposent que Jon Cefalu (un utilisateur hypothétique) a partagé cette clé API dans un canal privé avec un message du genre « EldritchNexus API key: hjOshe0123456789 »", C2 est donc bien privé.

Désolé si ça n'était pas assez clair.

Société

La Dinum sous l’œil critique de la Cour des comptes

Société

17/07/2024

4

Le 19/07/2024 à 10h 26

Oui, c'est la même chose. Le nom du programme est "beta.gouv" mais l'url où il se trouve est "beta.gouv.fr" ;)

IA

Google a augmenté ses émissions de CO2 de 48 % depuis 2019

IA

03/07/2024

35

Le 03/07/2024 à 15h 05

Comme dit dans l'article "Dans ce document, Google confirme que l'IA est une des causes principales de cette augmentation. "

Le 03/07/2024 à 15h 04

L'article n'est pas clair sur l'origine de l'émission. A priori on ne serait pas ou peu sur l'électricité (qui n'a augmenté que de 17%, 100% renouvelable - ce qui ne veut pas dire 0% CO2).

Le sous entendu est que ce serait dû à d'autres sources (construction de datacenters et cycle de vie des machines ? tout n'est que supposition).

L'augmentation modérée de la conso vient presque en contradiction avec l'affirmation que la cause est l'IA...

Et pour reprendre l'argument des promoteurs des datacenters, n'y a t il pas des économies réalisées sur d'autres datacenters grâce à la centralisation de certaines activités chez Google ?

Il manque un peu de profondeur dans l'article par rapport à la dépêche déjà publiée partout :(

Petite précision tant que je suis ici : les 17 % sont par rapport à 2022 (donc ne pas faire de comparaison directe avec les 48 % par rapport à 2019)

Je viens d'ajouter la précision dans le brief.

Le 03/07/2024 à 14h 53

Vous prévoyez une analyse plus détaillée ultérieurement ?

Peut-être dans un article plus global sur le sujet de l'augmentation en général. Le document peut être une des sources sur lesquelles s'appuyer.

Le 03/07/2024 à 14h 10

C'est un brief ;)

IA

JFrog alerte sur les injections de code lors de l’utilisation de bibliothèques fondées sur des LLM

IA

28/06/2024

14

Le 28/06/2024 à 16h 53

Tu devrais aller voir la dernière brève que Martin vient de publier

😅

Société

Scientifiques et universitaires se mobilisent contre l’extrême-droite

Société

27/06/2024

114

Le 27/06/2024 à 12h 44

« A la limite, on aurait un article qui reprend les avis ou positions des différents partis sur le numérique, ce serait constructif et intéressant. »

D'ailleurs j'étais déçu aux Européennes.
Sur Next on a eu des articles qui disaient que l'uniformisation du Roaming c'était l'Europe, l'USB-C encore l'Europe, la GDPR toujours l'Europe, etc, etc.
Mais au final dans les tracts il n'y a pas un seul parti qui a dit que cétait grâce à lui…
On a des trucs fait par l'Europe et personne ne s'en est vanté. Même si ça a fait l'unanimité, mais pas quelqu'un pour dire "moi preums"…C'était pas une promesse, c'était un fait.
Dommage dommage

@dvr-x Bonjour, vous avez peut-être loupé cet article

Sciences

Les constellations de satellites vont gravement endommager la couche d’ozone

Sciences

20/06/2024

33

Le 21/06/2024 à 11h 53

Bonjour, alors concernant l'excès d'aluminium, il y a bien une notion d'échelle ici : « le taux d'excès d'aluminium au sommet de la mésosphère pourrait atteindre un excès annuel de plus de 640 % par rapport aux niveaux naturels ».

Le 20/06/2024 à 17h 55

J'ai rajouté un paragraphe d'explication. Oui, ce n'est pas chiffré mais l'ajout important d'alumine crée bien des réactions qui vont endommager la couche d'ozone.

Social

Mastodon : les chercheurs n’ont finalement pas migré en masse

Social

13/06/2024

22

Le 13/06/2024 à 11h 13

J'étais content de mon "thuriféraires du pachyderme", oui 😅

Droit

Microsoft 365 Education attaqué par deux plaintes de noyb

Droit

05/06/2024

11

Le 05/06/2024 à 13h 28

Heuu pour qu'une vidéo se retrouve dans Stream, ce n'est pas par l'opération du Saint esprit... Il faut que le meet Teams soit enregistré et donc c'est stream qui supporte l'enregistrement et le met à dispo via une Rbac ou alors que le fichier soit uploadé manuellement et toujours protégé via une Rbac.

Je n'ai pas écrit le contraire. Il en reste néanmoins qu'il y a bien des données enregistrées via Microsoft 365 Education dont il est difficile de déterminer qui est " responsable du traitement des données".

Le 05/06/2024 à 10h 01

Des vidéos enregistrées via le service "Microsoft Stream" inclus dans Microsoft 365 Education (précision ajoutée dans l'actu, merci de la question ;) )

IA

Stack Overflow vs ChatGPT : le chatbot se plante dans la moitié de ses réponses

IA

31/05/2024

69

Le 31/05/2024 à 13h 17

quelqu'un qui utilise ChatGPT (comme beaucoup de devs)

Quelle est la source de cette affirmation ?
Je n'ai rien vu de tel dans l'étude.

Franchement, quelqu'un qui utilise un perroquet statistique pour écrire du code est-il un dev ? Si oui, est-il un bon dev ?

Je parle de "là", dans le sens ici dans Next. Bref, j'explique ma décision de publier sur cette étude. Je pense qu'effectivement ce n'est pas dans l'étude que tu trouveras l'info ;)

Le 31/05/2024 à 12h 59

Si cette étude est là pour montrer que le problème est dans l'interface chaise clavier qui cherche à utiliser le mauvais outil, OK. Mais ça ne ressort pas de l'article.

Elle est là pour montrer à la personne qui est entre la chaise et le clavier ce qui peut l'aider...

Je ne me suis peut-être pas mis à la place de Fred42 mais est-ce que Fred42 s'est mis à la place de quelqu'un qui utilise ChatGPT pour répondre à ses questions de code (comme beaucoup de devs) ?

Le 31/05/2024 à 12h 05

Par contre, si on se pose un peu et qu'on regarde le fait que la plupart des erreurs sont d'ordre conceptuel, ça va dans le sens de modèles de langage qui font très bien des tâches assez classiques et répétitives (syntaxes etc) et beaucoup moins « intellectuelles » comme la conception logicielle. Bref, ça reste des machines :)

Bah on compare ChatGPT, généraliste et qui doit grosso modo avoir un niveau d'étudiant à la fac sur ces sujets, à des professionnels qui ont une légitimité (expertise, expérience ...) sur des sujets pointus. J'espère bien que l'avantage est aux humains face aux machines.

C'est là que je mets un gros doute sur l'intérêt de ce papier : le choix de la machine. Est-ce que ChatGPT est vraiment la cible à considérer dans une telle étude ?

Comme répondu avant : les devs utilisent en masse ChatGPT pour ça. Ici, l'intérêt n'est pas de "savoir lequel a la plus grosse" mais de répondre face à une pratique qui existe en vrai.

Le 31/05/2024 à 12h 00

Je vous propose d'écrire une review de la présentation scientifique au board de la Conference on Human Factors in Computing Systems ;)

De mon côté, je trouve cet article très intéressant. Et ce n'est pas le côté putaclic qui m'intéresse.

Par contre, si on se pose un peu et qu'on regarde le fait que la plupart des erreurs sont d'ordre conceptuel, ça va dans le sens de modèles de langage qui font très bien des tâches assez classiques et répétitives (syntaxes etc) et beaucoup moins « intellectuelles » comme la conception logicielle. Bref, ça reste des machines :)

Quant au CV de la jeune chercheuse Samia Kabir, il est plutôt cohérent avec le sujet https://samiakabir.com/papers/

Le 31/05/2024 à 11h 51

Le 31/05/2024 à 11h 22

D'ordre générale, une étude qui évoque GPT 3.5 est à prendre avec du recul pour moi. Ce modèle est dépassé, c'est donc une information à prendre en compte quand on met en avant les résultats de celle-ci.

Et oui, la recherche prend du temps et a du mal à suivre la vitesse à laquelle les modèles évoluent. Chaque jour on a une actualité dans le domaine qui parle du nouveau modèle TopMoumoutx64b parameters qui poutre tout et se fait détrôner le lendemain par un autre.

C'est donc quelque chose à garder en tête lorsqu'on traite le sujet.

Là c'est comme si on me disait que le moteur de rendu de IE6 est moins performant dans les benchmark de 2024. Normal, c'est un produit obsolète (presque depuis sa naissance histoire d'anticiper le troll).

On peut le voir autrement aussi : Pourquoi utiliser un truc qui n'est même pas correctement évalué et dont on ne connaît pas les perfs réelles ? ;)

Le 31/05/2024 à 10h 42

Copilot a depuis quelques temps un chat de disponible. De même que Jetbrains AI.

Ok, mais la recherche prend du temps et de même pour l'adoption et l'adaptation des pratiques...

Le 31/05/2024 à 10h 33

Sauf que Copilot ne répond pas à des questions, comme l'expliquent bien les auteurs de l'étude :

"One of the main advantages of ChatGPT over GitHub Copilot is that ChatGPT works as a conversational chatbot that allows users to ask questions and give feedback beyond code completion. For instance, programmers can ask a conceptual question about a data type used in a program, ask for a code explanation, and ask how to fix an error message".

Ils renvoient aussi à cet article pour expliquer que les développeurs utilisent réellement ChatGPT mais pas pour les mêmes raisons que Copilot : https://www.itprotoday.com/development-techniques-and-management/github-copilot-vs-chatgpt-which-tool-better-software