votre avatar Équipe

Martin Clavey

est avec nous depuis le 9 avril 2020 ❤️

Bio

Journaliste scientifique. Ancien d'Owni et de la platforme de blogs en SHS Hypothèses.

Site personnel

https://soundofscience.fr

Aujourd'hui à 10h 33

Attention, le premier lien concerne l'ambiance actuelle avec "el drama" en ligne de fond.

Les autres, c'est en réalité le témoignage d'une seule personne. Il ne faut pas tomber dans le piège de faire une généralisation sur la base d'un seul témoignage pour une boite qui emploie près de 2000 personnes (que le témoignage soit positif ou négatif, ça marche dans les deux sens).

C'est même le premier lien du brief ;)

Le 15/10/2024 à 14h 52

Petit ajout en commentaire après publication : les informaticiens verront quand même dans la deuxième vidéo que le modèle d'Adobe considère que le cable RJ-45 se débranche juste en tirant dessus sans appuyer sur le clips et que ça fait quand même bien bouger le câble d'à côté ;)

Edit : et que le bout du câble s'allume quand il est débranché. Étrange 🤔

Le 11/10/2024 à 17h 11

J'avoue, j'ai été tenté aussi.

Le 08/10/2024 à 16h 09

Voilà une réponse à toutes nos questions, une seule rubrique dans Next : « Physique » !

Le 08/10/2024 à 13h 57

Dans ce cas, on pouvait aussi les classer en "physiologie et médecine" pour avoir utilisé des concepts de biologie que sont les neurones ;)

Le 04/10/2024 à 10h 09

D'ailleurs, question au journaliste : Automattic à l'usage commercial exclusif de la marque Wordpress (autrement dit, Automattic est le seul à pouvoir commercialiser un produit sous la marque Wordpress, ce qu'il fait via Wordpress.com).

Mais en cas de violation de la marque, ne serait-ce pas plutôt au propriétaire de la marque, et donc à la WordPress Foundation, d'agir ? Automattic ne risque-t-il pas d'être débouté pour cette simple raison ?

Difficile de trancher si facilement, en tout cas de ma part alors que je ne suis pas spécialiste du droit US et que les deux entreprises ont plusieurs avocats chacune qui se penchent évidemment sur la question. Automattic a publié récemment un billet en répondant (donc de leur point de vue) à cette question.

Le 04/10/2024 à 09h 24

@fred42 merci pour le repérage ;)

Le 04/10/2024 à 09h 33

"On a vraiment encore du boulot pour éduquer nos garçons."

C'est gentil ça. On aurait pu dire enfant, mais c'est écrit "garçon". Parce qu'on ne peut se faire agresser que par un garçon voyons.

"Concernant les agresseurs, « dans 90 à 95% des cas, quelles que soient les violences subies, les auteurs désignés sont de sexe masculin » "

Le 03/10/2024 à 21h 03

Comme indiqué dans le graphique, il y a des viols sous menaces physiques et aussi des viols sous menaces psychologiques.

Il existe aussi un phénomène appelé "sidération". Vous pouvez regarder cette vidéo qui l'explique.

Le 03/10/2024 à 17h 03

Merci. Comme dit dans l'article, l'étude est inédite. Et l'auteur précise : « c’est la première fois en Europe que nous avons pu les spécifier sur un échantillon d’une telle ampleur en milieu étudiant », donc non, il n'y a pas eu d'étude menée antérieurement. Quant à la répétition les années suivantes, ce n'est pas précisé.

Le 27/09/2024 à 15h 44

C'est précisément la question qu'on s'est posée en discutant rapidement de ce sujet en interne (on en reparlera dans la journée), mais on n'a pas la réponse :D

Voilà donc, à propos des drones Shahed

Le 23/09/2024 à 09h 36

😅 j'en profite pour mettre un lien dessus à propos de l'actu publiée juste après

Le 19/09/2024 à 16h 09

Bonjour, vous pouvez lire, par exemple, ce brief.

Le 18/09/2024 à 08h 08

Merci, effectivement, mon cerveau a dû mélanger les deux entreprises dont le nom finit par "zon".

Le 05/09/2024 à 11h 32

Remarque, je suis quand même curieux de savoir si un process d'entraînement d'IA est aussi sujet au shit in, shit out.

Voir sur le sujet L’entrainement sur des données synthétiques, talon d’Achille de l’IA générative (avec son sous-titre et Les IA génératives tournent mal quand elles sont entraînées sur leurs propres données ;)

Le 03/09/2024 à 09h 45

Oui, j'ai ajouté le lien qui aurait dû être dans l'article dès la publication (oubli avant de publier ;) )

Le 30/08/2024 à 15h 20

Alors, Guillaume Cabanac travaille beaucoup sur le sujet, mais ce n'est pas le même outil dont il était question. Celui de 2021 signalait des articles problématiques en repérant des « phrases torturées ». On aura sans doute l'occasion d'en reparler un de ces jours ici ;)

Le 30/08/2024 à 14h 07

Un "annuaire", je sais pas si on peut appeler ça comme ça, y a Google Scholar depuis longtemps et j'ai récemment parlé ici de Matilda

Le 29/08/2024 à 14h 10

Dans la citation, on parle bien de "Data information" pas des data en elles-mêmes et le " or similar data" introduit un flou rendant possible de seulement décrire les données.

Le 27/08/2024 à 10h 10

Petite correction dans le titre : Philippe Teuwen est belge

Le 27/08/2024 à 07h 55

Pour les affiliations pour les articles, la consigne n'est pas du tout de privilégier l'université, mais de donner toutes les affiliations du labo complet et pas seulement de la personne.

Et de mettre l'Université en première, en tout cas dans nombre de temoignages, c'est ce qu'on m'a dit. Sachant que le classement prend la première affectation de la liste.

Le 26/08/2024 à 18h 46

Et concrètement, comment on fait pour choisir ? Tu aurais une source ?

Chaque chercheur signe ses articles et indique ses affiliations à l'éditeur de la revue dans laquelle il va publier. Il peut choisir à ce moment là. Et le classement est ok pour ça (désolé pas de source là, je suis dans un train)

Édit : le classement récupère les affiliations via les métadonnées des articles.

Le 26/08/2024 à 17h 10

Pour le premier point, ce n'est plus le cas depuis quelques années. Les chercheurs ont le droit (donné par le classement) de choisir une affectation et ont pour consigne de choisir l'Université plutôt que les institutions de recherche (qui ne sont pas intéressées par le fait d'apparaître au classement).

Le 22/08/2024 à 17h 39

Justement, ça permet de dire que l'université Paris-Saclay est entrée dans cette norme .

Quant au constat, sans aucune information sur l'infrastructure, ce n'est qu'une supposition.

Edit: jusqu'à récemment, les universités françaises utilisaient soit des services de communication internes, soit des petites entreprises de communication.

Le 22/08/2024 à 11h 39

Je te suis dans ton analyse, mais le fait que C2 soit privé n'est pas clair dans l'article.
De ce que je comprends : tu peux obtenir via slack des infos via des canaux publics dont tu n'es pas membre (et donc les envoyer à l'extérieur).
tu peux envoyer des infos provenant de canaux privés dont tu es membre.
Partager une clé API via Slack, est-ce une bonne pratique de sécurité ?

Bonjour, @maps a bien résumé la situation. Et comme je le dis dans l'article : les chercheurs "supposent que Jon Cefalu (un utilisateur hypothétique) a partagé cette clé API dans un canal privé avec un message du genre « EldritchNexus API key: hjOshe0123456789 »", C2 est donc bien privé.

Désolé si ça n'était pas assez clair.

Le 19/07/2024 à 10h 26

Oui, c'est la même chose. Le nom du programme est "beta.gouv" mais l'url où il se trouve est "beta.gouv.fr" ;)

Le 03/07/2024 à 15h 05

Comme dit dans l'article "Dans ce document, Google confirme que l'IA est une des causes principales de cette augmentation. "

Le 03/07/2024 à 15h 04

L'article n'est pas clair sur l'origine de l'émission. A priori on ne serait pas ou peu sur l'électricité (qui n'a augmenté que de 17%, 100% renouvelable - ce qui ne veut pas dire 0% CO2).

Le sous entendu est que ce serait dû à d'autres sources (construction de datacenters et cycle de vie des machines ? tout n'est que supposition).

L'augmentation modérée de la conso vient presque en contradiction avec l'affirmation que la cause est l'IA...

Et pour reprendre l'argument des promoteurs des datacenters, n'y a t il pas des économies réalisées sur d'autres datacenters grâce à la centralisation de certaines activités chez Google ?

Il manque un peu de profondeur dans l'article par rapport à la dépêche déjà publiée partout :(

Petite précision tant que je suis ici : les 17 % sont par rapport à 2022 (donc ne pas faire de comparaison directe avec les 48 % par rapport à 2019)

Je viens d'ajouter la précision dans le brief.

Le 03/07/2024 à 14h 53

Vous prévoyez une analyse plus détaillée ultérieurement ?

Peut-être dans un article plus global sur le sujet de l'augmentation en général. Le document peut être une des sources sur lesquelles s'appuyer.

Le 03/07/2024 à 14h 10

L'article n'est pas clair sur l'origine de l'émission. A priori on ne serait pas ou peu sur l'électricité (qui n'a augmenté que de 17%, 100% renouvelable - ce qui ne veut pas dire 0% CO2).

Le sous entendu est que ce serait dû à d'autres sources (construction de datacenters et cycle de vie des machines ? tout n'est que supposition).

L'augmentation modérée de la conso vient presque en contradiction avec l'affirmation que la cause est l'IA...

Et pour reprendre l'argument des promoteurs des datacenters, n'y a t il pas des économies réalisées sur d'autres datacenters grâce à la centralisation de certaines activités chez Google ?

Il manque un peu de profondeur dans l'article par rapport à la dépêche déjà publiée partout :(

C'est un brief ;)

Le 28/06/2024 à 16h 53

Tu devrais aller voir la dernière brève que Martin vient de publier :D

😅

Le 27/06/2024 à 12h 44

« A la limite, on aurait un article qui reprend les avis ou positions des différents partis sur le numérique, ce serait constructif et intéressant. »

D'ailleurs j'étais déçu aux Européennes.
Sur Next on a eu des articles qui disaient que l'uniformisation du Roaming c'était l'Europe, l'USB-C encore l'Europe, la GDPR toujours l'Europe, etc, etc.
Mais au final dans les tracts il n'y a pas un seul parti qui a dit que cétait grâce à lui…
On a des trucs fait par l'Europe et personne ne s'en est vanté. Même si ça a fait l'unanimité, mais pas quelqu'un pour dire "moi preums"…C'était pas une promesse, c'était un fait.
Dommage dommage

@dvr-x Bonjour, vous avez peut-être loupé cet article

Le 21/06/2024 à 11h 53

Bonjour, alors concernant l'excès d'aluminium, il y a bien une notion d'échelle ici : « le taux d'excès d'aluminium au sommet de la mésosphère pourrait atteindre un excès annuel de plus de 640 % par rapport aux niveaux naturels ».

Le 20/06/2024 à 17h 55

J'ai rajouté un paragraphe d'explication. Oui, ce n'est pas chiffré mais l'ajout important d'alumine crée bien des réactions qui vont endommager la couche d'ozone.

Le 13/06/2024 à 11h 13

J'étais content de mon "thuriféraires du pachyderme", oui 😅

Le 05/06/2024 à 13h 28

Heuu pour qu'une vidéo se retrouve dans Stream, ce n'est pas par l'opération du Saint esprit... Il faut que le meet Teams soit enregistré et donc c'est stream qui supporte l'enregistrement et le met à dispo via une Rbac ou alors que le fichier soit uploadé manuellement et toujours protégé via une Rbac.

Je n'ai pas écrit le contraire. Il en reste néanmoins qu'il y a bien des données enregistrées via Microsoft 365 Education dont il est difficile de déterminer qui est " responsable du traitement des données".

Le 05/06/2024 à 10h 01

Des vidéos enregistrées via le service "Microsoft Stream" inclus dans Microsoft 365 Education (précision ajoutée dans l'actu, merci de la question ;) )

Le 31/05/2024 à 13h 17

quelqu'un qui utilise ChatGPT (comme beaucoup de devs)


Quelle est la source de cette affirmation ?
Je n'ai rien vu de tel dans l'étude.

Franchement, quelqu'un qui utilise un perroquet statistique pour écrire du code est-il un dev ? Si oui, est-il un bon dev ?

Je parle de "là", dans le sens ici dans Next. Bref, j'explique ma décision de publier sur cette étude. Je pense qu'effectivement ce n'est pas dans l'étude que tu trouveras l'info ;)

Le 31/05/2024 à 12h 59

Si cette étude est là pour montrer que le problème est dans l'interface chaise clavier qui cherche à utiliser le mauvais outil, OK. Mais ça ne ressort pas de l'article.

Elle est là pour montrer à la personne qui est entre la chaise et le clavier ce qui peut l'aider...

Je ne me suis peut-être pas mis à la place de Fred42 mais est-ce que Fred42 s'est mis à la place de quelqu'un qui utilise ChatGPT pour répondre à ses questions de code (comme beaucoup de devs) ?

Le 31/05/2024 à 12h 05

Par contre, si on se pose un peu et qu'on regarde le fait que la plupart des erreurs sont d'ordre conceptuel, ça va dans le sens de modèles de langage qui font très bien des tâches assez classiques et répétitives (syntaxes etc) et beaucoup moins « intellectuelles » comme la conception logicielle. Bref, ça reste des machines :)


Bah on compare ChatGPT, généraliste et qui doit grosso modo avoir un niveau d'étudiant à la fac sur ces sujets, à des professionnels qui ont une légitimité (expertise, expérience ...) sur des sujets pointus. J'espère bien que l'avantage est aux humains face aux machines.

C'est là que je mets un gros doute sur l'intérêt de ce papier : le choix de la machine. Est-ce que ChatGPT est vraiment la cible à considérer dans une telle étude ?

Comme répondu avant : les devs utilisent en masse ChatGPT pour ça. Ici, l'intérêt n'est pas de "savoir lequel a la plus grosse" mais de répondre face à une pratique qui existe en vrai.

Le 31/05/2024 à 12h 00

Je vous propose d'écrire une review de la présentation scientifique au board de la Conference on Human Factors in Computing Systems ;)

De mon côté, je trouve cet article très intéressant. Et ce n'est pas le côté putaclic qui m'intéresse.

Par contre, si on se pose un peu et qu'on regarde le fait que la plupart des erreurs sont d'ordre conceptuel, ça va dans le sens de modèles de langage qui font très bien des tâches assez classiques et répétitives (syntaxes etc) et beaucoup moins « intellectuelles » comme la conception logicielle. Bref, ça reste des machines :)

Quant au CV de la jeune chercheuse Samia Kabir, il est plutôt cohérent avec le sujet https://samiakabir.com/papers/

Le 31/05/2024 à 11h 51

Je vous propose d'écrire une review de la présentation scientifique au board de la Conference on Human Factors in Computing Systems ;)

De mon côté, je trouve cet article très intéressant. Et ce n'est pas le côté putaclic qui m'intéresse.

Par contre, si on se pose un peu et qu'on regarde le fait que la plupart des erreurs sont d'ordre conceptuel, ça va dans le sens de modèles de langage qui font très bien des tâches assez classiques et répétitives (syntaxes etc) et beaucoup moins « intellectuelles » comme la conception logicielle. Bref, ça reste des machines :)

Le 31/05/2024 à 11h 22

D'ordre générale, une étude qui évoque GPT 3.5 est à prendre avec du recul pour moi. Ce modèle est dépassé, c'est donc une information à prendre en compte quand on met en avant les résultats de celle-ci.

Et oui, la recherche prend du temps et a du mal à suivre la vitesse à laquelle les modèles évoluent. Chaque jour on a une actualité dans le domaine qui parle du nouveau modèle TopMoumoutx64b parameters qui poutre tout et se fait détrôner le lendemain par un autre.

C'est donc quelque chose à garder en tête lorsqu'on traite le sujet.

Là c'est comme si on me disait que le moteur de rendu de IE6 est moins performant dans les benchmark de 2024. Normal, c'est un produit obsolète (presque depuis sa naissance histoire d'anticiper le troll).

On peut le voir autrement aussi : Pourquoi utiliser un truc qui n'est même pas correctement évalué et dont on ne connaît pas les perfs réelles ? ;)

Le 31/05/2024 à 10h 42

Copilot a depuis quelques temps un chat de disponible. De même que Jetbrains AI.

Ok, mais la recherche prend du temps et de même pour l'adoption et l'adaptation des pratiques...

Le 31/05/2024 à 10h 33

Sauf que Copilot ne répond pas à des questions, comme l'expliquent bien les auteurs de l'étude :

"One of the main advantages of ChatGPT over GitHub Copilot is that ChatGPT works as a conversational chatbot that allows users to ask questions and give feedback beyond code completion. For instance, programmers can ask a conceptual question about a data type used in a program, ask for a code explanation, and ask how to fix an error message".

Ils renvoient aussi à cet article pour expliquer que les développeurs utilisent réellement ChatGPT mais pas pour les mêmes raisons que Copilot : https://www.itprotoday.com/development-techniques-and-management/github-copilot-vs-chatgpt-which-tool-better-software

Le 27/05/2024 à 12h 13

Effectivement, l'affichage peu clair de Google m'a induit en erreur. J'ai mis à jour l'article. Merci

Le 21/05/2024 à 14h 46

Ça n'a rien de vague, c'est tout ce qui n'est pas dans les 2 autres scopes. Alors, oui, c'est un fourre-tout, oui, c'est difficile à évaluer, mais ce n'est pas vague.

"fourre-tout" est un terme qui veut dire qu'on ne peut pas qualifier ce qui est dedans. C'est assez synonyme à "vague" pour moi. Mais soit, je n'ai pas réussi à bien vous faire passer mon regard là-dessus, pas la peine de dénigrer tout le papier ;)

Le 21/05/2024 à 13h 49

Et quand on sait ce que recouvre le scope 3, cela place l'article à la limite de l'enfumage volontaire. C'est le scope le plus difficile à évaluer, et celui sur lequel il est le plus difficile d'agir.
En particulier, il inclut l'utilisation que les clients font des produits (avec pour conséquence de recompter en scope 3 du fournisseur ce qui est du scope 1 du client). Je suis curieux de savoir comment c'est compté pour un éditeur logiciel: est ce que mon utilisation actuelle d'un pc tournant osus windows compte dans le scope 3 de Microsoft ?

"scope le plus difficile à évaluer", en qualifiant de "vague", c'est exactement de ça que je voulais parler. Donc merci pour le qualificatif d' "enfumage volontaire"...
Et non, je n'ai pas utilisé "l'IA" pour ça.

Le 20/05/2024 à 18h 07

Trop rapide utilisation de Deepl sur ce coup, désolé (et des petits soucis techniques d'édition).

Edit : c'est corrigé.

Le 10/05/2024 à 21h 34

Oups, c'est corrigé... Merci.
L’entrainement sur des données synthétiques, talon d’Achille de l’IA générative

L'entrainement sur des données synthétiques, talon d'Achille de l'IA générative

Synthetic in, garbage out

Copyright traps : un outil pour détecter si un texte est utilisé pour entrainer des IA ?

Copyright traps : un outil pour détecter si un texte est utilisé pour entrainer des IA ?

Jeu du chatGPT et de la souris numérique

SearchGPT : OpenAI adosse un prototype de moteur de recherche à ChatGPT

Mistral sort la version 2 de son modèle « Large »

Meta sort son modèle « frontière » Llama 3.1… ouvert, mais pas trop

Meta sort son modèle « frontière » Llama 3.1… ouvert, mais pas trop

Le Conseil d'État valide l'autorisation des taxis volants pendant les JO

« Payer ou consentir » de Meta : des « pratiques sournoises » selon la Commission européenne

« Payer ou consentir » de Meta : des « pratiques sournoises » selon la Commission européenne

Meta irrespect

La recherche française signe avec Elsevier pour un montant de 134 millions d’euros sur 4 ans

La recherche française signe avec Elsevier pour un montant de 134 millions d'euros sur 4 ans

Ouvrir ? Vraiment ?

OpenAI sort la version mini de GPT-4o

Législatives : un bilan de la CNIL peu transparent sur les partis mis en cause

Les sièges sociaux de X et SpaceX rejoignent Tesla au Texas

La Dinum sous l’œil critique de la Cour des comptes

La Dinum sous l'œil critique de la Cour des comptes

Gérer le budget ? Pour quoi faire ?

Le comité éthique du CNRS appelle à la vigilance sur les robots « sociaux »

Le comité éthique du CNRS appelle à la vigilance sur les robots « sociaux »

Trop humains ?

OpenAI accusée devant la SEC d'accords de confidentialités illégaux

Selon les CNIL, les dark patterns sont partout

Selon les CNIL, les dark patterns sont partout

Y a un certain motif

Z-Library de nouveau attaquée en France alors que les deux accusés se sont évadés

Z-Library de nouveau attaquée en France alors que les deux accusés se sont évadés

Catch me if you can

OpenAI supprime les sièges d'observateurs de son conseil d'administration

DGSI et DRSD alertent sur les ingérences étrangères dans le milieu scientifique

DGSI et DRSD alertent sur les ingérences étrangères dans le milieu scientifique

La contre-méthode scientifique

La messagerie interne d'OpenAI a été piratée

Apple supprime 25 applis VPN de son App Store en Russie

Apple supprime 25 applis VPN de son App Store en Russie

VPN à la .ru

Le Brésil interdit à Meta d’entrainer ses IA sur les données personnelles des Brésiliens

Le Brésil interdit à Meta d'entrainer ses IA sur les données personnelles des Brésiliens

Meta entrainement

Google a augmenté ses émissions de CO2 de 48 % depuis 2019

[MàJ] LAION-5B : des photos d’enfants utilisées sans consentement pour entrainer des IA

[MàJ] LAION-5B : des photos d'enfants utilisées sans consentement pour entrainer des IA

IA pas de consentement

JFrog alerte sur les injections de code lors de l’utilisation de bibliothèques fondées sur des LLM

JFrog alerte sur les injections de code lors de l'utilisation de bibliothèques fondées sur des LLM

What could go wrong?

La BNF : un réservoir de données pour les IA

La BNF : un réservoir de données pour les IA

Bibliathèque

Scientifiques et universitaires se mobilisent contre l'extrême-droite

Udio et Suno, des IA de génération de musiques attaquées par l’industrie musicale américaine

Udio et Suno, des IA de génération de musiques attaquées par l'industrie musicale américaine

Je danse le IA

Apple : pour la Commission européenne, l’App Store viole le DMA, lourde amende en perspective

Apple : pour la Commission européenne, l'App Store viole le DMA, lourde amende en perspective

Apple se prend une tarte

L'UFC-Que Choisir pointe les dark patterns des sites d'e-commerce

Les constellations de satellites vont gravement endommager la couche d’ozone

Les constellations de satellites vont gravement endommager la couche d'ozone

Creuser le trou

Plan Procu : « Nous sommes la solution de dernier recours » pour les procurations

Plan Procu : « Nous sommes la solution de dernier recours » pour les procurations

Juste pour le coup d’un soir ou deux, pas plus

La FTC attaque la procédure de résiliation d'abonnement d'Adobe

Meredith Whittaker (Signal) contre la modération de l’envoi de fichiers dans les messageries

Meredith Whittaker (Signal) contre la modération de l'envoi de fichiers dans les messageries

noyb attaque la Privacy Sandbox et accuse Google de mentir à ses utilisateurs

noyb attaque la Privacy Sandbox et accuse Google de mentir à ses utilisateurs

Don't be... non rien.