Google paye des éditeurs d’information pour entraîner une nouvelle plateforme d’IA générative

Aqua Abonné

Le 28/02/2024 à 15h26

#1

Mais c'est génial... l'emmerdification d'internet made in Google
- Payer pour que les médias se rendent dépendants du machin ("volume pré-établi"...)
- Comme les articles sont naze, leur audience baisse et deviennent donc dépendant du revenu de Google
- couper/réduire la dépense, voir rendre le machin payant ; se refaire sur les revenus publicitaires
- le média licencie ses autreu.ices humain.es et devient une ferme à bouillie hallucinée.

Ca devient pire que l'analogie du vendeur de drogue avec "la première dose est gratuite". là on te paye même pour prendre la première dose!

Eric2791 Abonné

Le 28/02/2024 à 16h18

#2

Quid de : Next a-t-il été contacté !?

Baldurien Abonné

Le 28/02/2024 à 17h26

#3

Il y a un équivalent du syndrome de Kessler dans le domaine de l'information ?

fred42 Abonné

Le 28/02/2024 à 17h40

#4

Les hallucinations et autres restitutions mot pour mot d’articles qui ont mené à la plainte du New-York Times contre OpenAI, par exemple, posent en effet des problématiques financières autant que de sauvegarde de l’intégrité de l’information dans l’espace public.

mais les récents aléas de Gemini, ChatGPT ou autre font aussi redouter une prolifération de la mal-information.

Face à la facilité avec laquelle les plateformes génératives permettent de produire des éléments faux, ou a minima « synthétiques »

Attention à ne pas tirer de conclusions hâtives en regardant ce que peut faire un outil généraliste d'IA générative mal utilisé sur la qualité de ce que peut produire un outil spécialisé entraîné sur cette tâche comme celui de Google (ou d'un autre) pour générer des articles d'information à partir de données en entrée qui elles sont vraies.

Vous pourriez être surpris de la différence de qualité.

Par contre, ça ne remplacera pas le journalisme d'investigation. Sur les brèves, je pense que le résultat pourrait être bon.

Nightmaster Abonné

Le 29/02/2024 à 00h34

#4.1

Attention à ne pas tirer de conclusions hâtives en regardant ce que peut faire un outil généraliste d'IA générative mal utilisé sur la qualité de ce que peut produire un outil spécialisé entraîné sur cette tâche comme celui de Google (ou d'un autre) pour générer des articles d'information à partir de données en entrée qui elles sont vraies.

Je pense que Mathilde écrit ça en ayant en tête ce qu’est fondamentalement une IA actuelle : un "LLM", donc un modèle probabiliste, pas une capacité de compréhension véritable (au sens humain de la chose).

Sans m’étendre sur le sujet, et sans vouloir (plus ?

) prétendre ce que veux dire Mathilde, je laisse juste un article (de Développez.com) sur le sujet des (actuelles) IAs / LLMs qui remet essai de rappeler comment le tout fonctionne, pour éviter que les gens ne succombent au charme du "marketing IA"

fred42 Abonné

Le 29/02/2024 à 00h48

#4.2

Nightmaster

Attention à ne pas tirer de conclusions hâtives en regardant ce que peut faire un outil généraliste d'IA générative mal utilisé sur la qualité de ce que peut produire un outil spécialisé entraîné sur cette tâche comme celui de Google (ou d'un autre) pour générer des articles d'information à partir de données en entrée qui elles sont vraies.

Je pense que Mathilde écrit ça en ayant en tête ce qu’est fondamentalement une IA actuelle : un "LLM", donc un modèle probabiliste, pas une capacité de compréhension véritable (au sens humain de la chose).

Sans m’étendre sur le sujet, et sans vouloir (plus ?

) prétendre ce que veux dire Mathilde, je laisse juste un article (de Développez.com) sur le sujet des (actuelles) IAs / LLMs qui remet essai de rappeler comment le tout fonctionne, pour éviter que les gens ne succombent au charme du "marketing IA"

L'article est pas mal mais ne m'a rien appris.

Je pense avoir compris qu'un LLM est assez bon dans des tâches de résumé, de traduction et de compilation de texte. C'est pour cela que je pense qu'il peut faire du travail de qualité sur certains types d'articles de presse. Ce n'est pas pour rien que j'ai parlé des brèves en particulier.
Il sera bon pour écrire un texte à partir d'un ou de plusieurs autres textes sources, les résumer, les traduire si besoin, etc.

Par contre, si on demande à un LLM généraliste de faire l'oracle ou de raconter le passé, il va se planter et c'est normal pour les raisons que tu expliques.

Modifié le 29/02/2024 à 00h50

Historique des modifications :

Posté le 29/02/2024 à 00h48

L'article est pas mal mais ne m'a rien appris.

Je pense avoir compris qu'un LLM est assez bon dans des tâches de résumé, de traduction et de compilation de texte. C'est pour cela que je pense qu'il peut faire du travail de qualité sur certains types d'articles de presse. Ce n'est pas pour rien que j'ai parlé des brèves en particulier.

Par contre, si on demande à un LLM généraliste de faire l'oracle ou de raconter le passé, il va se planter et c'est normal pour les raisons que tu expliques.

SebGF Abonné

Le 29/02/2024 à 07h37

#4.3

Nightmaster

Attention à ne pas tirer de conclusions hâtives en regardant ce que peut faire un outil généraliste d'IA générative mal utilisé sur la qualité de ce que peut produire un outil spécialisé entraîné sur cette tâche comme celui de Google (ou d'un autre) pour générer des articles d'information à partir de données en entrée qui elles sont vraies.

Je pense que Mathilde écrit ça en ayant en tête ce qu’est fondamentalement une IA actuelle : un "LLM", donc un modèle probabiliste, pas une capacité de compréhension véritable (au sens humain de la chose).

Sans m’étendre sur le sujet, et sans vouloir (plus ?

) prétendre ce que veux dire Mathilde, je laisse juste un article (de Développez.com) sur le sujet des (actuelles) IAs / LLMs qui remet essai de rappeler comment le tout fonctionne, pour éviter que les gens ne succombent au charme du "marketing IA"

Je pense que Mathilde écrit ça en ayant en tête ce qu’est fondamentalement une IA actuelle : un "LLM", donc un modèle probabiliste, pas une capacité de compréhension véritable (au sens humain de la chose).

Les LLM ne sont qu'une des formes d'IA générative (un modèle de diffusion n'est pas un LLM), celle-ci étant une des finalités de la discipline qu'est l'IA. Rapporter l'IA aux LLM est donc assez réducteur. (Whisper est une IA)

L'IA, c'est surtout le machine learning et le deep learning et oui, ça reste énormément basé sur des statistiques et de la probabilité puisque le but de l'IA est de produire un système capable de traiter une problématique avec peu d'entrants. Comme l'humain qui traite de la même manière un problème en émettant des hypothèses et des prédictions puis en les vérifiant.

A garder en tête néanmoins que si un LLM ne comprend pas le sens des mots, il a une compréhension sémantique et c'est ça qui lui permet de fonctionner.

Modifié le 29/02/2024 à 07h39

Historique des modifications :

Posté le 29/02/2024 à 07h37

Je pense que Mathilde écrit ça en ayant en tête ce qu’est fondamentalement une IA actuelle : un "LLM", donc un modèle probabiliste, pas une capacité de compréhension véritable (au sens humain de la chose).

Les LLM ne sont qu'une des formes d'IA générative (un modèle de diffusion n'est pas un LLM, tout comme Whisper n'est pas un LLM), celle-ci étant une des finalités de la discipline qu'est l'IA. Rapporter l'IA aux LLM est donc assez réducteur.

L'IA, c'est surtout le machine learning et le deep learning et oui, ça reste énormément basé sur des statistiques et de la probabilité puisque le but de l'IA est de produire un système capable de traiter une problématique avec peu d'entrants. Comme l'humain qui traite de la même manière un problème en émettant des hypothèses et des prédictions puis en les vérifiant.

Posté le 29/02/2024 à 07h38

Je pense que Mathilde écrit ça en ayant en tête ce qu’est fondamentalement une IA actuelle : un "LLM", donc un modèle probabiliste, pas une capacité de compréhension véritable (au sens humain de la chose).

Les LLM ne sont qu'une des formes d'IA générative (un modèle de diffusion n'est pas un LLM, tout comme Whisper n'est pas un LLM), celle-ci étant une des finalités de la discipline qu'est l'IA. Rapporter l'IA aux LLM est donc assez réducteur.

L'IA, c'est surtout le machine learning et le deep learning et oui, ça reste énormément basé sur des statistiques et de la probabilité puisque le but de l'IA est de produire un système capable de traiter une problématique avec peu d'entrants. Comme l'humain qui traite de la même manière un problème en émettant des hypothèses et des prédictions puis en les vérifiant.

A garder en tête néanmoins que si un LLM ne comprend pas le sens des mots, il a une compréhension sémantique et c'est ça qui lui permet de fonctionner.

SebGF Abonné

Le 28/02/2024 à 18h46

#5

Les hallucinations et autres restitutions mot pour mot d’articles qui ont mené à la plainte du New-York Times contre OpenAI, par exemple, posent en effet des problématiques financières autant que de sauvegarde de l’intégrité de l’information dans l’espace public.

Sur ce point OpenAI a annoncé que le New York Times aurait utilisé un bug et un prompt trompeur en fournissant des extraits au modèle pour qu'il les recrache. Ca reste un modèle statistique, et les stats, ça se biaise depuis bien avant la création de l'IA en tant que discipline de recherche.

Et vous, lectrices, lecteurs, votre avis ?

L'iA générative est un formidable outil qui, pour moi, est une révolution dans les usages de l'IT. Notamment en matière d'interaction humain-machine. Comme tout outil, il a ses forces et ses faiblesses.

Le problème est qu'il est utilisé par des abrutis opportunistes, mal utilisé, et qu'il y a beaucoup trop de bullshit, d'info anxiogène voire de mensonge par omission à son sujet, entraînant un biais quand à sa compréhension. Notamment alimenté par les entreprises productrices de ces produits, OpenAI étant vraiment horrible en matière de bullshit-o-meter. L'IA générative n'est pas un système autonome, elle ne peut pas remplacer quoique ce soit. Par contre elle est extrêmement efficace sur l'analyse, synthèse et étude de documentation. D'ailleurs j'ai souvenir d'une interview d'un doctorant dans le domaine sur France Info il y a quelques mois qui disait que l'IA était utilisée depuis plus longtemps que le buzz ChatGPT dans le journalisme, le Monde l'aurait exploitée notamment pour couvrir la présidentielle française pour aider à la synthèse et au recoupement d'information.

On est dans une ère où l'information (au sens donnée) est produite et circule à une vitesse hallucinante. Quasi pareil que le trading haute fréquence des échanges boursiers. L'humain est incapable de suivre et traiter ça sans mettre derrière une armée de mexicains qui, de toute façon, mettra trop de temps à produire un résultat. L'apport de l'outil est donc indéniable pour faciliter ce travail d'analyse.

Ce qui manque, c'est pas du pointage du moindre dérapage à monter en mayonnaise pour faire du buzz, mais plutôt une ligne équilibrée mêlant explication du fonctionnement, démystification car c'est pas magique, ses capacités, ses limitations, la réalité versus les fantasmes, les bonnes pratiques, et les mauvais usages à éviter. Comprendre le fonctionnement d'un système est essentiel pour savoir comment l'exploiter au mieux, mais aussi, déceler les mauvais usages visant à tromper. (mon offre pour vous proposer du contenu sur ce point tient toujours)

De mon expérience d'utilisateur de Stable Diffusion : l'image générée par IA, ça se reconnaît assez vite. Quand on produit un grand nombre d'image, on apprend à identifier rapidement les défauts. Au même titre qu'en tant que photographe amateur, les défauts sur mes séries de clichés me sautent à la tronche direct.

De mon expérience d'utilisateur de GPT (donc pas que ChatGPT) : un texte généré par GPT, ça peut se reconnaître facilement quand c'est fait avec des prompts basiques.

Modifié le 28/02/2024 à 18h47

Historique des modifications :

Posté le 28/02/2024 à 18h46

Les hallucinations et autres restitutions mot pour mot d’articles qui ont mené à la plainte du New-York Times contre OpenAI, par exemple, posent en effet des problématiques financières autant que de sauvegarde de l’intégrité de l’information dans l’espace public.

Sur ce point OpenAI a annoncé que le New York Times aurait utilisé un bug et un prompt trompeur en fournissant des extraits au modèle pour qu'il les recrache. Ca reste un modèle statistique, et les stats, ça se biaise depuis bien avant la création de l'IA en tant que discipline de recherche.

Et vous, lectrices, lecteurs, votre avis ?

L'iA générative est un formidable outil qui, pour moi, est une révolution dans les usages de l'IT. Notamment en matière d'interaction humain-machine. Comme tout outil, il a ses forces et ses faiblesses.

Le problème est qu'il est utilisé par des abrutis opportunistes, mal utilisé, et qu'il y a beaucoup trop de bullshit, d'info anxiogène voire de mensonge par omission à son sujet, entraînant un biais quand à sa compréhension. Notamment alimenté par les entreprises productrices de ces produits, OpenAI étant vraiment horrible en matière de bullshit-o-meter. L'IA générative n'est pas un système autonome, elle ne peut pas remplacer quoique ce soit. Par contre elle est extrêmement efficace sur l'analyse, synthèse et étude de documentation. D'ailleurs j'ai souvenir d'une interview d'un doctorant dans le domaine sur France Info il y a quelques mois qui disait que l'IA était utilisée depuis plus longtemps que le buzz ChatGPT dans le journalisme, le Monde l'aurait exploitée notamment pour couvrir la présidentielle française pour aider à la synthèse et au recoupement d'information.

On est dans une ère où l'information (au sens donnée) est produite et circule à une vitesse hallucinante. Quasi pareil que le trading haute fréquence des échanges boursiers. L'humain est incapable de suivre et traiter ça sans mettre derrière une armée de mexicains qui, de toute façon, mettra trop de temps à produire un résultat. L'apport de l'outil est donc indéniable pour faciliter ce travail d'analyse.

Ce qui manque, c'est pas du pointage du moindre dérapage à monter en mayonnaise pour faire du buzz, mais plutôt une ligne équilibrée mêlant explication du fonctionnement, démystification car c'est pas magique, ses capacités, ses limitations, la réalité versus les fantasmes, les bonnes pratiques, et les mauvais usages à éviter. Comprendre le fonctionnement d'un système est essentiel pour savoir comment l'exploiter au mieux, mais aussi, déceler les mauvais usages visant à tromper.

De mon expérience d'utilisateur de Stable Diffusion : l'image générée par IA, ça se reconnaît assez vite. Quand on produit un grand nombre d'image, on apprend à identifier rapidement les défauts. Au même titre qu'en tant que photographe amateur, les défauts sur mes séries de clichés me sautent à la tronche direct.

De mon expérience d'utilisateur de GPT (donc pas que ChatGPT) : un texte généré par GPT, ça peut se reconnaître facilement quand c'est fait avec des prompts basiques.

darkjack Abonné

Le 29/02/2024 à 07h39

#5.1

"De mon expérience d'utilisateur de GPT (donc pas que ChatGPT) : un texte généré par GPT, ça peut se reconnaître facilement quand c'est fait avec des prompts basiques."
Je doute que la majorité des personnes aient ta compétence et ton expérience et soient capables de s'en rendre compte.
Sinon, +1 pour ton analyse.

Modifié le 29/02/2024 à 07h39

Historique des modifications :

Posté le 29/02/2024 à 07h39

"De mon expérience d'utilisateur de GPT (donc pas que ChatGPT) : un texte généré par GPT, ça peut se reconnaître facilement quand c'est fait avec des prompts basiques."
Je doute que la majorité des personnes aient ta compétence et ton expérience et soient capables de s'en rendre compte.

SebGF Abonné

Le 29/02/2024 à 13h40

#5.2

darkjack

"De mon expérience d'utilisateur de GPT (donc pas que ChatGPT) : un texte généré par GPT, ça peut se reconnaître facilement quand c'est fait avec des prompts basiques."
Je doute que la majorité des personnes aient ta compétence et ton expérience et soient capables de s'en rendre compte.
Sinon, +1 pour ton analyse.

D'où le fait qu'un retour d'expérience, ça se partage :)

Comme à l'époque où FranceInfo avait proposé un article pour reconnaître les images générées par IA avec les défauts connus de l'époque. Critères qui sont un peu moins valables de nos jours en raison des améliorations que les générateurs ont depuis. Mais y'a toujours des détails qui trahissent.

SebGF Abonné

Le 29/02/2024 à 13h42

#6

Et désormais l'IA est aussi un vecteur d'attaque. Après les packages malicieux inspirés des hallucinations des modèles, les attaques par supply chain.

Catégories

Nous suivre

À propos

Google paye des éditeurs d’information pour entraîner une nouvelle plateforme d’IA générative

De la « bouillie d’IA » pour pas cher ?

De l’influence des Big Tech sur les médias et sur le débat publique

Sommaire de l'article

Introduction

De la « bouillie d’IA » pour pas cher ?

De l’influence des Big Tech sur les médias et sur le débat publique

Granite : IBM lance son pavé dans la mare des modèles de langage pour la génération de code

Stack Overflow signe avec OpenAI

La RATP expérimente sa vidéosurveillance algorithmique pour les concerts de Taylor Swift

FurMark débarque en version 2.3, avec la prise en charge des Raspberry Pi

Boeing Starliner n’a finalement toujours pas décollé…

Chang’e 6 fait route vers la Lune, avec l’instrument français DORN

Pass Monitor : Proton Pass comble (enfin) certaines lacunes

Dirty Stream : quand une application Android peut écraser les fichiers d’une autre

Raspberry Pi Compute Module 4S : jusqu’à 8 Go de mémoire, production jusqu’en 2034

Calendrier de publication d’Ubuntu 24.10 (Oracular Oriole)

Commentaires (11)

Historique des modifications :

Historique des modifications :

Historique des modifications :

Historique des modifications :