BloombergGPT, le chatbot de l’analyse financière
Le 06 avril 2023 à 05h34
2 min
Sciences et espace
Sciences
Vendredi dernier, Bloomberg a annoncé avoir créé un chatbot nommé BloombergGPT et qui, comme chatGPT, est basé sur un grand modèle de langage, explique le Nieman Lab.
Le blog de la fondation Nieman d'Harvard explique que Bloomberg n'est pas seulement une entreprise d'informations financières, mais elle vend aussi (et surtout) l'accès à un nombre important de données.
Elle a donc créé un grand modèle de langage en l'entrainant sur des données venant de Wikipédia, d'information venant du web, mais aussi venant de ses propres bases de données. L'article scientifique mis en ligne sur la plateforme de preprints arXiv précise que les chercheurs de Bloomberg ont utilisé le modèle de langage en open science BLOOM puis l'ont entraîné sur un corpus de plus de 700 milliards de mots, dont 363 milliards provenant de leurs propres données financières.
Les chercheurs de l'entreprise n'hésitent pas dans leur article à annoncer que ça serait « peut-être le plus grand jeu de données spécifique à un domaine » utilisé pour créer un grand modèle de langage.
Comme le rappelle le Nieman Lab, BloombergGPT n'est pas exempt des problèmes d'erreurs factuelles et de biais que l'on a déjà rencontré les autres chatbots basés sur la même technologie. « Je parie que BloombergGPT n'appellera pas de sitôt à la révolution du prolétariat » ironise Joshua Benton, auteur de l'article.
Bloomberg n'a pas encore communiqué sur un éventuel accès à son chatbot ni son prix. Joshua Benton pense que Bloomberg est dans une position assez unique dans l'industrie des médias en ce qui concerne l'ampleur de ses archives, mais que des petits éditeurs pourraient trouver des possibilités sur des sujets de niche sur lesquels ils ont accès à d'importantes bases de données.
Le 06 avril 2023 à 05h34
Commentaires (12)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 06/04/2023 à 06h25
Il y a de plus en plus d’idées d’application de GPT que j’entends sur radio moquette dans les différents contextes où j’interviens, et ce cas là en est un intéressant.
Après le risque c’est que leur chatbot puisse les faire accuser de manipuler des cours boursiers s’il dit des conneries
Cela dit, j’ai hâte de voir PornHubGPT. Je sais pas pourquoi, mais avec le fait que ces modèles doivent être politiquement corrects, ça promet d’être drôle.
Le 06/04/2023 à 08h17
Le 06/04/2023 à 08h24
Après les générateurs de foutaises généralistes, un générateur de foutaises financières. Ca va pas révolutionner quoi que ce soit.
Le 06/04/2023 à 09h10
Quand on sait que ces “IA” ne peuvent pas s’empêcher d’inventer quand elles ne peuvent pas trouver une réponse à la question, ça va être beau, on ne pourra même pas faire la différence avec les vrais journalistes de Bloomberg.
Le 06/04/2023 à 10h57
Ça me paraît quand même assez gros de vendre un produit entraîné sur des données avec des licences Open Source. Quelqu’un sait où en sont les législations à ce sujet ?
Le 06/04/2023 à 11h14
Qu’est-ce qui te choque précisément ?
Ton commentaire est approximatif :
on parle d’Opensource pour un logiciel, pas pour des données.
De plus la majorité des données traitées sont leur propriété.
Le 06/04/2023 à 12h56
Je n’ai pas l’impression que ça ne pose un quelconque soucis que ce soit. Même une licence aussi contagieuse que la GNU ne devrait pas poser de problème. Le code, il peuvent le modifier et le diffuser s’il veulent, ils s’en foutent, ce n’est pas ça qu’ils vendent, ce n’est pas leur valeur ajoutée.
Techniquement, tu as le droit d’utiliser n’importe quel logiciel open-source, fournir un service avec sans avoir à publier tes fichier de config, tes pass, tes bases de données,(en particulier, ta bases de données d’utilisateur)… car tout ceci, ce n’est pas du code, c’est des données.
Par exemple, tu peux faire un site avec Drupal (qui est sous licence GNU) pour y vendre tout les services que tu veux, ça ne pose aucun soucis.
Le 06/04/2023 à 11h53
Bof, on parle d’analyse financière…
Donc un mélange d’aléatoire, de corrélations spécieuses et de prophéties auto-réalisatrices.
Je ne serai pas surpris que leu bot soit aussi bon/mauvais que les humains.
Je pense qu’il parle des licences qui demandent de créditer la provenance du code.
Le 06/04/2023 à 11h57
Bientôt un INpactGPT !
Le 06/04/2023 à 12h16
Ça m’étonnerait, il parlait de législation à ce sujet. Je pense qu’il parlait bien de données, mais je ne sais pas trop desquelles (peut-être de celle de Wikipédia).
De plus, j’ai lu la licence de BLOOM et je ne vois rien d’incompatible avec l’usage qu’ils en font.
Sinon, c’est amusant que Bloomberg utilise Bloom. Je n’avais pas fait le rapprochement.
Le 06/04/2023 à 15h58
Le logiciel de WikiPedia est en open source, mais les données qu’il contient sont en CC-BY-SA, c’est pourquoi Bloomberg précise qu’il a utilisé les données de Wikipedia pour entrainer son moteur BLOOM.
Le 06/04/2023 à 16h33
BloombergGPT, tu peux m’expliquer comment fonctionne l’économie ?
Oui bien sûr :
1° On vole des slips
2° ??????????
3° Profit