Pour améliorer les performances de son moteur de recherche Bing (et placer de nouveaux pions dans la lutte contre la suprématie de Google), Microsoft songe à l’intelligence artificielle. D’après deux sources du média américain the Information, l’entreprise travaille en effet à une version de Bing intégrant ChatGPT, le robot conversationnel créé par OpenAI.
Par le passé, Microsoft a déjà utilisé son lien avec OpenAI (dans lequel elle a investi un milliard de dollars) pour développer une application Low-Code/No-Code avec GPT-3. Affaire à suivre, car les générateurs de texte et d’image comme DALL-E 2 et ChatGPT ne sont pas sans soulever leur lot de problématiques (biais, questions juridiques, désinformation, etc).
Commentaires (37)
#1
Bon allez je m’y colle…
Bonjour Chat GPT, comment faire pour que Bing soit plus populaire ?
Merci Chat GPT
#2
J’avais vu sur Mastodon quelques tests qui montraient un des gros biais de ChatGPT : il ne sait pas dire “je ne sais pas”. Peu importe le sujet ou la question, il doit donner une réponse, aussi erronée fût-elle.
En ce moment on aime bien le présenter comme outil magique qui sait tout faire (effet wahou toussa), mais clairement, aussi impressionnant soit-il, il ne faut pas en faire un Génie de la Lampe et il est important de conserver un regard critique sur ses résultats.
#2.1
demande lui l’heure, il te diras qu’il ne peut pas te répondre
#2.2
Mouarf !
#3
Pour toute demande de création, ChatGPT répond “Je suis désolé, mais en tant que grand modèle de langage je ne suis pas en mesure de créer du contenu original”
#3.1
Il est pourtant très créatif: demande lui de t’écrire un poème sur le sens de la vie par exemple :)
#4
Existe-t-il un moyen d’utiliser ChatGPT sans fournir son numéro de téléphone ?
#5
Bien sur que non. Ca serait s’asseoir sur une manne providentielle de numéros de téléphone activement utilisés par des vrais êtres humain… Mais soyez rassuré, vos informations personnelles ne seront pas partagées avec des tierces parties.
Lol, non je déconne. Bien sur qu’elles seront partagées:
https://openai.com/privacy
#5.1
Moi, c’est une adresse mail ou un compte Google ou Microsoft qui m’est demandé (sur PC).
Openai ne respecte pas le RGPD et l’ignore complètement alors qu’il a un paragraphe concernant la Californie.
Je leur ai donc demandé de se mettre en conformité sur ce point et je porterai plainte auprès de la CNIL s’ils ne m’envoient pas de réponse sous un mois.
Je suis surpris que NXI n’ai pas tiqué à ce sujet alors qu’ils nous en parlent depuis décembre dernier.
#5.2
#6
Ce n’est pas une création originale mais l’agrégation de contenus existants, dans le champ lexical/contextuel de la poésie.
Tu peux prendre chaque ligne du poème et tu trouveras sur google la source d’inspiration.
Ici je pense que tu vas trouver que c’est des citations/textes de poètes et auteurs connus.
#7
“Et pourtant, tous sommes en quête de raison.” (recherche stricte avec les “”) c’est 0 résultat sur Google.
Et au passage, agréger des contenus existants dans un champ contextuel donné, c’est 99,99% de l’intelligence humaine. La création pure c’est extrêmement rare, et on qualifie souvent les humains qui y arrivent de génies (Da Vinci, Mozart, Einstein…). Et encore, même eux ne pondent pas une création pure tous les quatre matins.
#8
Ils feront surement un fork non ? Car à ce qu’il parais actuellement chaque requète coute une “ fortune “.
#9
Non je ne crois pas qu’on puisse parler d’agrégation (ou alors on ne s’entend simplement pas sur le sens à donner à ce terme). ChatGPT a inféré le formalisme de la poésie (rime, formatage, thématiques, vocabulaire “soutenu”…) et le style de certains poètes. Mais lors de la restitution il ne colle pas des bouts d’oeuvre (du moins je ne pense pas).
Il faudrait lui demander de générer un poème sur un sujet improbable : une ode au curling dans le style
de Sandrine Rousseau (ah ben non elle était pas connue en 2021)de Hugo (je ne crois pas qu’il ait beaucoup écrit sur le curling)#9.1
#9.2
Il y a un certain lyrisme. De là à dire que c’est du Hugo.
Je ne suis pas un spécialiste de l’auteur mais je ne vois pas de copier/coller de Waterloo ou de A l’heure…
J’ai cherché le “cueillir la gloire” qui est assez frappant, on le retrouve chez d’autres poètes mais pas chez Hugo semble-t-il. En revanche Hugo sème la gloire dans les contemplations.
#10
Diificile de trouver des infos fiables. J’avais lu 0.5 cent par requête. Là je trouve
each word generated on ChatGPT costs $0.0003.
Cher ? Pas cher ?
#11
Cher ? Pas cher ?
Après pour avoir un peu essayé chat GPT c’est absolument formidable, pas besoin de lancer une recherche avec des mot clefs précis puis d’ouvrir plusieurs sites et y navigué pour espérer trouver un sans blanc de réponse.
A terme c’est des millions de sites qui pourraient fermer.
#12
tu fréquentes trop les meetings décolonialistes.
#13
Ça compte les recherches effectuées depuis DDG (qui utilise, au moins en partie, le moteur de Bing) ?
#14
Aucune idée !
#15
Ce n’est pas encore tout à fait cela concernant les rimes et le nombre de pieds. Mais c’est effectivement assez bluffant.
#15.1
Les rimes sont faites sur le corpus anglais puis sont traduites en français. Un essai en anglais donne de meilleurs résultats au moins sur la rime :)
Oh curling, sport of grace and skill,
A game that’s played with icy chill,
On fields of polished white and gleaming,
Where players glide and stones come streaming.
With brooms held tight, they sweep and shout,
Their eyes fixed on the curling route,
And as the stones slide into place,
The tension rises in the space.
But curling’s more than just a game,
It’s a battle of the mind, not just of aim,
For strategists must plan each throw,
To outmaneuver foes and make their goals.
So let us praise this noble art,
That tests both strength and smarts,
For curling is a game that’s truly grand,
A source of joy that brings folks hand in hand.
#16
Ce n’est pas comme cela que fonctionne ChatGPT (ni les “language models” profonds en général).
De la même manière, les images générées par DALL·E ou Stable Diffusion ne sont pas un patchwork d’images existantes.
Ces outils sont là pour rester, et honnêtement peuvent déjà apporter un vrai boost de productivité dans de nombreux domaines y compris la programmation.
Les gens devraient passer du temps pour jouer avec et se faire une vraie idée des capacités (impressionnantes) et des limites (réelles) de ces outils.
#16.1
Pöur Dall-e , peut être que l’image n’est pas volée directement pour en faire une référence ; mais le style de l’artiste clairement, et donc là ça va poser plein de questions sur le droit d’auteurs/artiste , ce qui est déjà en cours dans des pays anglosaxon .
#17
J’ai découvert une limite incongrue à ChatGPT (enfin je n’en ai pas vu passer de mention).
Quand on lui demande des citations de films, il invente totalement, parfois n’importe quoi. Ou alors il a accès aux films dans une dimensions parallèle
En musique il est marrant aussi. J’ai failli me faire avoir dans sa première réponse concernant l’harmonisation d’un certain style de musique. En fait il donne toujours la même suite d’accords, en ajoutant parfois un ‘mineur’ pour changer un peu.
#18
Intéressant ! Tu peux nous montrer tes exemples ?
#18.1
Bien-sûr !
Le résultat est très surprenant.
ou
Ou encore
#19
Oui, alors, un type censé avoir vécu au temps de Louis VI, s’il a été aussi « héros de la Guerre de Cent Ans et membre du Conseil des Cinq Cents », il a vécu mille ans, au moins !
On lui dit que quelques 350 ans séparent ces deux trucs ? ^^
#20
Pour un gars né au 11ème siècle et ayant voyagé dans le temps en 1992 puis en 1793 et en 1943, ça ne me choque pas.
#21
Je viens de créer un compte sur Microsoft pour tester, et après m’être authentifié avec sur ChatGPT, il me demande quand même un numéro de téléphone - mais c’est peut-être parce qu’il n’y en a pas sur mon compte Microsoft.
#22
Je me suis arrêté à la première demande de données personnelles en l’absence de respect du RGPD.
#23
Il a déjà été déterminé bien avant ces IA que le style n’est pas protégé par la propriété intellectuelle, contrairement à l’oeuvre elle même.
https://www.thelegalartist.com/blog/you-cant-copyright-style
Cela pose tout de même d’autres questions liées à la propriété intellectuelle, et pourrait amener à faire évoluer le droit.
#24
Ils n’ont vraiment peur de rien ! On me dit dans l’oreillette que Qwant se base dessus depuis quelques années…
#25
quand je dis “agrégation” c’est pas faire du copier/coller de fragments
OpenAI dit avoir entrainé son modèle sur 45 TB de texte, dont les articles de wikipedia. Le modèle analyse les liens entre les mots (un lien = 175 milliards de paramètres sur GPT-3). Si les phrases originales sont effectivement supprimées à la fin de l’apprentissage, les (meilleures) connexions persistent dans le modèle
Le texte que chatGPT génère est la meilleure réponse possible suivant le modèle. Cette réponse va avec une (très) forte probabilité regénérer les phrases originales.
Le texte de ChatGPT est généré en suivant le modèle, donc la phrase n’est pas regénérée à l’identique de la base d’apprentissage. De plus, comme dit ci-avant, le modèle de base est anglophone. Et il y a eu une phase de RLHF (reinforcement learning with human feedback) sur le modèle afin que la conversation soit la plus naturelle possible.
#26
Dans un modèle profond comme ChatGPT, la completion à lieu à une couche logique supérieure à la première couche représentant les mots (ou les pixels pour DALL·E). Le processus d’apprentissage est conçu de manière à optimiser la capacité du modèle à apprendre des concepts de plus haut niveau que les simples probabilités entre les mots - d’abord les règles de grammaire, de dialectique, mais aussi au niveau des couches supérieures certains concepts du monde réel sans qu’il soit nécéssaire de les expliciter lors de l’apprentissage.
Il me semble plutôt facile de montrer que le modèle ne fait pas qu’agréger des données sur la base de statistiques entre les mots et a bien appris une forme de compréhension (souvent imparfaite et parcellaire) du language et du monde. https://upload.wikimedia.org/wikipedia/commons/8/8f/ChatGPT_Wales_Tiananmen_Square_2022-12-30_181035.png.
#27