OpenAI lance sa troisième version de DALL·E, qui exploite désormais ChatGPT

OpenAI lance sa troisième version de DALL·E, qui exploite désormais ChatGPT

OpenAI lance sa troisième version de DALL·E, qui exploite désormais ChatGPT

Cette intelligence artificielle délivre pour rappel une image suite à une demande (prompt) d’un utilisateur. La première version est sortie en janvier 2021, la seconde en avril 2022 et voici donc DALL·E 3, en préversion fermée pour commencer, avant de s’ouvrir progressivement à partir d’octobre.

« DALL·E 3 représente un bond en avant dans notre capacité à générer des images qui adhèrent exactement au texte que vous fournissez […] Avec la même demande, DALL·E 3 apporte des améliorations significatives par rapport à DALL·E 2 », affirme la société .

La grosse nouveauté est l’intégration de ChatGPT, permettant ainsi d’utiliser l’IA générative « comme partenaire de brainstorming et pour affiner vos demandes ». « Demandez simplement à ChatGPT ce que vous voulez voir à partir d’une simple phrase jusqu’à un paragraphe détaillé ». 

Commentaires (10)


Depuis qu’il a annoncé à son ChatGPT, Microsoft salve, à tort, DALL-E



:merci:


:bravo:


Le prompt est aujourd’hui la chose la plus chiante pour la génération d’image. Même s’il est en langage naturel et que le modèle comprend aussi bien une requête du type “a portrait of a woman working in an office, high resolution, open space, working on computer” que “she is an office worker using her computer in an open space”, il reste très mécanique et donne plus l’impression de taper une série de mots clés qu’une réelle description naturelle.



Bien que SDXL ait pas mal évolué sur ce point (notamment avec les quatre champs pour mieux définir le poids de chaque élément), ça reste assez complexe car il faut prendre en considération l’ordre dans lequel le modèle va process le prompt, les poids à donner, ajuster les LoRA, etc.



La liaison avec GPT est clairement un bond en avant.


J’espère que ça finira dispo en local, comme stable-diffusion.


C’est pas trop leur genre chez OpenAI. C’est plutôt accessible sous forme d’instances managées comme celles chez Azure.


Un article intéressant sur un sujet connexe : la proposition de loi visant à couvrir par le droit d’auteur les produits générés par les IA.


Merci pour ce lien. C’est édifiant !


:eeek:



Mais au fond je sentais que ça allait finir par arriver.



Et le risque est que ça rende encore plus opaques les entraînements, très mauvais signal alors que l’absence de transparence est l’un des gros problèmes de l’IA générative…



SebGF a dit:


C’est pas trop leur genre chez OpenAI. C’est plutôt accessible sous forme d’instances managées comme celles chez Azure.




Pour moi ça pose toujours des problèmes de confidentialité la production en ligne. Et les tarifs sont souvent un peu dissuasifs pour apprendre et tâtonner (et donc réessayer beaucoup de fois pour un seul résultat potable).



Liam a dit:


Pour moi ça pose toujours des problèmes de confidentialité la production en ligne. Et les tarifs sont souvent un peu dissuasifs pour apprendre et tâtonner (et donc réessayer beaucoup de fois pour un seul résultat potable).




Oui, absolument.



OpenAI ne m’inspire pas confiance dans ses offres Enterprise censées être plus privées et encadrées car historiquement ils ont eu des problèmes de cloisonnement et fuites à répétition. Et la sécurisation de ChatGPT ne fait pas de lui une vitrine sur ce sujet.



Microsoft propose la même chose via son partenariat avec eux mais comme toute offre Cloud, l’engagement de confidentialité n’est que contractuel. Il est difficile pour le client de la vérifier. Dans l’offre de MS ce sont des instances privées du modèle où celui-ci est mis à dispo du client de manière isolée pour qu’il puisse l’entraîner avec ses données. Mais là aussi c’est tout sur base d’un contrat, à aucun moment cela n’est vraiment vérifiable.



(et dans tous les cas, que ce soit OpenAI ou Microsoft, tout est chez Azure)



Travaillant moi-même sur un sujet d’intégration d’outil basé IA générative pour une paire de clients, autant dire que les 34 des questions ne sont pas techniques mais juridiques. J’ai jamais autant bossé avec les DPO et le juridique pour le coup :transpi:
Au même titre que les interlocuteurs de MS en face ne sont pas les usuels archi solutions ou sales, mais le juridique aussi.



(questions du type : s’assurer que les données personnelles ne finissent pas dans le modèle, durée de rétention, garanties sur la réutilisation, etc)



Sujet super intéressant pour le coup qui montre combien l’IT et le juridique sont étroitement liés.


Fermer