La semaine dernière, Flock vous a proposé un « mini-récit technique mixte de Flock en partie propulsé par Midjourney ». Le moins que l’on puisse dire, c’est que le résultat a fait réagir, autant la rédaction que les lecteurs. Srpf résume assez bien la situation dans les commentaires : « aussi déstabilisant que magnifique ».
Mais comment notre Flock national en est-il arrivé là ? En deux temps. Pour commencer, il y a le processeur créatif, et là ChatGPT n’a qu'à bien se tenir. Flock a d’abord scénarisé et préparé les planches de sa mini-BD. Il s’est ensuite lancé sur Midjourney pour passer ses attentes/espérances à la moulinette de l’intelligence artificielle… qui n’en a parfois fait qu’à sa tête.
Midjourney se présente comme un « laboratoire de recherche indépendant » qui veut « élargir les pouvoirs imaginatifs de l’espèce humaine ». Dans la pratique, il s’agit pour le moment d’un service en bêta (ouvert à tous) accessible via Discord. On peut actuellement demander environ 25 requêtes gratuitement.
Il suffit ensuite de demander au bot de produire une image en lui donnant des indications et, éventuellement, une image de départ. Midjourney vous renvoie quelques minutes plus tard quatre propositions groupées dans une même image (des variantes sur le même thème).
On peut aussi ajouter une image qui servira de base. Cette méthode était utilisée pour les membres de la rédac’, uniquement avec des photos trouvées sur Internet. Attention, les résultats sont dans tous les cas publics : toutes les personnes sur le même serveur Discord peuvent télécharger les images.
Ce n’est pas la première intelligence artificielle à se lancer sur ce segment, nous avons déjà eu DALL·E 2 il y a quelques mois et Stable Diffusion plus récemment. Comme nous l’avions déjà expliqué en avril, cela soulève de nombreuses questions, que ce soit au niveau du droit d’auteur ou sur les données ayant servi à entrainer les intelligences artificielles.
- DALL·E 2 génère des images à partir d’un texte : un résultat bluffant, des défis juridiques
- Getty poursuit un éditeur d’algorithme en justice pour violation des droits d’auteurs
Nous n’allons pas aborder ces sujets pour le moment, mais plutôt vous proposer une visite des coulisses ayant conduit à la mini-bande dessinée de Flock samedi dernier. Vous trouverez de nombreuses images – utilisées ou non pour le résultat final – générées via Midjourney, ainsi que les mots clés utilisés
La rédac’ comme vous ne l’avez jamais vue
Flock nous explique que « la capacité de figuration des personnes semble largement corrélée à la quantité d'images disponibles de ces personnes ». Un exemple frappant : le résultat avec Bill Gates est largement au-dessus de ceux du reste de l’équipe. Autre différence notable : « j'ai eu besoin de faire référence à une image pour Tim Cook et j'ai juste eu besoin de citer Bill Gates ». Dans toutes ses requêtes, Flock n’a fait que des demandes en anglais pour éviter toute erreur de traduction.
Voici quelques exemples qui n’ont pas forcément été retenus par Flock pour sa sélection finale, avec la phrase utilisée lors de la génération. Il y a tous les membres de la rédaction comme vous ne les avez jamais vus (et ne les verrez probablement jamais), mais aussi quelques invités surprises :
Dessine moi un mouton ce qui me passe par la tête
Flock a également demandé à Midjourney de fabriquer des images sans partir d’une personne en particulier, mais pour représenter une scène qu’il avait en tête. De manière générale, il était très rare que le résultat soit satisfaisant du premier coup. Il fallait demander d’autres variations, ajouter des précisions ou refaire la requête.
Voici là encore quelques exemples avec les mots-clés utilisés pour arriver au résultat (nous avons a priori perdu Flock sur la fin) :
Comme on peut le voir, les résultats sont tout à la fois impressionnants, flippants, complétement hors de propos (comme l’exemple du taureau dans les locaux d’une salle de presse) ou au contraire parfaitement bien ciblés. On note au passage une belle mise en abyme dans l’antépénultième dessin « best funny humor drawing of all time ».
Quoi qu’il en soit, pour arriver à obtenir un résultat convenable (voire acceptable suivant les cas), Flock a dû générer des dizaines et des dizaines d’images, et parfois revoir un peu ses attentes.
Commentaires (23)
#1
C’est “MidJourney” ou c’est “MindJourney” ?
#1.1
C’est Mid, mais il y a un bouton pour signaler une erreur, utilisable même si tu ne connais pas la réponse.
#2
Ca doit être l’effet ChatGPT. Le titre avait l’air tellement sur de lui, et moi tellement ignorant du sujet, que je n’avais aucun moyen de savoir si il s’agissait ou non d’une erreur.
Après tout, la boite aurait pu s’appeler Mindjourney, et leur produit Midjourney, avec le jeu de mot sur mid pour rappeler middle pour dire que le produit n’est pas fini.
Bref, blague à part, pour moi ce n’était pas évident qu’il s’agisse d’une erreur.
#3
Tres interessant en effet, notamment les differences selon les requetes.
#4
La vache orange est trans ?
Bonjour l’analyse des rêves du programme pour connaître l’inconscient collectif par dues catégories et autres lubies.
Ce n’est pas très flippant comme Alien, on dirait plus du Arturo di Modica à la sauce totem « qu’on sait d’où qu’il vient mal biaisé ».
#5
Pour les images des membres de la rédaction, est-ce que:
#5.1
Les photos n’étaient pas déjà référencées par Midjourney.
il est possible de rajouter ses propres photos oui, en fait j’ai pointé des photos sur le web, via un simple lien.
Les rendus obtenus sont bien issus des photos de la rédac, que j’ai pointé vie un lien.
#6
Merci pour ces coulisses Avec Flock plongé dans Midjourney, l’ambiance de la rédaction a dû changer …
#7
C’est juste génial pour générer des illustrations sur des niouz ^^
Bien plus fun que les images des banques habituelles.
#8
#8.1
Un chaman sachant sachoir doit savoir chanter sans son chant !
Flock Malevitch n’était pourtant pas surréaliste !
#9
Oooh waouu !!! J’avais proposé un article sur les coulisses et le voilà \o/
Super intéréssant et génial de voir donc la phrase et les résultats produits par l’IA ! Y’a pas à dire parfois c’est bluffant ! Parfois n’imp mais dans tous les cas ça fait “peur”
ça à du prendre bcp de temps et d’énergie, mais parfois le résultat même si il est un peu a l’ouest de la demande ça ajoute un côté hasardeux/créatif comme la tronche du bulding sur l’image qui a été gardé.
Je me demande aussi quelles sont les sources des images que l’IA à combiné pour créer de tels résultats !
En tt cas, merci beaucoup pour cet article
#10
Whaaaa. Flock aura moins de travail comme ça!🤣
#10.1
Je me demande justement. Est-ce que Flock n’aurait pas mis moins de temps sans passer par l’IA et devoir faire le tri dans ses propositions ?
Après est-ce que c’est le même métier de piloter une IA pour faire une BD et de la réaliser soi même ?
#10.2
ça dépend de quoi on parle.
Il y a par exemple une différence de temps de réalisation entre 1 image comportant 1 dessin et 1 image comportant 4 dessins par exemple pour le découpage.
Au final, j’aurais passé plus de temps sur ma rubrique pour générer cette BD, mais j’avais choisi de m’étaler pour générer plus de contenu.
à titre comparatif de 1 image / 1 dessin : je préfère le dessiner moi-même plutôt que faire de multiples tentatives à l’aveugle en espérant tomber sur ce que je souhaite, même si le résultat de l’IA simule une peinture digitale de 100h de boulot en 3 minutes chrono.
Après, j’aime dessiner, ça joue aussi
#10.3
Sans te jeter la pierre, vu que c’est compliqué, je pense que les requêtes étaient pas forcément les meilleurs.
D’abord sur le vocabulaire : Judo suit → kimono ; nuclear pipe → ? cooling tower ? chimney ? water pipe ?
Ensuite, Midjourney a besoin du maximum de precision : “investigating with a magnifying glass” → using a magnifying glass. Ou “holding a magnifying glass”. “With” est trop vague, genre ça pourrait être un compagnon de type Pixar qui l’accompagne dans son enquête. Ou Clippy.
T’as aussi des concepts qui sont compliqués à interpréter :
“Chinese factory” : comment on sait que c’est une usine chinoise ? En fait, t’aurais voulu des “sad Chinese workers”
“firing” : comment on illustre ça ? “because of” : pareil. Décrire une action spécifique aurait peut-être mieux fonctionné
“ai” : c’est compliqué, encore. Parce que ça peut vouloir dire pleins de choses, pas forcément intelligence artificielle.
Enfin, c’est pas indiqué, donc je sais pas si c’est le cas, mais il y a pleins de fonctions à utiliser dans Midjourney, genre le poids sur certains mots, les versions du moteur à utiliser, le ratio de l’image, les objectifs a utiliser, la pellicule…
Bref, faut décrire les images comme si tu parlais à un enfant de 4 ans. Et tu surtout ne pas hésiter à improviser, en ne se fixant pas sur une idée fixe, mais en utilisant ce que propose Midjourney.
#10.4
Ah mais carrément j’en ai bien conscience : il s’agit d’une improvisation totale.
J’ai vu plusieurs actus sur l’IA et je me suis dit qu’il fallait que je fasse une BD générée par une IA, qui parle d’IA dans laquelle les personnages de BD sont victime d’une IA.
J’ai eu assez peu de temps pour tout faire en partant de zéro, y compris mettre un pied maladroit dans midjourney que je ne connaissais que de nom.
J’ai aussi fait le choix d’exprimer certains concepts compliqués à interpréter volontairement. Par curiosité et voir si il y avait des choses amusantes à en tirer. Je n’ai pas voulu certaines choses mais j’ai tiré parti de l’imprévu.
J’aimerais bien explorer d’ailleurs plus en détail ces fonctions effectivement, ce sera à creuser !
Heureusement qu’elles existent mais je suis peu surpris : je me disais en essayant qu’il y avait certainement déjà une sorte de XML pour catégoriser les termes (fond, forme, action, contexte, ambiance, objets, expressions etc) ?
Tu verras Clippy demain si tu passes voir la rubrique ! :-)
#10.5
LOL (pour Clippy)
Ah mais je comprend parfaitement le process, pas de soucis. C’est aussi pour ça que je me suis permis de commenter, pour donner les tout premiers trucs à connaître :)
Pas forcément de XML, mais après chaque terme, tu peux mettre un poids pour dire ce qui est important ou pas.
Je te conseille de fouiller de fond en comble https://promptomania.com/midjourney-prompt-builder/ qui te permettra de découvrir pleins de choses en cliquant sur des boutons, qui te générerons ta prompt.
Et je te conseille aussi de connaître le principe des seeds, qui permettent de fixer certaines choses de l’image, tout en modifiant des détails.
Mais clairement, je pense qu’à terme, maîtriser tout ça sera un métier (presque) à part entière…
#11
Tout le monde fait la gueule à la rédaction ?
#12
#13
Pas de Rolex, mais j’ai déjà réussi ma vie.
#14
D’un point de vue purement personnel, les images sont très moches. On dirait les premières colorisation photoshop dans les années 90
#15
Oh sympa de faire un retour détaillé sur le processus de création de la BD de l’autre jour.
l’armée de saucisses