Connexion
Abonnez-vous

Midjourney lance la V1 de son modèle de génération de vidéos

Le 20 juin à 16h31

Après les images fixes, place à la vidéo : Midjourney a lancé mercredi la première version d'un modèle dédié, surnommé V1. Elle le présente comme un outil à la fois puissant, abordable et simple d'accès, pour créer des séquences vidéo à partir d'une image de départ, que cette dernière soit fournie par l'utilisateur (une photo par exemple) ou générée via Midjourney.

« Faites glisser une image vers la barre d’invite et marquez-la comme « image de départ », puis saisissez une invite de mouvement pour décrire la manière dont vous souhaitez qu’elle s'anime », décrit l'éditeur. Le modèle V1 dispose également d'un mode d'animation automatique, capable donc de transformer une image en vidéo sans consigne spécifique de l'utilisateur.

En filigrane de son billet d'annonce, Midjourney revendique une approche plutôt créative et ludique, là où des concurrents tels que Veo3 (Google) ou Firefly (Adobe) essaient d'ores et déjà de se positionner comme des outils très opérationnels, destinés à être intégrés aux circuits de production graphique.

L'entreprise ne perd cependant pas de vue les considérations mercantiles : elle indique qu'une tâche vidéo sera facturée environ 8 fois la somme demandée pour une génération d'images. En sortie, comme avec les images fixes, l'utilisateur se voit livrer non pas une, mais quatre propositions pour une même vidéo. Les clips dans leur version de base sont limités à une durée de cinq secondes, mais il est possible de demander quatre fois de suite à les prolonger de quatre secondes (l'opération étant bien sûr facturée), ce qui permet donc d'obtenir des séquences allant jusqu'à 21 secondes.

Rappelons que les outils de Midjourney sont accessibles sur abonnement, avec différents paliers calculés en fonction du nombre d'heures de calcul GPU consommées par l'utilisateur. L'abonnement de départ à 10 dollars par mois permet de générer des vidéos, à hauteur de 200 minutes de calcul. Pour le lancement, Midjourney restreint au Web l'accès à son modèle vidéo V1, et choisit une nouvelle fois de passer par Discord (où l'on peut visualiser de nombreux exemples de vidéos ou d'images animées).

Si la génération automatisée de vidéos peut apparaître comme une fin en soi pour les métiers de la pub, du cinéma ou de la télévision, Midjourney affirme ne voir ce nouveau modèle que comme une étape dans sa quête d'élaboration d'un outil capable de générer des environnements 3D en temps réel.

« Nous avons besoin d'images (nos premiers modèles). Nous devons faire bouger ces images (modèles vidéo). Nous devons pouvoir nous déplacer dans l'espace (modèles 3D) et tout cela rapidement (modèles temps réel). Nous travaillerons dès l'année prochaine à construire ces éléments individuellement, les publier et petit à petit les assembler en un système unifié. Ce sera peut-être onéreux au départ, mais tout le monde pourra en profiter plus tôt que vous ne le pensez. »

Midjourney fait depuis le 10 juin dernier l'objet d'une plainte déposée par Disney et Universal pour infractions directes et indirectes au droit d'auteur.

Le 20 juin à 16h31

Commentaires (9)

votre avatar
En voyant la démo, ça a l'air bien pour générer des trucs psychédéliques, quand on ne se soucie pas trop du réalisme.
votre avatar
l'IA, toujours aussi mauvaise sur la génération de textes décoratifs en arrière-plan...
sinon, cool l'utilisation des ombres et éclats, prochaine étape le HDR? 😬
PS: avant ça, il faudrait qu'ils intègrent les mouvements de nuages lors de passages d'objets immenses...
edit: la vidéo s'arrête a 1:25 avec l'ours pour moi...
votre avatar
1er plan : le modèle ne ferme pas les deux yeux. Fail. Bon faut être vigilant pour le remarquer.

Plus il y aura d'IA génératrices de vidéo, plus le danger sera grand. Le réalisme, ils s'en foutent c'est ce qu'il mettent entre les deux oreilles qui compte.
votre avatar
Impressionnant.
Et terrifiant.

Au delà de la pub pour laquelle ça semble être une évidence (et honnêtement je m’en tape) et des utilisations pour faire de la manipulation, j’ai surtout peur que cela ne terrasse complément l’industrie du cinéma et en particulier de l’animation.

Pour la gen d’images 2D je me suis toujours dit que ça allait être une cata pour l’emploi des artistes mais l’art en lui même ne disparaissait pas parce que les artistes continueraient à avoir des âmes d’artistes.

Pour l’animation (et le cinéma en général) j’en suis moins sûr. C’est un art très cher à produire qui demande beaucoup d’investissement de la part des producteurs. Beaucoup de producteurs risquent de plonger dans la GenAI et ceux qui ne le feront pas se retrouveront avec des coûts de prod faramineux en comparaison.

Et j’ai bien peur qu’on se retrouve encore encore plus inondés de merdes abrutissantes qu’aujourd’hui.
votre avatar
Je pratique la photo en amateur et tous azimuts depuis une trentaine d'années et je teste Midjourney avec curiosité depuis une année avec l'abonnement à 10€/mois. C'est amusant et chronophage, mais c'est assez loin de la construction photographique. On produit des images certes sympa mais toujours frustrantes pour moi, par définition j'ai envie de dire, et malgré l'intérêt du mélange des imaginaires. Je suis convaincu que tout un chacun est capable de reconnaître la merde quand il la voit - par définition lol.
Je ne vois rien de beau sortir de ces outils, dans le sens d'un message poétique et sincère et développant des compétences sensibles. Je vois plutôt dans ces outils un tremplin pour les graphistes et une accélération importante et une démultiplication des codes de la communication graphique (pour les sites internet, pour la publicité...) ce qui semble plutôt positif dans nos mondes encore bien ternes et uniformes
votre avatar
Je suis entièrement d’accord avec toi.

Sauf que la beauté de la photographie, le message poétique etc, eh bien malheureusement je ne le voit pas non plus dans 90% des productions bien cheap des plateformes de streaming.

Le problème c’est qu’aujourd’hui c’est le streaming qui tient le cordon de la bourse et que le streaming se tamponne complètement de la qualité, ce qui leur importe c’est de te noyer dans la quantité.

Est-ce qu’un producteur quelconque va continuer de financer des vrais films de qualité correcte quand il peut en avoir 9 moisis et 1 qui éteint le cerveau pour le même prix ?
votre avatar
Oui je vois aussi ce déferlement cette vague de daube. Je choisis d'y rester indifférent, un peu comme une indifférence à Trump ou Altman parce que sais ce qu'il nous faut ce qu'il me faut. J'ai la chance d'avoir croisé par hasard les chemins de l'éducation populaire et son apprentissage de l'autonomie, et je ne crois pas l'IA capable de remplacer l'éducation, je crois trop fort en l'intuition de ne pas croire la machine. Tu vois un film Netflix qui t'inspire ?
votre avatar
La qualitay on en a rien à fou... du moment qu'ils payent leurs abonnements :D
votre avatar
Au moins ils ont l’honnêteté de l'avoir appelé "V1" quand on voit le nombre d'erreurs de génération sur ce qui est censé être le "top"... prometteur mais il y a encore du boulot et la concurrence avance aussi très très vite.

Midjourney lance la V1 de son modèle de génération de vidéos

Fermer