Connexion
Abonnez-vous

Gemini 2 : Google incrémente précipitamment

Experimental en prod ?

Gemini 2 : Google incrémente précipitamment

Google a annoncé le lancement d’une nouvelle version de sa famille de modèles de langage Gemini. Gemini 2.0 Flash est le premier représentant, en version « expérimentale ». Il est accompagné par la présentation de deux « agents » utilisant l'IA pour accomplir des tâches multiples : Astra sur Android et Mariner sur Chrome. Mais ils ne sont pas encore utilisables par le commun des mortels.

Le 12 décembre à 12h11

En cette fin d'année, c'est l'heure des deadlines. Et Google DeepMind affiche avoir respecté la sienne en annonçant l'arrivée de Gemini 2.0. Cette sortie coïncide avec l'anniversaire de la sortie de la première version de la famille, même si Google avait prudemment donné accès à une version anticipée à quelques entreprises dès septembre 2023.

Le CEO de Google, Sundar Pichai, affirme à l'occasion de cette annonce que pendant un an, Google a « investi dans le développement de modèles plus agentiques, c'est-à-dire capables de mieux comprendre le monde qui vous entoure, d'anticiper plusieurs étapes et d'agir en votre nom, sous votre supervision ». Et il ajoute : « nous sommes ravis de lancer notre nouvelle ère de modèles conçus pour cette nouvelle ère agentique : nous présentons Gemini 2.0, notre modèle le plus performant à ce jour ».

Un seul modèle... en version expérimentale

Mais il semble que cette deadline de la fin de l'année ait un peu précipité les choses. Si l'entreprise annonce bien la sortie de son modèle Gemini 2.0 Flash, le plus petit format de modèle chez Google, le reste de la famille semble être resté coincé dans les labos de DeepMind pour l'instant. Cette version Flash est, de plus, présentée par l'entreprise comme un « modèle expérimental ».

Dans sa documentation pour les développeurs en IA, Google précise bien : « Gemini 2.0 Flash est disponible en tant que version expérimentale, et certaines fonctionnalités prises en charge ne sont pas encore disponibles [sic]. Si vous avez besoin d'un modèle pour du code en production, utilisez plutôt l'un de nos modèles 1.5 ».

Comme à chaque sortie d'un nouveau modèle, Google affiche pour Gemini 2.0 Flash experimental des benchmarks montrant une évolution globalement positive de son modèle par rapport aux anciens. Rappelons que ces études comparatives peuvent facilement être manipulées. Néanmoins, on peut remarquer que Google ne compare pas son nouveau modèle à ceux proposés par d'autres entreprises. Elle se contente de montrer l'évolution par rapport à ses propres modèles de même taille.

Le côté « expérimental » de Gemini 2.0 Flash n'empêche pourtant pas Google de l'intégrer directement dans son chatbot Gemini (si vous êtes perdu dans les noms utilisés par Google pour ses différents produits estampillés IA, ceci n'est pas seulement dû à votre fatigue). Il n'est par contre pas proposé comme modèle par défaut. Il faut le sélectionner dans la liste déroulante sur les sites web desktop et mobile. Encore un indice de la précipitation de cette annonce par Google, l'entreprise explique qu' « il sera bientôt disponible dans l'application mobile Gemini ».

Des nouvelles des futurs « agents » sur Android et Chrome

Depuis la sortie de ChatGPT, la promesse des IA génératives est de proposer à ses utilisateurs de remplacer un humain sur certaines tâches. Jusque-là, les entreprises du secteur ont essentiellement présenté des chatbots ainsi que des aides à la création de textes, d'images ou de vidéos.

Si les résultats de ces fonctionnalités peuvent impressionner par la ressemblance avec ceux produits des humains, cette offre risque de s'essouffler. Depuis quelque temps, Google, OpenAI et les autres entreprises de l'IA générative ont réagi et réutilisent le terme d'« agent » pour promettre de nouvelles fonctionnalités venant de cette technologie. C'est pourquoi Sundar Pichai insiste sur le « développement de modèles plus agentiques ».

Dans ce mouvement, Google remet en avant plusieurs projets « agents » qui doivent assister l'utilisateur dans des tâches qu'il veut effectuer sur ses différents appareils.

Le premier, le « Projet Astra », a déjà été évoqué lors de la conférence I/O de mai dernier. L'idée est d'utiliser la multimodalité de certains modèles (le fait qu'ils puissent être utilisés à la fois sur du texte, de la vidéo ou des images) pour proposer un « assistant IA universel » sur les smartphones Android.

Google explique que ce projet avance depuis cette présentation, notamment avec l'utilisation de Gemini 2.0 (sans que l'entreprise précise si elle utilise la version Flash ou une autre version pour ce projet). Astra est, selon l'entreprise, capable de s'adapter à plusieurs langues avec une meilleure « compréhension des accents et des mots peu communs ».

Le projet peut aussi prendre en main les application Google Search, Lens et Maps. Mais Astra n'est donc pas encore dans une version disponible pour l'utilisateur lambda et seuls quelques « testeurs de confiance » peuvent y avoir accès. L'entreprise ajoute qu'elle va bientôt tester Astra sur des prototypes de lunettes.

Un agent pour Chrome qui ne fonctionne que sur l'onglet actif

Google a aussi présenté un autre projet d'« agent » : Project Mariner. Celui-ci est prévu pour être une extension de Chrome, comme une version qui avait fuité nous le suggérait déjà en novembre dernier. Mariner doit pouvoir prendre le contrôle du navigateur de Google pour vous et automatiser certaines tâches.

Mais ce projet a aussi ses limites. Comme le souligne TechCrunch qui a pu assister à une démonstration, il « ne fonctionne que sur l'onglet actif du navigateur Chrome, ce qui signifie que vous ne pouvez pas utiliser votre ordinateur pour autre chose pendant que l'agent travaille en arrière-plan – vous devez regarder Gemini cliquer lentement ».

Interrogé sur le sujet par nos confrères, le directeur technique de Google DeepMind, Koray Kavukcuoglu, explique qu'il s'agit d'une décision volontaire pour que les utilisateurs sachent ce que fait l'agent d'intelligence artificielle de Google.

Commentaires (0)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous

Gemini 2 : Google incrémente précipitamment

  • Un seul modèle... en version expérimentale

  • Des nouvelles des futurs « agents » sur Android et Chrome

  • Un agent pour Chrome qui ne fonctionne que sur l'onglet actif

Fermer