Google I/O : une édition 2023 sous la domination de l’IA, Android au second plan
Le monde prédigéré
Le 16 mai 2023 à 15h25
13 min
Logiciel
Logiciel
2023 restera comme une année différente pour Google. La conférence I/O 2023, qui s’est tenue la semaine dernière, est d’ordinaire l’occasion de plonger profondément dans les nouveautés d’Android. Rien de tout ça cette fois : l’intelligence artificielle et, dans une moindre mesure, le matériel ont pris toute la place.
Pixel Fold, Pixel Tablet et Pixel 7a
Commençons tout de suite par les nouveautés matérielles, en particulier le Pixel Fold. Il s'agit du premier téléphone pliable de Google, se présentant comme un livre dont la couverture avant et l’intérieur sont remplacés par des écrans. Sur la face avant, on trouve ainsi une dalle OLED de 5,8 pouces, pour une définition de 2 092 x 1 080. À l’intérieur, une dalle OLED de 7,6 pouces, en 2 208 x 1 840, avec une fréquence de 120 Hz.
Le cœur de l’appareil est maison : un SoC Tensor G2, le même que pour les Pixel 7, 7 Pro et 7a (nous y reviendrons). Le GPU est quant à lui un Mali-G710 MP7. La puce est épaulée par 12 Go de mémoire, tandis que le stockage est disponible en deux configurations, 256 et 512 Go.
La partie photo est composée d’un capteur principal de 48 mégapixels, d’un capteur ultra grand-angle de 10,8 mégapixels, ainsi que d’un téléobjectif lui aussi de 10,8 mégapixels et accompagnée d’un zoom optique 5x. Deux caméras frontales sont présentes : l’une de 8 mégapixels au-dessus de l’écran externe, l’autre de 9,5 mégapixels au-dessus de l’écran interne.
Parmi les autres caractéristiques techniques, citons aussi le Wi-Fi 6E, le Bluetooth 5.2, son capteur d’empreinte sous l’écran, ainsi que sa batterie de 4 821 mAh. Le Pixel Fold est un gros bébé de 159 x 140 x 12 mm, pesant 283 g.
Maintenant, le sujet qui fâche : son prix. Avec 1 799 euros au compteur, il n’est clairement pas pour toutes les bourses. Il a surtout valeur de galop d’essai pour Google, qui ne le vend d’ailleurs pas en France. Pour l’obtenir, le chemin le plus court passera par le Royaume-Uni ou l’Allemagne (il est également vendu aux États-Unis et au Japon).
Autre annonce, la Pixel Tablet, signant le grand retour de Google sur ce segment délaissé depuis plusieurs années. Mais même s’il s’agit de la première tablette Google depuis un certain temps, ses caractéristiques réservent peu de surprises.
On a donc une dalle LCD de 10,95 pouces, d’une définition de 2 560 x 1600 (276 ppp) et d’une luminosité de 500 nits. On y retrouve la puce Tensor G2, 8 Go de mémoire et 128 ou 256 Go de stockage. Tablette oblige, la partie photo est minimaliste : deux capteurs de 8 mégapixels, devant et derrière, avec enregistrement vidéo en 1080p à 30 images par seconde. Le Wi-Fi 6 est de la partie, tout comme le standard USI 2.0 pour la compatibilité avec les stylets. L’autonomie annoncée est de 12 heures en lecture vidéo.
La seule originalité de la Pixel Tablet est la possibilité de l’associer à un dock. Ce dernier tient alors la tablette en diagonale, la rechargeant par induction et intégrant une enceinte. Le tout ressemble fortement aux écrans connectés Nest Hub.
Cette fois, la Pixel Tablet est bien commercialisée en France, au tarif de précommande de 679 euros. Pour ce prix, le dock est fourni. La disponibilité est prévue pour le 20 juin.
Enfin, le Pixel 7a fait son entrée. Version plus abordable du Pixel 7, il pourrait lui jouer des tours, car ses caractéristiques techniques sont très proches : écran OLED 6,1 pouces (2 400 x 1 080) à 90 Hz, Tensor G2, 8 Go de mémoire et 128 Go de mémoire. Il est donc clairement mieux équipé que le 6a, qu’il remplace. Même chose pour la partie photo, avec un capteur principal de 64 mégapixels, un capteur ultra grand-angle de 13 mégapixels, et un capteur de 10,8 mégapixels en face avant. Il reprend même l’écran toujours allumé et la recharge sans fil.
En revanche, son prix passe de 459 à 509 euros, ce qui fera grincer les dents des personnes qui l’attendaient avec impatience. On peut se demander si ce tarif ne va pas poser un autre problème : le Pixel 7, même si un peu plus grand, est vendu 649 euros, avec une promotion de 50 euros actuellement. Il pourrait avoir du mal à poursuivre sa route, coincé entre un 7a ayant presque toutes ses caractéristiques et un 7 Pro mieux équipé (vendu 799 euros actuellement au lieu de 899).
De l’IA partout, tout le temps
La vraie star de la conférence, c’était bien sûr l’intelligence artificielle. On comprend pourquoi : avec ChatGPT, son accord avec OpenAI et le nouveau Bing, Microsoft lui a damé le pion. La conférence I/O devait donc montrer à quel point Google ne se laisse pas distancer. En tirant dans de nombreuses directions, le pari est en partie réussi.
Google a donc présenté PaLM 2, son nouveau grand modèle de langage. Si la première version ciblait les réponses pertinentes à des problématiques simples, la nouvelle se veut plus polyvalente, mais également plus spécialisée, grâce à quatre variantes : Gecko, Otter, Bison et Unicorn. Seule la première a été abordée : il s’agit d’un modèle décrit comme plus léger, à destination d’appareils comme les smartphones et devant fournir des résultats rapides, même sans connexion internet.
Durant la présentation, le PDG de Google, Sundar Pichai, a ajouté que ces modèles pouvaient aussi servir à d’autres fins. Ils ont notamment été entrainés sur des sujets « scientifiques et mathématiques ».
Autre cas de figure, prévisible : la correction du code logiciel. Les développeurs pourront donc l’utiliser, par exemple pour déboguer. Difficile de ne pas comparer cette utilisation au CoPilot de GitHub, lancé l’année dernière. Chez Google, la fonction se nomme Studio Bot et peut être testée en préversion dans Android Studio, mais uniquement aux États-Unis pour l’instant. Elle prend place dans une barre latérale et peut répondre aux questions, les réponses étant adaptées au type de code et au contexte.
Comme avec CoPilot, la discussion avec l’IA sera suivie. Les éléments de réponse tiendront donc compte également des précédentes questions, et de leur évolution. Le code donné en réponse pourra être intégré dans celui de l’application. À l’inverse, on pourra sélectionner des lignes de code depuis l’interface principale pour déclencher une question. Le code produit pourra être en Java ou Kotlin. Studio Bot est basé sur le modèle Codey, lui-même fondé sur PaLM 2.
Google se veut toutefois prudent. Studio Bot est présenté comme une expérience, sans autre statut. Il pourrait d’ailleurs renvoyer de mauvaises réponses, prévient l’entreprise. Elle ajoute que Studio Bot a besoin de ses serveurs pour fonctionner, mais que le code n’est envoyé que s’il fait lui-même partie de la question. Aucune date n’a été fournie pour une extension à d’autres marchés, et encore moins pour l’arrivée de phases de tests plus stabilisées.
Point intéressant, Apple est désormais le seul des trois grands éditeurs à ne pas avoir encore présenté de solution équivalente. La WWDC en début de mois prochain corrigera peut-être le tir.
Recherche, traduction universelle, radiographie…
Le meilleur moyen pour montrer l’efficacité de PaLM 2 est encore pour Google d’en présenter des utilisations concrètes. En tout, 25 produits en approche s’en servent, dans la plupart des cas des évolutions majeures pour des services déjà existants, sans que l’on en possède la liste exacte.
L’une des démonstrations les plus représentatives est sans doute celle du traducteur universel en préparation. L’idée est la suivante : proposer un doublage dans une autre langue dans une autre vidéo. La chaine d’opérations commence à la transcription du contenu d’origine, pour obtenir la version texte. Celle-ci sera lue par une voix, recréée à partir de la personne s’exprimant initialement. Le processus va même, dans la mesure du possible, s’atteler à une synchronisation labiale, afin que le doublage paraisse plausible.
Le potentiel de cette technologie est immense, comme on peut le voir à partir de 1h15 de la conférence. Google choisit comme exemple un cours, qui pourrait être disponible très rapidement en plusieurs langues. Cependant, et là encore, la prudence est de mise. L’entreprise se dit consciente des dangers inhérents à une telle technologie, à commencer par les deepfakes. Elle ne sera donc proposée qu’à des partenaires certifiés et intégrera certaines barrières ainsi que des filigranes pour éviter les abus.
On attend bien sûr Google sur la recherche, son service fétiche, celui par lequel tout a commencé. L’entreprise a enfin confirmé que des fonctions liées à l’IA étaient en approche, cette fois encore sur la base de PaLM 2. Il sera donc possible de rédiger des requêtes complexes, les résultats étant alors surmontés d’un cadre vert avec la réponse de l’IA. De là, l’internaute pourra rebondir et poser d’autres questions, avec ici aussi un suivi des échanges et la prise en compte des éléments passés.
Comme pour Studio Bot, il est possible de tester ces fonctions, nommées « Search Generative Experience ». Cependant, elles ne sont disponibles qu’en anglais, réservées aux États-Unis et il faut s’inscrire sur liste d’attente. Pour en revenir sur la comparaison avec Microsoft, et en dépit des ratés du nouveau Bing par exemple, on est donc bien sur un vrai retard.
Le modèle PaLM 2 servira de socle à d’autres modèles spécialisés. Par exemple, Sec-PaLM sera dévolu à la sécurité. Il est entrainé pour détecter les comportements inhabituels, les scripts malveillants et autres menaces. Même chose pour Med-PaLM 2 qui, lui, est spécialisé dans les connaissances médicales, plus particulièrement l’interprétation des radiographies. Sundar Pichai va même jusqu’à dire que ses performances « s’approchent de celles des experts cliniciens ».
Quant au modèle PaLM 2 lui-même, il est proposé en préversion, via l’API PaLM, Firebase et Colab. On ne sait pas en revanche comment le modèle a été entrainé. Parmi les rares informations techniques fournies par Google, on a simplement appris que l’entrainement avait été réalisé sur les infrastructures JAX et TPUv4.
Bard, Maps, Magic Editor, Docs et les autres
La quasi-intégralité des annonces avaient trait à l’IA, d’une manière ou d’une autre, et le reste des présentations l’a prouvé. Exception notable : Google Maps, dont la grosse nouveauté annoncée est une nouvelle 3D « immersive ». Il sera alors possible de visualiser l’intégralité d’un trajet en 3D, et non plus quelques bâtiments comme c’est le cas actuellement. Une démonstration assez impressionnante, pour une fonction qui sera lancée cet été pour une quinzaine de villes, dont Paris, New York, San Francisco et Tokyo.
On retourne vite à l’IA avec Magic Editor, une nouvelle fonction pour Photos. Elle vient compléter Magic Eraser, qui se proposait de repérer les éléments pour mieux les supprimer. Cette fois, il s’agira de les modifier : teinte, déplacement, changement de taille, modification de la météo, etc. Il sera même possible d’ajouter d’autres éléments. Magic Editor doit arriver « plus tard dans l’année », mais on ne sait pas exactement pour qui. Il pourrait être réservé aux seules personnes équipées d’un Pixel, ou même uniquement à celles abonnées à Google One.
Puisque l’on parle d’IA générative, Google ne pouvait pas faire l’impasse sur ses services bureautiques. Docs va se doter par exemple d’une fonction « Aidez-moi à écrire », qui va permettre – on s’en doute – de générer du texte à partir d’instructions. Dans son exemple, Google a utilisé le cas d’une offre d’emploi.
Dans Sheets, un bouton « Aidez-moi à organiser » aura pour mission de générer rapidement un tableau en fonction de caractéristiques fournies par l’utilisateur. Même chose pour Slides et sa fonction « Aidez-moi à visualiser », qui se proposera de générer des diapositives en fonction d’instructions, du contexte et de données. Toutes ces fonctions sont réunies sous l’appellation « Duet AI » et seront testables à partir du mois prochain, mais seulement pour un petit nombre de personnes. La version finale est attendue d’ici la fin de l’année, sans plus de précision.
Enfin, parlons de Bard. Le concurrent direct de ChatGPT est maintenant basé lui aussi sur PaLM 2. Il est également disponible dans 180 marchés, sans liste d’attente. Cependant, aucun pays membre de l’Union européenne n’est pour l’instant concerné. Les raisons n’ont pas été données, mais il est probable que le RGPD fasse partie du lot. Aux côtés de l’anglais, on trouve maintenant le coréen et le japonais. 40 autres langues sont en préparation.
Les capacités de Bard ont aussi été renforcées. Il peut par exemple puiser dans les modèles d’Adobe Firefly pour la création d’images IA. Les utilisateurs peuvent désormais ajouter des images au texte des requêtes, prises en charge grâce à Google Lens. Google a également noué des partenariats avec des entreprises comme Kayak, OpenTable et Wolfram pour en lier les produits à Bard.
Et Android ?
Le futur Android 14 n’a eu que peu de temps pour lui. Il a surtout été question d’esthétique, surtout de génération de fonds d’écran, à partir d’émojis ou de photos, en ajoutant par exemple à ces dernières un effet de parallaxe, pour donner l’illusion d’un déplacement quand on penche le téléphone.
Et c’est à peu près tout. Google a indiqué préférer la démonstration des capacités d’Android 14 à travers des fonctions concrètes, mais force est d’avouer qu’il n’y avait pas grand-chose à se mettre sous la dent. Et pour cause, de nombreuses nouveautés seront diffusées dans les services et composants attenants à Android, dont les Play Services.
Comme le rappelle notamment The Verge, on peut y voir un signe supplémentaire de maturité du marché des smartphones, les évolutions de ces dernières années étant pour le moins calmes. Nos confrères pointent les investissements plus importants dans les écouteurs, montres et tablettes, ce qui cadre d’ailleurs avec le retour de Google dans ce dernier segment. La nouveauté est désormais dans l’intelligence artificielle, au moins pour l’instant.
Google I/O : une édition 2023 sous la domination de l’IA, Android au second plan
-
Pixel Fold, Pixel Tablet et Pixel 7a
-
De l’IA partout, tout le temps
-
Recherche, traduction universelle, radiographie…
-
Bard, Maps, Magic Editor, Docs et les autres
-
Et Android ?
Commentaires (3)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 16/05/2023 à 20h01
Une année de plus sans aucune innovation.
Quand un concurrent sort un truc intéressant, Pichai court derrière, comme d’habitude, sans aucune idée de pourquoi il le fait ni d’objectif ou de vision de long terme. Ils ont de très bon chercheurs en IA mais n’ont aucune idée de quoi faire avec, donc il copie Microsoft.
Des modèles qui font des trucs, ils en annoncent depuis longtemps. Ça reste des annonces sans lendemain et des démos qui ne mènent à aucun produit ou service.
À titre personnel j’ai arrêté de m’intéresser à Google depuis un bout de temps. Au final, ils se voient eux même comme étant juste une boite de pub, et c’est ce qu’ils deviendront.
Le 17/05/2023 à 17h26
Innovation en berne (là où à une époque Google l’était) et stratégie produit à géométrie variable qui donne pas envie d’investir dans leurs solutions pour moi.
Edit : remarque, en ce moment Microsoft fait des caisses sur OpenAI mais on entend assez peu parler d’AWS pour le coup (faut dire que je m’intéresse peu à eux aussi).
Le 17/05/2023 à 09h21
Mountain View, Start Your Photocopiers.
(pour ceux qui ont la ref)