re:Invent 2023 : Amazon lance son assistant Q et plusieurs services IA, dont la génération d’images
Site de Q
Comme chaque année durant l’automne, Amazon a tenu sa conférence re:Invent, dédiée habituellement au cloud. Cette fois cependant, la saveur de l’évènement était différente. Certes Amazon s’adresse toujours aux entreprises et développeurs, mais il était beaucoup moins question de cloud et beaucoup plus d’intelligence artificielle, sans aucune surprise.
Le 01 décembre 2023 à 14h17
14 min
IA et algorithmes
IA
Le contexte est en effet clair : la concurrence est rude, particulièrement en provenance de Microsoft, qui a investi des milliards de dollars dans OpenAI (et était prête à embaucher Sam Altman et son équipe) et a montré récemment comment l’IA s’infiltrait dans les produits dédiés aux entreprises.
L’approche d’Amazon est sur ce point différente. Il s’agit avant tout d’accompagner les entreprises dans la visibilité des données importantes, l’établissement des relations et la recherche. Une forme de soutien à laquelle Microsoft est venue dans un second temps, toutes les premières annonces s’étant adressées au grand public. Mais la situation évolue très rapidement. La stratégie d’Amazon se voit particulièrement avec l’annonce de son assistant.
Les annonces ayant été particulièrement nombreuses cette année, voici un résumé de l'essentiel.
Amazon Q, l’assistant dédié aux entreprises
La pièce maitresse dans les annonces d’Amazon était bien sûr son assistant Q, qui n’a pas fini de faire parler de lui en France. Amazon a d’ailleurs expliqué que ce nom provenant de la première lettre de « Question », comme dans l’abréviation Q&A, pour questions et réponses.
Contrairement à la plupart des assistants vus jusqu’à présent, Q se distingue sur plusieurs points. D’abord, Q est basé sur plusieurs modèles. L’assistant se sert ainsi du modèle maison, Titan, ou encore de Llama 2, de chez Meta. Il puise également dans les modèles par Anthropic (comme Claude 2), société dans laquelle AWS va d’ailleurs investir 4 milliards de dollars.
Ensuite, il est réservé aux entreprises, du moins dans sa forme actuelle. Beaucoup se posent en effet la question de savoir comment Amazon va redresser la barre avec Alexa, en perte de vitesse. La section a récemment licencié du personnel et mis fin à la prise en charge d'IFTTT. Plus généralement, les assistants personnels de ce type (Siri inclus) ont pris un coup de vieux depuis ChatGPT.
C’est sans doute son plus gros facteur de différenciation actuellement, car Amazon Q a été pensé depuis le début comme une aide aux entreprises, plutôt qu’une technologie plus générale que l’on cherche à faire entrer dans la plupart des outils. C’est du moins ainsi qu’Amazon présente son produit, mais les annonces très récentes de Microsoft n’ont rien à lui envier, avec des produits précis comme les informations contextuelles pour les casques HoloLens, eux aussi réservés aux entreprises.
Amazon Q est fait pour se connecter à diverses sources de données au sein de l’entreprise, fonctionnement désormais classique que l'on retrouve un peu partout, Orange (Find) et OVHcloud avec AI App Builder récemment. L’assistant se gère depuis la console d’AWS et est disponible uniquement pour les clients Amazon Connect (pour l’instant). De là, ces derniers choisissent le modèle qui correspond le mieux à leurs besoins, avec des indications sur la façon de faire un choix adapté. Ensuite, il faut se connecter à l’API Bedrock, mettre en lien le modèle et les données choisies dans l’entreprise, puis le laisser faire son entrainement. Après quoi, Amazon Q peut être déployé dans l’entreprise, selon les critères fixés par celle-ci.
Antje Barth, l’une des responsables chez AWS, a publié un billet dans lequel elle donne un exemple d’utilisation de Q et la manière dont on le connecte à des jeux de données.
Le géant du cloud vante bien sûr son expérience, expliquant que la conception de son assistant s’est basée sur 17 ans de connaissances cumulées dans le domaine du cloud et des données. Q peut d’ailleurs servir à recommander précisément le produit AWS adapté à un besoin et répondre à des questions spécifiques sur ces services.
Des ambitions et des garde-fous
Les ambitions d’Amazon pour son assistant sont grandes, puisque Q doit notamment fournir « des informations et des conseils immédiats et pertinents aux salariés afin de rationaliser les tâches, d’accélérer la prise de décision et la résolution des problèmes, et de stimuler la créativité ainsi que l’innovation au travail ». Cependant, comme nous l’avions déjà indiqué dans les annonces de Microsoft, des progrès doivent encore être faits dans ce domaine, car la non-prévisibilité des résultats peut s’avérer problématique : on ne peut jamais être sûr de la pertinence des informations qui vont être remontées.
Comme de plus en plus souvent dans le domaine de l’IA générative, des garde-fous sont également prévus. Comme Q, ces barrières sont encore en préversions. Elles permettent aux entreprises clientes de vérifier que leurs applications et les données qu’elles utilisent correspondent aux critères mis en place la confidentialité des données. En d’autres termes, une mise en conformité.
Ces garde-fous vont continuer à être développés au cours des prochains mois. L’un d’entre eux devrait être particulièrement apprécié, puisqu’il permettra d’exclure toutes les données personnelles identifiables dans les bases, afin que les informations sensibles ne soient pas manipulées par les modèles. Ce qui éviterait, notamment, de voir ressurgir ces données dans des requêtes.
Pour l’instant, Q est disponible en aperçu seulement. Lorsque l’assistant sera prêt à entamer véritablement sa carrière, son tarif sera de 20 dollars par utilisateur et par mois. Il s’agit du forfait Amazon Q Business, que l’on peut augmenter de 5 dollars (dont à 25 dollars par utilisateur et par mois) pour intégrer l’Amazon Q Builder, une assistance dédiée pour guider les entreprises dans le développement sur AWS. Une FAQ est disponible.
Amazon se lance dans la génération d’images
Amazon, que l’on n’entendant guère dans le domaine de la génération de contenus, descend aussi dans l’arène des images avec Titan Image Generator. Selon l’entreprise, ce nouveau service permet la création « d’images réalistes de qualité studio ».
À la manière de l’assistant Q, Titan Image Generator n’est cependant pas un site ou une application disponible pour le grand public, mais un produit utilisable par les entreprises. Comme Q également, le générateur s’utilise à travers Bedrock et peut utiliser les propres jeux de données de la société cliente pour permettre des résultats plus « personnalisés ». Comme on pouvait s’y attendre, le modèle peut être utilisé avec des requêtes en langage naturel.
Pas question non plus de débarquer dans cette arène déjà chargée sans proposer de garde-fous. Selon Amazon Web Services, des mesures ont été prises contre la toxicité et les préjugés. En outre, toutes les images créées à partir de Titan Image Generator comporteront un filigrane invisible destiné à l’authentifier comme telle. Il est incrusté dans l’image et ne se limite pas aux métadonnées. La conséquence des engagements pris par les grandes entreprises du secteur auprès de la Maison Blanche cet été, suite au décret de l’administration Biden sur l’IA.
Titan Image Generator étant cependant un modèle accessible aux entreprises, c’est via une API que ces dernières pourront s’adresser pour lancer la détection d’un filigrane sur une image, pour vérifier sa provenance. Notez qu’Amazon n’est pas membre de la Coalition for Content Provenance and Authenticity (C2PA), réunissant notamment Microsoft, Intel, Adobe, Sony ou encore le groupe Publicis.
La traduction reçoit elle aussi de l’IA générative
Amazon Transcribe prend en charge une nouvelle série de langues, pour une centaine désormais. Comme on peut s’en douter cependant, la principale nouveauté est liée à l’arrivée de fonctions d’IA générative.
Selon Amazon, qui détaille ces apports dans un billet, « des millions d'heures de données audio non étiquetées provenant de plus de 100 langues » ont été utilisées pour alimenter le service. Celui-ci peut désormais transcrire les appels et dispose donc de capacités de synthèse vocale qui lui faisaient défaut jusqu’ici.
La précision du nouveau modèle utilisé est de 20 à 50 % supérieure à précédemment. Plusieurs nouvelles capacités sont de la partie, comme la ponctuation automatique, une reconnaissance automatique de la langue, un vocabulaire personnalisé ou encore des filtres pour ce dernier. Il peut également reconnaître des voix dans des enregistrements audio et vidéo, ainsi que dans des environnements bruyants.
Comme ce que l’on a déjà vu ailleurs, notamment chez Microsoft, les fonctions d’IA générative viennent renforcer Amazon Transcribe Call Analytics, pour résumer notamment les appels entre agents et clients. Le résumé est proposé en plus de la retranscription complète, qu’il ne remplace pas.
Client léger : le retour des Fire TV Cube
Selon Amazon, les clients avaient une demande récurrente : un matériel peu onéreux pour accéder aux services d’AWS. L’entreprise avait déjà ce matériel sous la main.
Le « tout nouvel » Amazon WorkSpaces Thin Client est en effet un Fire TV Cube, le même que celui vendu par Amazon sur son site de commence en ligne. Les caractéristiques techniques sont à peu près les mêmes, avec le même SoC, la même quantité de RAM, la même connectique, du Wi-Fi 6E, etc. à ceci près que les ports (HDMI, USB) sont maintenant utilisés pour se connecter à l’écran, au clavier et à la souris.
Amazon ne s’en cache pas : « Les clients nous ont dit qu'ils avaient besoin d'un appareil moins coûteux, en particulier dans les environnements à fort taux de rotation, comme les centres d'appels ou le traitement des paiements. Nous avons cherché des options et constaté que le matériel que nous utilisions pour l'Amazon Fire TV Cube fournissait toutes les ressources dont les clients avaient besoin pour accéder à leurs bureaux virtuels basés sur le cloud. Nous avons donc conçu une pile logicielle entièrement nouvelle pour cet appareil, et comme nous n'avons pas eu à concevoir et à construire un nouveau matériel, nous répercutons ces économies sur les clients ».
Comme tout client léger, l’Amazon WorkSpaces Thin Client est donc fait pour ne fonctionner qu’avec le cloud, pour des personnes travaillant en environnement dédié. Pour l’entreprise, l’appareil s’intègrera parfaitement chez les clients dont une partie des postes se connecte à des bureaux virtuels de type Amazon WorkSpaces, Amazon WorkSpaces Web ou Amazon AppStream.
Le prix de départ est de 195 dollars, mais on ne sait pas vraiment ce qui est inclus dans le prix, notamment en matière de périphériques. Le tarif passe à 280 dollars si l’on souhaite en plus un hub permettant de connecter un deuxième écran. Dans tous les cas, il faut compter 6 dollars par appareil et par mois pour « la gestion, l’entretien et la surveillance de chaque appareil ».
Les clients qui le désirent peuvent demander à Amazon de préconfigurer les clients légers pour des besoins spécifiques, pour réduire le déploiement une fois reçus. On imagine que ce service fait grimper le montant de la facture, mais le détail n’est pas précisé. Les ventes se font sur le site Amazon Business. La disponibilité est immédiate aux États-Unis et prévue pour le début d’année 2024 ailleurs, notamment en Europe.
Les autres annonces cloud
Si l’intelligence artificielle tient une place prépondérante chez les GAFAM depuis un an (à l’exception notable d’Apple pour l’instant), la conférence re:Invent est surtout un évènement centré sur le cloud initialement. De nombreuses annonces ont ainsi eu lieu dans ce domaine, souvent matinées d’IA.
C’est le cas par exemple d’Amazon Neptune Analytics, qui mêle justement Neptune et Analytics, pour faire se rejoindre les bases de données vectorielles et de type graph. Selon Amazon, le nouveau produit réunit le meilleur des deux mondes, puisque les deux approches ont le même objectif : découvrir les relations cachées entre les données. La recherche de ces relations peut se faire dans les bases Neptune existantes ou les lacs de données S3.
SageMaker HyperPod est également un nouveau service, cette fois à l’entrainement et l’ajustement des modèles linguistiques de grande taille. Il permet la création de clusters distribués avec des instances accélérées et optimisées pour l’entrainement contesté. Des outils spécifiques sont fournis pour la distribution des modèles et données.
Le stockage S3 se dote d’un nouveau venu dans sa famille de services avec Express One Zone, dédié aux hautes performances et à la latence faible. S3 Express One Zone doit apporter une amélioration significative des performances et est conçu pour les applications maniant de très vastes quantités de données. Plusieurs exemples sont donnés : l’entrainement des modèles IA, la modélisation financière ou encore le calcul hautes performances.
Citons également l’arrivée de trois nouvelles offres sans serveur pour Aurora, ElastiCache et Redshift. Comme toujours avec les offres sans serveur, Amazon se charge de fournir le matériel que les clients peuvent utiliser ensuite comme bon leur semble. Le passage à l’échelle est lui aussi de la partie en cas de besoin.
Extension du partenariat avec NVIDIA
Sans surprise, NVIDIA était présente à l’évènement. L’entreprise de Santa Clara est venue pour plusieurs annonces, dont la principale était qu’Amazon allait être la première à déployer des puces GH200 dans ses centres de données.
D’autres informations ont été données, notamment l’arrivée prochaine de DGX Cloud au sein d’AWS. DGX Cloud est pour rappel le service contenant tous les outils de NVIDIA dédiés au calcul hautes performances (HPC) et à l’IA.
Avec les annonces d’Amazon sur ses propres puces, la question se pose également : à quel point Amazon a-t-elle besoin de NVIDIA ? Au vu de la présence du CEO de cette dernière à l’évènement re:Invent, il apparait évident que les entreprises ont encore besoin l’une de l’autre.
Ce point est notamment abordé dans un article du Wall Street Journal paru hier et détaillant cette relation. Le cas est similaire à Microsoft, qui elle aussi dispose maintenant de ses propres puces, surtout pour l’entrainement des grands modèles de langage, essentiels à l’IA générative.
On peut supposer que NVIDIA garde pour l’instant la première place en performances. L’annonce d’un rapprochement supplémentaire entre les entreprises ne peut que participer encore à l’image dominante de la marque au caméléon, AWS étant la plateforme cloud la plus utilisée au monde. Cependant, Amazon a d’autres besoins. La production de ses propres puces permet, par exemple, de soulager une partie de la pression sur la table des négociations et de réduire la forte dépendance à NVIDIA, une constante dans le monde de l’IA.
re:Invent 2023 : Amazon lance son assistant Q et plusieurs services IA, dont la génération d’images
-
Amazon Q, l’assistant dédié aux entreprises
-
Des ambitions et des garde-fous
-
Amazon se lance dans la génération d’images
-
La traduction reçoit elle aussi de l’IA générative
-
Client léger : le retour des Fire TV Cube
-
Les autres annonces cloud
-
Extension du partenariat avec NVIDIA
Commentaires (14)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 01/12/2023 à 14h18
Le 01/12/2023 à 14h55
Le 04/12/2023 à 12h59
Le 04/12/2023 à 14h00
A default, le stylo explosif fera la blague
Le 01/12/2023 à 14h59
Le 01/12/2023 à 15h14
Le 01/12/2023 à 16h12
Perso je trouve que ça ressemble au comportement des géants de la tech.
Le 04/12/2023 à 13h00
Le 01/12/2023 à 15h16
Mauvais choix je pense, si on veut conquérir du monde sur un service, mais bon :)
Le 01/12/2023 à 15h30
Le 01/12/2023 à 15h52
Le 01/12/2023 à 16h13
Modifié le 01/12/2023 à 15h29
C'est exactement la même implémentation que COPILOT dans Windows 11
Par contre je testerai peut-être par curiosité pour quelques questions techniques mais hors de question de le faire travailler sur nos donnés.
Edit : Par contre ça me fais penser à une utilisation qui pourrai être excellente c'est les requêtes dans une DB depuis une demande en langage courant.
Le 04/12/2023 à 07h35