Ces cartes illustrées sont les dos d'un jeu de cartes original assemblant 56 mots A et I et des diagrammes d'échecs, faisant partie d'une expérimentation plus large de jeux analogiques sur l'I.A. Il explore une redéfinition alternative de l'I.A. en tant qu'unités d'un langage social avant une construction mathématique. Son but est d'examiner certains des principes de l'apprentissage automatique comme l'interprétation, la classification, la priorisation, en tant que composants de l'interaction humaine, avant son encodage. Les mains, les bouches et les caractères manuscrits sont choisis comme imagerie pour visualiser les sources et les choix humains exprimés à travers nos architectures techniques. La modularité associative et générative d'un jeu de cartes ouvre une représentation plus intemporelle de l'I.A., pour envisager différemment notre relation à la technologie.Alina Constantin / Better Images of AI / Handmade A.I / CC-BY 4.0

IA pas de fin ?

OpenAI présente GPT-4o, Claude devient disponible en Europe

Ces cartes illustrées sont les dos d'un jeu de cartes original assemblant 56 mots A et I et des diagrammes d'échecs, faisant partie d'une expérimentation plus large de jeux analogiques sur l'I.A. Il explore une redéfinition alternative de l'I.A. en tant qu'unités d'un langage social avant une construction mathématique. Son but est d'examiner certains des principes de l'apprentissage automatique comme l'interprétation, la classification, la priorisation, en tant que composants de l'interaction humaine, avant son encodage. Les mains, les bouches et les caractères manuscrits sont choisis comme imagerie pour visualiser les sources et les choix humains exprimés à travers nos architectures techniques. La modularité associative et générative d'un jeu de cartes ouvre une représentation plus intemporelle de l'I.A., pour envisager différemment notre relation à la technologie.Alina Constantin / Better Images of AI / Handmade A.I / CC-BY 4.0

Loin de s'arrêter, la course aux nouvelles versions de grands modèles de langage continue avec la présentation de GPT-4o par OpenAI, qui veut rester le leader. Pendant ce temps-là, Anthropic, l'un des challengers, annonce que son modèle Claude 3, qui rivalise avec GPT-4 est désormais disponible en Europe. Sans oublier la Google I/O de ce soir, qui fera à nouveau la part belle à l'IA.

OpenAI a annoncé lundi 13 mai sur son blog une nouvelle version de son modèle GPT-4, GPT-4o. O comme omni. OpenAI veut pousser l'accent sur le fait que son nouveau modèle peut traiter des données venant de textes écrits, de son mais aussi d'images et cela, en temps réel. Ce qui était déjà le cas des autres modèles de la famille GPT-4.

L'entreprise explique dans ce billet que cette nouvelle version est « plus rapide » tout en étant 50 % moins chère que GPT-4 Turbo, jusqu'ici le modèle le plus puissant de l'entreprise.

Siri et les autres dépassés techniquement

Pour la présentation de GPT-4o, OpenAI a publié des vidéos de démonstration où des employés de l'entreprise utilisent leur téléphone comme un compagnon numérique (à voix féminine) qui peut interagir avec eux et simuler une conversation humaine, ainsi qu'analyser en temps réel l'image prise par la caméra du téléphone.

Dans toutes ces démos, qui pour l'instant doivent être prises comme telles, la voix simule de façon très fidèle les intonations et les traits d'humour que pourrait avoir un être humain dans ce genre de conversation, allant jusqu'à rappeler le film Her.

Sur son site, OpenAI propose dès maintenant l'accès à GPT-4o via son API pour 5 dollars par million de jetons en entrée et 15 dollars par million de jetons en sortie. GPT-4 Turbo reste pour l'instant accessible avec un prix deux fois plus élevé. La version 3.5 utilisée par le premier ChatGPT est disponible à un prix 10 fois moins important que GPT-4o.

Ces démonstrations montrent qu'OpenAI a les moyens techniques de surpasser les assistants vocaux comme Siri, Alexa et autre Google Assistant.

Mais, si GPT-4o est bien multimodal et peut théoriquement prendre en entrée des sons et de la parole, OpenAI a bridé son API qui refuse donc ce type d'entrée. « Nous reconnaissons que les modalités audio du GPT-4o présentent une variété de nouveaux risques », explique l'entreprise.

« Au cours des semaines et des mois à venir, nous travaillerons sur l'infrastructure technique, la facilité d'utilisation par le biais du post-entrainement et la sécurité nécessaire pour lancer les autres modalités. Par exemple, lors du lancement, les sorties audio seront limitées à une sélection de voix prédéfinies et respecteront nos politiques de sécurité existantes », ajoute OpenAI.

Ce n'est pas la première fois que l'entreprise tourne sa communication sur des capacités impressionnantes de ses modèles tout en expliquant brider l'outil ou même ne pas le rendre public. C'était déjà le cas dès la sortie du premier ChatGPT. Et on se souvient aussi de la présentation de Sora, toujours inaccessible au grand public.

Ce bridage concerne aussi la version de GPT-4o utilisée dès maintenant par ChatGPT.

Niveau performances de chat, GPT-4o semble dépasser ses concurrents. En effet, nos confrères d'Ars Technica expliquent qu'OpenAI a testé, avant sa présentation officielle, cette version déguisée derrière le nom im-also-a-good-gpt2-chatbot dans la Chatbot Arena de Lmsys, un site qui permet aux visiteurs de comparer deux à deux les réponses des chatbots. « Il est devenu le modèle le plus fort de l'arène », a twitté Lmsys.

Claude disponible en Europe

De son côté, Anthropic, la startup créée par d'ancien d'OpenAI justement, vient d'annoncer que son assistant Claude était dès à présent disponible en Europe.

L'assistant est disponible en version Web, en application iOS et dans la batterie d'outils du « team plan » vendu aux entreprises.

Les utilisateurs européens avaient jusque-là accès à l'API permettant d'utiliser les modèles de langage de la famille Claude. Mais la startup n'avait pas ouvert l'accès à son chatbot aux utilisateurs de la zone UE, sans doute pour des raisons de compatibilité avec le RGPD.

En mars dernier, Anthropic a sorti la version 3 de sa famille de modèles de langage Claude. Celle-ci rivalise avec la famille GPT-4 d'OpenAI, même si, comme on l'a vu ci-dessus, GPT-4o semble les dépasser tous en ce qui concerne la fonction de chat.

Google en embuscade ?

L'annonce d'OpenAI intervient dans un moment opportun puisque l'entreprise a révélé son nouveau modèle la veille de la conférence Google I/O. L'entreprise, avec ses modèles Gemini, promet de concentrer ses annonces sur l'IA générative.

Commentaires (6)


Pendant ce temps.
- Dis Siri, installe-moi un nouveau fond d'écran.
- Ok, voici une nouvelle mise à jour de l'OS le plus avancé au monde.
- …
Modifié le 14/05/2024 à 12h03

Historique des modifications :

Posté le 14/05/2024 à 12h02


Pendant ce temps.
- Dis Siri, installe-moi un nouveau fond d'écran.
- Ok, voici une nouvelle mise à jour du meilleur OS du monde
- …

Ces cartes illustrées sont les dos d'un jeu de cartes original assemblant 56 mots A et I et des diagrammes d'échecs, faisant partie d'une expérimentation plus large de jeux analogiques sur l'I.A. Il explore une redéfinition alternative de l'I.A. en tant qu'unités d'un langage social avant une construction mathématique. Son but est d'examiner certains des principes de l'apprentissage automatique comme l'interprétation, la classification, la priorisation, en tant que composants de l'interaction humaine, avant son encodage. Les mains, les bouches et les caractères manuscrits sont choisis comme imagerie pour visualiser les sources et les choix humains exprimés à travers nos architectures techniques. La modularité associative et générative d'un jeu de cartes ouvre une représentation plus intemporelle de l'I.A., pour envisager différemment notre relation à la technologie.


C'est un texte généré par IA ? 😅
Pour info, Google propose actuellement un accès gratuit à Gemini 1.5 Pro, qui a une taille de contexte inégalée actuellement (1M de tokens):

https://aistudio.google.com/app/prompts/new_chat

Il est par exemple possible d'attacher un gros fichier de code source ou un gros fichier texte et de lui demander de l'analyser, de faire du re-factoring de code, d'ajouter une fonctionnalité qui va toucher à plusieurs parties du fichier etc.
Modifié le 14/05/2024 à 15h25

Historique des modifications :

Posté le 14/05/2024 à 14h59


Pour info, Google propose actuellement un accès gratuit à Gemini 1.5 Pro, qui a une taille de contexte inégalée actuellement (1M de tokens):


https://aistudio.google.com/app/prompts/new_chat

Il est par exemple possible d'attacher un gros fichier de code source ou un gros fichier texte et de lui demander de l'analyser, de faire du re-factoring de code, d'ajouter une fonction qui va toucher à plusieurs parties du fichier etc.

Posté le 14/05/2024 à 15h25


Pour info, Google propose actuellement un accès gratuit à Gemini 1.5 Pro, qui a une taille de contexte inégalée actuellement (1M de tokens):


https://aistudio.google.com/app/prompts/new_chat

Il est par exemple possible d'attacher un gros fichier de code source ou un gros fichier texte et de lui demander de l'analyser, de faire du re-factoring de code, d'ajouter une fonctionnalité qui va toucher à plusieurs parties du fichier etc.

Le TDD (test driven development) à l'ère de IA.

Etape 1: faire un gros code crados
Etape 2: Gemini, ajoute les tests unitaires

Et voilà :mrgreen:

ForceRouge

Le TDD (test driven development) à l'ère de IA.

Etape 1: faire un gros code crados
Etape 2: Gemini, ajoute les tests unitaires

Et voilà :mrgreen:
Étape 3: Google te pond un concurrent à partir du code que tu lui as envoyé.
Comme toujours, bien lire les conditions d'usage avant et la politique de conservation des données. Etant donné qu'ici il faut un compte Google, je n'ai pas pu.

Samsung a donné du code interne de ses puces à OpenAI comme ça.
Fermer