Google annonce la sortie de Gemini 1.5

SebGF Abonné

Le 19/02/2024 à 08h25

#1

1.5 Pro est le premier modèle de la génération à être disponible. Il est utilisable avec une fenêtre contextuelle standard de 128 000 jetons (la génération 1.0 en avait une de 32 000).

Au même niveau que GPT-4 Turbo chez OpenAI/Microsoft en gros.

Pendant ce temps là, j'ai testé ce week-end (vu que j'y ai eu l'accès) le Mixtral proposé par Infomaniak et c'est pas dégueux. Je pense que ce doit être Mixtral-8x7B derrière - qui semble d'ailleurs avoir le même type d'architecture que Gemini - j'ai demandé au support s'ils pouvaient me le confirmer (avec au passage les limites d'usage, c'était pas spécialement indiqué). Les temps de réponse sont encore assez longs, mais après une bonne série d'étapes de tests j'ai pu avoir un system prompt qui retournait ce que j'attendais, le tout emballé dans un front web bricolé maison (avec estimation du coût de la requête). L'offre propose 1 millions de tokens en démarrage avant de facturer, valables jusque fin mars me concernant. Avec tous mes essais du wenk-end (dont des prompts à 12k), je suis à 850k restants, autant dire que j'ai encore de la marge. En limitations j'ai parfois noté qu'il avait tendance à rebasculer en anglais malgré un prompt (voire system prompt) en français.

Mais plus j'ai avancé, plus j'ai de moins en moins envie de renew l'abo ChatGPT Plus. J'ai fait quelques comparaisons entre GPT-4 et Mixtral proposé via kChat, notamment pour l'assistance à la génération de code, et c'était relativement proche. L'API permet de générer pas mal de params pour tuner le comportement du modèle. J'ai pas fait le calcul de combien la limite de 20€/mois de dépense que j'ai fixé (minimum syndical autorisé) me reviendrait, mais je pense que ça sera rentable.

Les acteurs européens ont besoin de plus de visibilité !

ogodei Abonné

Le 19/02/2024 à 09h41

#1.1

J'ai testé le même modèle en local et je confirme le ressenti :
- tendance à rebasculer en anglais sans raison particulière
- bluffé par les performances !

SebGF Abonné

Le 19/02/2024 à 11h45

#1.2

ogodei

J'ai testé le même modèle en local et je confirme le ressenti :
- tendance à rebasculer en anglais sans raison particulière
- bluffé par les performances !

Yep les perfs sont vraiment bonnes. De mon côté c'est surtout de la latence avec Infomaniak qui doit avoir une capacité limitée (ils doivent ajouter du GPU pour permettre de l'entraînement prochainement), mais je n'ai eu que 3 ou 4 gateway timeout sur une quarantaine d'essais.

Après mes premiers tests ont été bourrins, j'ai voulu expérimenter mon use-case sur des prompts à 10k tokens

guildem Abonné

Le 19/02/2024 à 13h46

#1.4

ogodei

J'ai testé le même modèle en local et je confirme le ressenti :
- tendance à rebasculer en anglais sans raison particulière
- bluffé par les performances !

C'est obligatoire d'avoir du GPU nvidia sur Linux, ou un macos M1-M2-M3 pour le faire tourner correctement en local ? Ou il tourne bien en mode CPU aussi ?

ogodei Abonné

Le 19/02/2024 à 14h08

#1.5

guildem

C'est obligatoire d'avoir du GPU nvidia sur Linux, ou un macos M1-M2-M3 pour le faire tourner correctement en local ? Ou il tourne bien en mode CPU aussi ?

Moi c'était sur GPU Nvidia, je n'ai pas testé sur CPU uniquement mais je ne pense pas que ça passe. Il est tout de même gourmand.

guildem Abonné

Le 19/02/2024 à 17h23

#1.7

ogodei

Moi c'était sur GPU Nvidia, je n'ai pas testé sur CPU uniquement mais je ne pense pas que ça passe. Il est tout de même gourmand.

Arf merci tant pis pour moi !

SebGF Abonné

Le 19/02/2024 à 14h22

#1.6

guildem

C'est obligatoire d'avoir du GPU nvidia sur Linux, ou un macos M1-M2-M3 pour le faire tourner correctement en local ? Ou il tourne bien en mode CPU aussi ?

J'ai cru voir passer des articles de personnes ayant fait tourner le modèle sur du M1 Apple avec 16GB de RAM. Mais je pense qu'il s'agissait de Mistral et non de Mixtral.

Mais apparemment les perfs en CPU-only sont dégueulasses.

guildem Abonné

Le 19/02/2024 à 17h24

#1.8

SebGF

J'ai cru voir passer des articles de personnes ayant fait tourner le modèle sur du M1 Apple avec 16GB de RAM. Mais je pense qu'il s'agissait de Mistral et non de Mixtral.

Mais apparemment les perfs en CPU-only sont dégueulasses.

Je regarderai si je peux faire tourner Mixtral sur mon M2 alors, je vais devoir retourner sur Nvidia sinon (et je pense pas que ma 1080 suffira)

SebGF Abonné

Le 19/02/2024 à 17h50

#1.9

guildem

Je regarderai si je peux faire tourner Mixtral sur mon M2 alors, je vais devoir retourner sur Nvidia sinon (et je pense pas que ma 1080 suffira)

Non ça je confirme, LLaMA sur ma 1080 c'était déjà très difficile. Ces modèles demandent plus de ressources que du Stable Diffusion pour la génération d'image.

SebGF Abonné

Le 19/02/2024 à 13h22

#1.3

Je pense que ce doit être Mixtral-8x7B derrière

Réponse reçue du support, c'est bien le modèle utilisé par Infomaniak.

dylem29 Abonné

Le 19/02/2024 à 09h13

#2

J'ai hâte de pouvoir utiliser le NPU de ma 4080 avec ce genre de modèle.

127.0.0.1

Le 19/02/2024 à 10h19

#3

Je trouve intéressant le marketing qu'on commence a mettre en place pour comparer/valoriser les IA.

On a commencé par des nombres de paramètres, de neurones/synapses, ....
Maintenant on met des numéros de version avec décimal, des suffixes pro/ultra/entreprise, ...
Bientôt des benchmark standardise avec des scores...

Hugues1337

Le 28/02/2024 à 20h28

#4

Le bot est totalement vérolé par les woke. A jeter.

Catégories

Nous suivre

À propos

Google annonce la sortie de Gemini 1.5

Granite : IBM lance son pavé dans la mare des modèles de langage pour la génération de code

Stack Overflow signe avec OpenAI

La RATP expérimente sa vidéosurveillance algorithmique pour les concerts de Taylor Swift

FurMark débarque en version 2.3, avec la prise en charge des Raspberry Pi

Boeing Starliner n’a finalement toujours pas décollé…

Chang’e 6 fait route vers la Lune, avec l’instrument français DORN

Pass Monitor : Proton Pass comble (enfin) certaines lacunes

Dirty Stream : quand une application Android peut écraser les fichiers d’une autre

Raspberry Pi Compute Module 4S : jusqu’à 8 Go de mémoire, production jusqu’en 2034

Calendrier de publication d’Ubuntu 24.10 (Oracular Oriole)

Commentaires (13)