Pixtral 12B, le premier modèle multimodal de Mistral
Le 11 septembre 2024 à 16h00
1 min
IA et algorithmes
IA
Mistral rend disponible via un torrent Pixtral 12B, son premier modèle multimodal qui peut traiter des textes comme des images. L'entreprise a fait son annonce via un simple tweet incluant le lien magnet du torrent.
Elle donne un peu plus d'informations sur son compte GitHub sur lequel elle clame « vous pouvez désormais insérer des images et des URL dans le message de l'utilisateur en plus du texte ».
Vaibhav Srivastav, de Hugging Face, détaille sur X un peu plus les caractéristiques de Pixtral 12B. Entre autres, la structure du modèle concernant le texte reprend celle du modèle Mistral Nemo 12B auquel est ajouté un adaptateur de vision de 400M, la taille des images peut atteindre 1024 x 1024 pixels et les poids du modèle sont partagés sur Hugging Face.
Mistral ne communique pas clairement sur la licence choisie pour l'utilisation de ce modèle.
Selon Sophia Yang, qui travaille chez Mistral, le modèle devrait être disponible bientôt sur la plateforme de l'entreprise et dans la liste de modèles utilisables via son chatbot.
Le 11 septembre 2024 à 16h00
Commentaires (4)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 11/09/2024 à 16h28
Le 11/09/2024 à 22h03
- consolidated.safetensors (23.62Gio)
- params.json (453o)
- RELEASE (10.2kio)
- tekken.json (18.3Mio)
Le 11/09/2024 à 16h33
Le 12/09/2024 à 11h08