IBM publie sa famille de modèles Granite en version 3
Le 22 octobre à 10h28
2 min
IA et algorithmes
IA
Six mois après avoir présenté sa première version de la famille de modèles Granite, IBM publie sa version 3.0 sur Hugging Face.
Celle-ci est, comme la version 1.0 de la famille, publiée sous licence libre Apache 2.0. Mais, alors qu'elle présentait à l'époque ses modèles comme spécialisée dans les tâches liées au code, IBM explique maintenant dans son communiqué que ses modèles « égalent, et dans certains cas dépassent, les performances générales des principaux LLM à poids ouvert ». Bref, ils sont maintenant utilisables pour toutes sortes de tâches et rivalisent avec les modèles de mêmes tailles que ceux de Meta et de Mistral selon l'entreprise.
IBM précise que ses modèles ont notamment été entrainés pour l'anglais, l'allemand, l'espagnol, le français, le japonais, le portugais, l'arabe, le tchèque, l'italien, le coréen, le néerlandais et le chinois. « Les utilisateurs peuvent affiner les modèles Granite 3.0 pour d'autres langues que ces 12 langues », ajoute-t-elle.
IBM publie de fait trois tailles de modèles pour cette nouvelle version : 1b, 2b et 8b. Elle fournit aussi une version « Guardian » pour les 2b et 8b spécialement paramétrée pour les questions de risques et de sécurité (comme les hallucinations).
Si l'entreprise a communiqué sur les versions 1.0 et 3.0 de cette famille, nous n'avons étonnamment pas trouvé de trace de la version 2.0.
Le 22 octobre à 10h28
Commentaires (2)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 22/10/2024 à 10h58
https://www.commitstrip.com/en/2017/05/24/meanwhile-in-a-parallel-universe-4/? ;)
Le 22/10/2024 à 17h41