IBM publie sa famille de modèles Granite en version 3

IBM publie sa famille de modèles Granite en version 3

IBM publie sa famille de modèles Granite en version 3

Six mois après avoir présenté sa première version de la famille de modèles Granite, IBM publie sa version 3.0 sur Hugging Face.

Celle-ci est, comme la version 1.0 de la famille, publiée sous licence libre Apache 2.0. Mais, alors qu'elle présentait à l'époque ses modèles comme spécialisée dans les tâches liées au code, IBM explique maintenant dans son communiqué que ses modèles « égalent, et dans certains cas dépassent, les performances générales des principaux LLM à poids ouvert ». Bref, ils sont maintenant utilisables pour toutes sortes de tâches et rivalisent avec les modèles de mêmes tailles que ceux de Meta et de Mistral selon l'entreprise.

IBM précise que ses modèles ont notamment été entrainés pour l'anglais, l'allemand, l'espagnol, le français, le japonais, le portugais, l'arabe, le tchèque, l'italien, le coréen, le néerlandais et le chinois. « Les utilisateurs peuvent affiner les modèles Granite 3.0 pour d'autres langues que ces 12 langues », ajoute-t-elle.

IBM publie de fait trois tailles de modèles pour cette nouvelle version : 1b, 2b et 8b. Elle fournit aussi une version « Guardian » pour les 2b et 8b spécialement paramétrée pour les questions de risques et de sécurité (comme les hallucinations).

Si l'entreprise a communiqué sur les versions 1.0 et 3.0 de cette famille, nous n'avons étonnamment pas trouvé de trace de la version 2.0.

Commentaires (2)


La V2 elle est prévue pour tourner sous windows 9 et devrait être utilisée pour la génération des textes des PNJ dans Half Life 3, le tout couplé à une appli iphone 2 codée en angular 3 pour le front et PHP6 pour le back...


https://www.commitstrip.com/en/2017/05/24/meanwhile-in-a-parallel-universe-4/? ;)
ca manque commit...
Fermer