Apertus : la Suisse s’est mobilisée pour sortir son modèle de langage ouvert

Veni, vidi, ViSuisse

Illustration : Flock

Martin Clavey

Le 04 septembre 2025 à 08h01

Les Écoles polytechniques fédérales de Zurich et de Lausanne ont travaillé pendant un an et demi pour sortir Apertus, un modèle de langage qui se veut « 100% suisse », ouvert, respectueux du droit d’auteurs. L’idée est aussi d’avoir un modèle plus multilingue que ceux de la concurrence, en l’entrainant sur 40 % de textes non anglophones.

Apertus : la Suisse s’est mobilisée pour sortir son modèle de langage ouvert

Veni, vidi, ViSuisse

Illustration : Flock

Martin Clavey

Le 04 septembre 2025 à 08h01

IA et algorithmes

4 min

Apertus. Si comme moi, vous n’avez pas fait de latin, ça veut dire « ouvert » (comme dans apéro). Ici, les chercheurs suisses des Écoles polytechniques fédérales de Zurich et de Lausanne ont voulu afficher leur différence avec les modèles qui dominent le marché. Car, si la définition de l’IA ouverte divise encore le milieu, Apertus semble l’être particulièrement.

Un modèle qui se veut ouvert et respectueux des auteurs

Son objectif, selon nos confrères suisses du Temps : « offrir une alternative suisse, souveraine, aux modèles d’IA américains, chinois, voire européens ». Mais dans leur « rapport technique » [PDF], les chercheurs qui ont travaillé sur Apertus mettent aussi en avant le respect des auteurs et la volonté de proposer un modèle plus multilingue que les autres.

« Nous ne pouvons pas accepter que les bases de l’IA, si puissante, soient entre les mains d’une faction de multinationales », explique Antoine Bosselut, directeur du Laboratoire de traitement du langage naturel à l’EPFL, au journal Le Temps. En décembre 2023, les deux écoles polytechniques suisses ont donc créé la Swiss AI Initiative en s’appuyant aussi sur le Swiss National Supercomputing Centre. Celui-ci héberge le supercalculateur Alps composé, entre autres, de plus de 10 000 GH200 de NVIDIA.

Apertus est disponible en deux versions (8 milliards et 70 milliards de paramètres) sur Hugging Face sous licence Apache 2.0. Les chercheurs précisent que leur corpus de textes de pré-entraînement comme de post-entrainement « a été compilé uniquement à partir de données web, en respectant le fichier robots.txt non seulement au moment de l’exploration (janvier 2025), mais aussi en appliquant rétroactivement les préférences d’exclusion de janvier 2025 aux données web extraites lors d’explorations précédentes ». L’idée est d’être réellement conforme à l’AI Act européen et aux réglementations similaires, expliquent-ils.

Développer encore un peu plus le multilinguisme

Apertus a aussi été créé en utilisant, pendant l’entrainement, un mécanisme qui bloque la régurgitation des verbatims des textes utilisés pendant l’entrainement. Ainsi, les chercheurs évitent les éventuelles accusations de plagiat. Les chercheurs suisses ont voulu aussi se démarquer des modèles dominants en poussant autant que possible leur modèle vers un maximum de langues. Ainsi, leurs données d’entrainement contiennent des textes de 1 811 langues et 40 % ne sont pas anglophones. S’ils saluent les effort de leurs confrères qui ont créé les modèles ouverts BLOOM (sorti en 2022), Aya ou Qwen3, ils soulignent qu’Apertus a été entrainé sur 10 fois plus de langues que ces trois modèles.

Sciences

BLOOM : l’ambitieux modèle de langage de l’open science

Sciences

Mardi 18 octobre 2022 à 14h58 18/10/2022 14h58

6

Apertus ne joue pas au jeu du plus gros modèle possible. Rappelons qu’un modèle comme DeepSeek V3 a 685 milliards de paramètres. Mais, depuis quelque temps, on sait que cette course au volume commence à montrer ses limites. Apertus n’est pas multimodale, non plus. « Nous jouons dans une autre ligue, avec un modèle qui possède d’énormes qualités en termes de transparence, d’ouverture et de fiabilité. Et nous ne cesserons d’améliorer Apertus », assure Antoine Bosselut à nos confrères du Temps.

Pour les fonctionnalités de chat, le modèle peut être testé ici, sur une interface mise en place par le projet à but non lucratif Public AI Inference Utility.

Commentaires (9)

Abonnez-vous pour prendre part au débat

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles d'un média expert

Profitez d'au moins 1 To de stockage pour vos sauvegardes

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

SebGF Premium

Le 04/09/2025 à 08h11

Apertus. Si comme moi, vous n'avez pas fait de latin, ça veut dire « ouvert » (comme dans apéro).

Et qui a donné l'anglais aperture, qui désigne lui aussi l'ouverture, par exemple utilisé en photo pour mesurer celle d'un objectif.

Wosgien Premium

Le 04/09/2025 à 08h39

Et qui est une référence bizarre en jeux vidéos (portal ...)

potn Premium

Le 04/09/2025 à 08h55

Espérons que Apertus ne donne pas naissance à un GladOS. ^^'

Vekin Premium

Modifié le 04/09/2025 à 09h26

Aperture Science:
We do what we must
Because we can

Wosgien Premium

Le 04/09/2025 à 08h40

Les IA moins anglophone, c'est intéressant (j'ai testé croissant un peu - de réelles capacités pour du 1.5B dans les tâches de résumé et extraction d'info)

lejocelyn Premium

Modifié le 04/09/2025 à 08h51

Note: j'utilise régulièrement différents modèles IA.

J'ai toujours trouvé que la tâche de résumé fonctionnait mal et tendait à supprimer tout ce qui est original d'un texte. Je ne m'en suis rendu compte qu'en produisant des résumés de mes propres textes, sinon pour les textes que je ne connaissais pas, évidemment le résumé semblait bon.

Wosgien Premium

Le 04/09/2025 à 14h47

Je comprends ce que tu soulignes mais ça me paraît subjectif. Un peu comme si ton résumé soulignait ce qui était important pour toi mais pas assez perceptible dans le texte d'origine fourni à l'IA.
Du coup la question serait: le résumé produit par un autre humain de tes textes serait-il meilleur que celui de l'IA? Et si c'est le cas, est-ce que c'est parce que en tant qu'humains vous avez des informations de contexte que vous n'avez par partagé avec l'IA?

Dans mon cas, l'IA sans sort pas mal, car je n'ai pas beaucoup plus de contexte que ce que le texte présente. Donc le résultat est très essentiellement lié au contenu du texte.
Sinon, en extraction d'info en général c'est pas mal.

Et sinon, rien en prod, c'est encore très (très très) expérimental.

dematbreizh Premium

Le 05/09/2025 à 12h01

En fait je pense que la limite est peut-être dans la différence entre un résumé et un compte-rendu,
On attend souvent plus d'un résumé que de diminuer le nombre de mots sans analyse.

leyouki

Le 04/09/2025 à 11h07

Merci pour le compte-rendu bien complet.

Le rapport technique est disponible à cette adresse.

L'équipe met en avant la transparence et l'openness de l'IA. Qu'en est-il factuellement? Est-ce que le rapport technique offre cette transparence ou n'est qu'un écran de scientificité comme le "technical paper" de google quant à sa consommation d'eau? Je m'y connais pas assez en iagen pour y répondre moi-même.

Est-ce qu'Apertus correspond à la définition open de l'ia?

Et puis le rapport pointe sur cet outil. C'est un accès pertinent aux données et réglages d'entraînement de l'ia?