Microsoft a désormais son propre modèle de raisonnement

Vieux motard

Illustration : Flock

Vincent Hermann

Le 03 juin à 15h14

Durant sa conférence BUILD, Microsoft a présenté une nouvelle série de modèles MAI. L’entreprise se dote pour la première fois d’un modèle de raisonnement, présenté comme idéal par sa taille moyenne et son coût maitrisé.

Microsoft a désormais son propre modèle de raisonnement

Vieux motard

Illustration : Flock

Vincent Hermann

Le 03 juin à 15h14

IA et algorithmes

6 min

Cela peut paraître étonnant, mais Microsoft – qui a investi plusieurs milliards de dollars très tôt dans OpenAI – ne disposait d’aucun modèle de raisonnement. Jusqu’à présent, l’entreprise s’était surtout positionnée comme championne des relais pour d’autres modèles, laissant par exemple un accès à ChatGPT et plus récemment Claude via sa myriade d’assistants Copilot.

La situation a cependant changé : Anthropic a largement grimpé en puissance, tout particulièrement dans le développement, tandis qu’OpenAI suit sa propre trajectoire et se montre beaucoup plus autonome. La firme de Redmond a tout intérêt à manifester sa propre indépendance, avec à la clé une gamme plus complète de modèles.

Place à MAI-Thinking-1

La famille MAI (Microsoft AI) accueille plusieurs nouveaux venus présentés pendant la conférence BUILD, dont MAI-Thinking-1 présenté hier. Comme son nom l’indique, il s’agit d’un modèle de raisonnement de taille intermédiaire, de type MoE (Mixture of Experts), avec 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, soit l’équivalent d’un document de 600 pages selon Microsoft.

L’entreprise met clairement en avant un entrainement du modèle depuis zéro : aucune distillation et à partir de données commercialement licenciées et « propres ». MAI-Thinking-1 n’est donc pas censé s’appuyer sur les traces de raisonnement d’autres modèles, particulièrement concurrents. Il s’agit d’une construction indépendante.

Le modèle atteint 97 % sur AIME 2025 et 94,5 % sur AIME 2026, deux benchmarks évaluant le raisonnement mathématique et scientifique multi-étapes. Sur SWE-Bench Pro, benchmark d’ingénierie logicielle, Microsoft affirme qu’il égale Claude Opus 4.6 sur les tâches de codage. Dans des évaluations indépendantes en aveugle menées par Surge (partenaire indépendant de Microsoft), MAI-Thinking-1 a été préféré à Claude Sonnet 4.6. Ce dernier, le modèle par défaut pour Claude, est largement utilisé comme point de comparaison dans les chiffres donnés par Microsoft.

CNBC rapporte qu’une démonstration a présenté des résultats supérieurs à ceux de GPT-5.5 d’OpenAI avec un modèle ajusté sur les données de McKinsey, avec un coût annoncé comme dix fois inférieur. Il faut pour l’instant croire l’éditeur sur parole, car le modèle n’est disponible qu’en préversion privée via Microsoft Foundry. Sur la partie raisonnement, les tokens seront tarifés à la consommation, là encore sans plus de détails. Le modèle est également inclus dans GitHub Copilot Enterprise et une version pour les enclaves Azure Confidential Computing est prévue.

Six autres « nouveaux » modèles dans la famille MAI

Bien que MAI-Thinking-1 ait eu la part du lion pendant la présentation, la famille MAI a également reçu six autres modèles, en majorité des évolutions de ceux existant déjà.

MAI-Image-2.5 et MAI-Image-2.5 Flash débarquent ainsi pour la génération d’images. Microsoft évoque une hausse significative de la qualité, avec de meilleurs résultats que Nano Banana 2, avec une édition et des contrôles précis. La version classique vise la fidélité maximale et des performances « de qualité professionnelle », tandis que la version Flash – sans surprise – sacrifie une partie de cette qualité pour une plus grande rapidité des résultats. MAI-Image-2.5 est en cours de déploiement dans PowerPoint et OneDrive. Côté tarifs, MAI-Image-2.5 coûte 5 dollars par million de tokens pour les entrées texte, 8 dollars pour les entrées image et 47 dollars pour les sorties image. Pour la version Flash, les tarifs sont de 1,75 dollar pour les entrées texte et image, et de 33 dollars pour les sorties image.

MAI-Transcribe-1.5 est présenté de son côté comme le meilleur modèle de transcription au monde (tout simplement), avec une précision de pointe dans 43 langues, surpassant Gemini et les modèles phares d’OpenAI. Il est censé produire des transcriptions cinq fois plus rapidement que les modèles concurrents, et sera disponible dans GitHub Copilot, Dynamics 365 Contact Center et Foundry, avec un support prochain du streaming. Côté développeurs, il est accessible via Azure Speech au prix de 22 dollars le million de caractères.

Pour les autres modèles, il s’agit surtout de disponibilité. MAI-Voice-2 et sa variante Flash sont ainsi disponibles dans une quinzaine de langues supplémentaires avec de nouvelles options de voix. MAI-Code-1, modèle de codage présenté comme très efficace en inférence et optimisé pour GitHub, est disponible dans Copilot et Visual Studio Code. Son déploiement dans Copilot (tous niveaux) a commencé mardi 2 juin.

Aion, des modèles conçus pour l’exécution locale

Bien que moins mis en avant, deux nouveaux modèles nommés Aion ont aussi été présentés pour l’exécution locale.

Le premier, Aion Instruct, doit prendre le relai de l’actuel Windows OS SLM. Il se veut plus petit (4 milliards de paramètres), plus rapide et surtout plus efficace. Il doit alimenter tout ce qui touche à l’intelligence textuelle quotidienne, c’est-à-dire les résumés, la réécriture, la détection d’intention ou encore l’accessibilité.

Disponible dès maintenant dans le canal Insider d’Edge à des fins de tests pour les développeurs, il sera également accessible depuis les API de Windows. Contrairement aux modèles fournis jusqu’ici par Microsoft dans ce cas de figure, aucun NPU n’est requis : Aion Instruct est fait pour fonctionner partout, sur CPU. Enfin, une version open source doit arriver courant juillet sur Hugging Face.

Aion Plan est à la fois plus ambitieux et plus restreint. Disposant de 14 milliards de paramètres et d’une fenêtre de contexte de 32 000 tokens, de capacités de raisonnement et pouvant appeler des outils (tool-calling), il se veut le champion du flux agentique local. En revanche, il ne sera pas disponible avant plusieurs mois, et la présence d’un NPU semble cette fois requise.

Dans les deux cas, les modèles sont gratuits à l’usage, les opérations étant réalisées par la machine.

Commentaires (10)

Abonnez-vous pour prendre part au débat

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles d'un média expert

Profitez d'au moins 1 To de stockage pour vos sauvegardes

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

Gilbert_Gosseyn Premium

Le 3 juin à 16h25

Dois-je comprendre que Copilot repose sur des modèles externes ? Si oui, lesquels ?

Furanku Premium

Le 3 juin à 16h31

De mémoire c'est du gpt.
Après... de quel Copilot tu parles ?

deathscythe0666 Premium

Le 3 juin à 16h53

C'est la première question que lui ont posée les ingés de Microsoft

SebGF Premium

Le 3 juin à 16h54

Le deal entre OpenAI et Microsoft impliquait justement l'exclusivité des technos OpenAI à MS.

Mais ça, c'était avant. Depuis, MS a développé ses propres modèles.

Gilbert_Gosseyn Premium

Le 3 juin à 17h23

OpenAY risque d'attaquer, sauf si la fin du deal autorise Microsoft à utiliser son propre modèle ...

SebGF Premium

Le 3 juin à 19h22

Justement, la dernière révision de leur deal avait retiré cette exclusivité de mémoire.

Dimitri Goimbault Premium

Le 3 juin à 18h03

Copilot chat : GPT hébergé sur azure: modèle anthropic si ouverture par les admin.
Copilot studio : GPT, anthropic, grok, mistral
Github Copilot: GPT, anthropic, grok, gemini, mistral, Microsoft maintenant avec MAI
Azure AI foundry: tous les modèles que tu veux.
Génération d’image: GPT imagen ou mai image.

Mr.Nox Premium

Le 3 juin à 23h52

Pour Copilot sur le navigateur et installer sur les PC Copilot, c'est OpenAI.
Pour Copilot sur Github c'est un patchwork. De base ce sont ChatGPT et Claude mais tu peux en ajouter, la facture se mettent à jour selon celui utilisé.

jt_69.V Premium

Le 3 juin à 19h10

Vieux motard... Que j'aimais !

33A20158-2813-4F0D-9D4A-FD05E2C42E48

Le 4 juin à 13h09

Reste à espérer qu'il ne se mette pas à entonner l'un ou l'autre chant pro-teutonique après quelques heures d'exposition aux réseaux sociaux, comme l'avait fait leur précédente tentative...