Le modèle MAI-Image-2-Efficient de Microsoft accélère l'abandon de l'OpenAI par l'entreprise

Les efforts de Microsoft Corp. en faveur de l'indépendance de l'intelligence artificielle gagnent du terrain avec la sortie aujourd'hui de MAI-Image-2-Efficient, une version simple et efficace de son modèle phare de génération d'images qui a fait ses débuts plus tôt ce mois-ci.

La nouvelle version est destinée à fournir des visuels de haute qualité plus rapidement et à une fraction du coût de son prédécesseur, a indiqué la société. Le modèle original MAI-Image-2 a été publié par la nouvelle équipe de superintelligence MAI de Microsoft plus tôt ce mois-ci, et l'équipe dirigée par Mustafa Suleyman est reconnue pour avoir lancé une version simplifiée de ce modèle quelques semaines plus tard.

Comme son nom l'indique, MAI-Image-2-Efficient est avant tout une question d'efficacité, Microsoft promettant un débit quatre fois plus rapide par unité de traitement graphique lorsqu'il fonctionne sur les processeurs H100 de Nvidia Corp. En termes de performances brutes, il est environ 22 % plus rapide que le modèle principal MAI-Image-2, dépassant le Gemini 3.1 Flash de Google LLC avec une latence supérieure de 40 %, a indiqué la société, citant ses propres références.

Microsoft a déclaré que MAI-Image-2-Efficient est également plus rentable, avec un prix commençant à 5 $ par million de jetons d'entrée, identique à celui du modèle phare, et à 19,50 $ par million de jetons de sortie, soit 41 % moins cher. Cette stratégie tarifaire à deux niveaux, avec les utilisateurs pouvant choisir entre un modèle haut de gamme pour un travail créatif haute fidélité et une version efficace pour la production en volume, reflète les playbooks de Google et de startups comme OpenAI Group PBC et Anthropic PBC. La société a déclaré que MAI-Image-2-Efficient est particulièrement adapté aux tâches de « chaîne d'assemblage » telles que les maquettes d'interface utilisateur, la photographie de produits et les ressources marketing, où le coût par image est un facteur clé.

Les premiers retours sur le MAI-Image-2 original ont été positifs, le modèle revendiquant la troisième place dans le classement d'Arena.ai et gagnant des éloges pour son photoréalisme et sa capacité à restituer une typographie complexe – un domaine dans lequel de nombreux autres modèles de génération d'images ont du mal. Mais il n'est pas encore clair si MAI-Image-2-Efficient souffre des mêmes contraintes gênantes que son frère. Par exemple, l'original a reçu de nombreuses critiques pour sa période de « cooldown » de 30 secondes entre les invites, l'incapacité de générer des images avec autre chose qu'un rapport hauteur/largeur de 1:1 et son filtrage de contenu trop agressif.

S'éloigner d'OpenAI

La volonté de Microsoft de développer ses propres modèles est motivée par sa volonté de réduire sa dépendance à l'OpenAI, dans lequel il a massivement investi au fil des ans. Il fut un temps où le fabricant de logiciels Windows dépendait presque exclusivement des modèles d'OpenAI pour ses produits et capacités d'IA. Mais il semble avoir pris garde à l’idée d’être « enfermé » dans une entreprise de plus en plus puissante qui a montré sa volonté d’affirmer son indépendance.

Pas plus tard qu'hier, CNBC a rapporté avoir publié une note interne de la nouvelle directrice des revenus d'OpenAI, Denise Dresser, qui a déclaré au personnel que le partenariat de l'entreprise avec Microsoft « a également limité notre capacité à rencontrer les entreprises là où elles se trouvent ». Le mémo souligne le nouveau partenariat d'OpenAI avec la plateforme Bedrock d'Amazon Web Services Inc. comme un moteur de croissance clé, notant que la demande entrante était « franchement stupéfiante » depuis l'annonce de la collaboration en février.

OpenAI a également cherché à diversifier sa base d'infrastructure cloud auprès de fournisseurs tels que CoreWeave Inc., Google LLC et Oracle Corp., aux frais de Microsoft. De son côté, Microsoft a ajouté OpenAI à sa liste officielle de concurrents mi-2024.

Pendant ce temps, Rebecca Wettemann, analyste chez Valoir, a déclaré à SiliconANGLE en janvier que la dépendance de Microsoft à l'égard d'OpenAI devenait une préoccupation majeure pour les investisseurs, car OpenAI est confrontée à une concurrence accrue de la part de concurrents comme Google et Anthropic. « Les investisseurs perdent patience, en grande partie parce qu'une grande partie du retour sur investissement potentiel de Microsoft est liée à l'argent provenant d'OpenAI, ce qui est pour l'essentiel hypothétique à ce stade », a-t-elle expliqué.

Développer ses propres modèles peut être bien plus rentable pour Microsoft. Les modèles MAI sont désormais l'option par défaut chaque fois que quelqu'un demande à l'outil Copilot de l'entreprise de générer une image, remplaçant le modèle DALL-E d'OpenAI. Cela signifie que Microsoft peut conserver tous les coûts générés pour lui-même, plutôt que de payer des frais de licence à OpenAI.

MAI-Image-2-Efficient contribue également à accélérer la stratégie d'IA agentique de Microsoft. Avec le lancement de services tels que Copilot Cowork et Agent 365, Microsoft évolue vers un monde où l'IA exécute des tâches et des flux de travail complexes en plusieurs étapes pour le compte des utilisateurs. Si l’on demande à un agent autonome de créer du matériel pour une nouvelle campagne marketing, une faible latence et des coûts réduits sont essentiels, lui permettant d’itérer à grande échelle.

Microsoft a déclaré que MAI-Image-2-Efficient est désormais disponible via Microsoft Foundry et MAI Playground.

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine