Meta Platforms Inc. se prépare à publier une nouvelle version de son modèle phare d'intelligence artificielle Muse Spark.
Alexandr Wang, directeur de l'IA de l'entreprise, a écrit sur X aujourd'hui que la mise à jour sera déployée « bientôt ». L'annonce est intervenue quelques heures après Business Insider signalé que le nouvel algorithme est compétitif avec GPT-5.5 sur plusieurs benchmarks d’IA « étroitement suivis ». Les sources de la publication n'ont pas nommé les références.
Pratiquement toutes les annonces de modèles frontières incluent les résultats de SWE-Bench Pro, un benchmark utilisé pour évaluer les capacités de codage des systèmes d'IA. La version originale de Muse Spark a obtenu un score de 52,5 % au test. GPT-5.5, le modèle PBC d'OpenAI Group auquel le nouvel algorithme de Meta correspondrait, a atteint 58,6 %. GPT-5.5 a également surpassé Muse Spark sur un autre benchmark de codage populaire appelé Terminal-Bench 2.0.
Wang a déclaré sur X que le prochain modèle de Meta est nettement plus habile en codage que Muse Spark. Il a ajouté qu'il est également meilleur pour alimenter les agents IA.
Muse Spark comprend un « mode contemplation » qui utilise des agents d'IA pour améliorer la qualité des réponses rapides. Au cours de ses tests internes, Meta a demandé au modèle de réaliser un test appelé HLE avec et sans cette fonctionnalité. Muse Spark a obtenu un score 8 % plus élevé lorsque le mode réflexion était activé.
Un utilisateur de X a demandé à Wang quand Meta lancerait un modèle pouvant correspondre aux capacités de codage de Claude Opus 4.8 d'Anthropic PBC. L’exécutif a répondu en déclarant que cela arriverait « très bientôt ».
Claude Opus 4.8 peut effectuer certaines tâches de codage bien mieux que Muse Spark et GPT-5.5. Il a obtenu un score de 69,2 % sur SWE-Bench Pro, soit 10,2 % de plus que le modèle phare d'OpenAI. Cependant, il a pris du retard sur GPT-5.5 sur Terminal-Bench 2.0.
L'amélioration de la qualité de production du nouveau modèle de Meta se ferait au détriment d'une utilisation accrue de l'infrastructure. Selon Business Insider, l’algorithme utilise un « ordre de grandeur » de capacité de calcul supérieure à celle de Muse Spark.
Les efforts de Meta pour améliorer les capacités de codage de ses modèles d'IA suggèrent qu'il envisage peut-être de les rendre accessibles aux développeurs externes. Mercredi, Bloomberg signalé que la société mère de Facebook envisage de lancer un service d'infrastructure d'IA. Les dirigeants se demanderaient si Meta devrait offrir une capacité de calcul brute ou des modèles d'IA hébergés.
Pour reprendre les outils de développement d'IA existants tels que Claude Code, Meta devra créer plus que de simples modèles d'IA optimisés pour le codage. Claude Code propose des intégrations avec des outils de développement populaires, une application de bureau et des fonctionnalités de personnalisation. Les utilisateurs peuvent également le configurer pour répéter une tâche à des intervalles de temps spécifiques.
Le codage n’est pas le seul cas d’utilisation auquel Meta pourrait appliquer son successeur prévu à Muse Spark. Anthropic propose Claude Code aux côtés de Claude Cowork, un outil de productivité destiné aux professionnels non techniques. Cette dernière offre comprend plusieurs ensembles de fonctionnalités spécifiques à des secteurs verticaux destinés à des secteurs tels que les secteurs de la santé et de la finance.