Meta lance le modèle de raisonnement multimodal Muse Spark

Meta Platforms Inc. a lancé aujourd'hui un nouveau modèle de raisonnement, Muse Spark, très apte à répondre aux questions de santé et à analyser les données multimodales.

La société déploiera l’algorithme dans son service d’intelligence artificielle Meta AI axé sur le consommateur au cours des prochaines semaines. De plus, Meta met Muse Spark à la disposition des développeurs via une interface de programmation d'applications. L'API est en préversion privée.

Les progrès de Meta dans le domaine de l'IA, après une série de trébuchements, ont encouragé les investisseurs. Son action a augmenté de 6,5 % aujourd'hui, même si cela s'explique en partie par une journée énorme pour l'ensemble du marché, le Nasdaq, à forte composante technologique, ayant augmenté de 2,8 % alors que l'impact de la guerre en Iran était considéré comme s'atténuant au moins temporairement.

La société affirme que Muse Spark surpasse Claude 4.6 Opus, Gemini 3.1 Pro et GPT 5.4 sur plusieurs benchmarks. L'un d'eux est HealthBench Hard, une évaluation qui mesure la capacité des modèles d'intelligence artificielle à répondre à des questions médicales. Muse Spark a battu le score du finaliste, GPT 5,4, de plus de 2 %.

Les performances du modèle sont en partie le fruit d'un ensemble de données de formation clinique que Meta a compilé avec l'aide de plus de 1 000 médecins. L'ensemble de données a été développé dans le cadre d'une vaste refonte du flux de travail de développement de l'IA de l'entreprise. Selon la société mère de Facebook, ses ingénieurs ont également amélioré son architecture de modèle et son flux de travail post-formation.

« Nous pouvons atteindre les mêmes capacités avec plus d'un ordre de grandeur en moins que notre modèle précédent, Llama 4 Maverick », a déclaré Meta dans un communiqué. article de blog aujourd'hui. « Cette amélioration rend également Muse Spark nettement plus efficace que les principaux modèles de base disponibles à des fins de comparaison. »

Selon Meta, l'analyse des graphiques scientifiques est une autre tâche que Muse Spark accomplit mieux que ses concurrents. Il a battu Opus 4.6 et d'autres concurrents sur CharXiv Reasoning, un ensemble de données de référence comprenant des graphiques techniques. Cette capacité de raisonnement visuel s’applique bien à d’autres cas d’utilisation. Les utilisateurs de l'application Meta AI peuvent télécharger une photo d'une étagère d'épicerie et lui demander d'estimer le nombre de calories de chaque aliment.

Meta a également testé Muse Spark sur plus d’une demi-douzaine d’autres tests. Il se situe à quelques points de pourcentage de l'Opus 4.6, du Gemini 3.1 Pro et du GPT 5.4 dans de nombreux cas. Il y a eu plusieurs évaluations dans lesquelles Muse Spark a surpassé au moins un des modèles concurrents. Les benchmarks couvraient des cas d'utilisation tels que la génération de code, la navigation de robots et l'utilisation d'outils.

Muse Spark peut améliorer la qualité de sa sortie en activant un paramètre appelé mode Contemplation. La fonctionnalité lance plusieurs agents IA qui décomposent une tâche en sous-étapes et les exécutent en parallèle. Meta affirme que la technologie a augmenté d'environ 8 % le score de Muse Spark sur HLE, l'un des critères de référence les plus difficiles de l'écosystème de l'IA.

Muse Spark est le premier d’une série prévue de modèles de raisonnement multimodal. « Nous sommes sur une trajectoire de mise à l'échelle prévisible et efficace », a déclaré Meta dans le billet de blog d'aujourd'hui. « Nous sommes impatients de partager bientôt des modèles de plus en plus performants sur la voie de la superintelligence personnelle. »