Anthropic lance le projet Glasswing, exploitant son puissant modèle Mythos pour renforcer la sécurité des logiciels

Anthropic PBC a annoncé aujourd'hui la publication d'un aperçu du modèle de frontière le plus puissant jamais développé, le mettant à la disposition d'un petit groupe de partenaires et de chercheurs en cybersécurité pour aider à sécuriser les logiciels mondiaux.

Le modèle, appelé Claude Mythos, est publié dans le cadre d'une nouvelle initiative de cybersécurité baptisée Project Glasswing, qui verra plus de 40 partenaires l'utiliser spécifiquement pour des « travaux de sécurité défensive ». Selon Anthropic, bien que Mythos n'ait pas été initialement formé à des fins de sécurité, il excelle dans le code logiciel propriétaire et open source pour les vulnérabilités.

La société a déclaré qu'elle ne rendrait pas Mythos public parce qu'il était simplement « trop puissant » et donc trop risqué pour prendre une telle décision.

Claude Mythos a été révélé pour la première fois en mars dans une fuite révélée par Fortune. Selon ce rapport, les détails divulgués décrivaient Mythos comme « plus grand et plus intelligent » que les modèles Claude Opus existants d'Anthropic, qui constituent ses offres publiques les plus puissantes. Il a été initialement conçu pour être un modèle à usage général pour Claude, conçu pour posséder des compétences de codage et de raisonnement exceptionnellement solides qui lui permettraient d'effectuer des tâches telles que la création d'agents d'IA et l'écriture de code.

Anthropic affirme que la prudence est de mise car « les capacités que nous avons observées dans Mythos Preview pourraient remodeler la cybersécurité ». Au cours des dernières semaines, lors des tests de Mythos, la société a déclaré avoir identifié « des milliers de vulnérabilités » sur les sites Web et les applications, y compris tous les principaux systèmes d'exploitation et navigateurs Web utilisés aujourd'hui.

Les organisations partenaires du projet Glasswing incluent Amazon.com Inc., Apple Inc., Broadcom Inc., Cisco Systems Inc., CrowdStrike Holdings Inc., la Linux Foundation, Microsoft Corp. et Palo Alto Networks Inc. De plus, l'accès sera fourni à environ 40 autres organisations qui construisent ou maintiennent une « infrastructure logicielle critique ».

Les partenaires partageront ce qu'ils ont appris de l'utilisation de Mythos avec le reste de la communauté technologique, afin que chacun puisse en bénéficier et développer des logiciels plus sécurisés, a déclaré Anthropic. Pour faciliter la recherche des partenaires, Anthropic a engagé 100 millions de dollars en crédits d'utilisation dans le projet Glasswing, de sorte que ces partenaires ne seront pas tenus de payer les frais d'interface de programmation d'applications pour leurs tests et recherches de sécurité.

La société aurait également des « discussions en cours » avec des représentants du gouvernement américain pour leur donner accès à Mythos, bien qu'il soit possible que ces négociations soient compliquées par la bataille juridique en cours entre la société et la Maison Blanche. En effet, Anthropic a récemment été qualifié de « risque pour la chaîne d'approvisionnement » pour avoir refusé de laisser le Pentagone utiliser Claude pour le ciblage d'armes autonomes ou la surveillance de masse.

Concernant les prouesses de Mythos, Anthropic a expliqué avoir récemment découvert une vulnérabilité vieille de 16 ans dans FFmpeg, utilisée par des centaines d'applications pour encoder et décoder des vidéos. Le bug a été découvert dans une ligne de code qui avait été analysée plus de 5 millions de fois par les outils de sécurité traditionnels sans jamais être détectée. Le pire, c'est que Mythos est également suffisamment puissant pour développer immédiatement un exploit sophistiqué pour les vulnérabilités qu'il découvre, permettant potentiellement aux attaquants d'en profiter immédiatement et de commencer à causer des dégâts.

Mais même si Mythe peut être extrêmement dangereux, il peut aussi être utilisé à des fins positives. Anthony Grieco, directeur de la sécurité et de la confiance de Cisco, a déclaré que son équipe utilisait ce modèle pour rechercher et corriger les vulnérabilités de sécurité du matériel et des logiciels « à un rythme et à une échelle auparavant impossibles ». Il a déclaré que cela représente « un changement profond et un signal clair selon lequel les anciennes méthodes de renforcement des systèmes ne suffisent plus ».

Anthropic a déclaré que son objectif final est de faire en sorte que les modèles de classe Mythos puissent être déployés à grande échelle par le public, mais pour que cela se produise, il doit développer des mesures de cybersécurité qui détectent et bloquent ses sorties les plus dangereuses.

Mythos sera particulièrement utile aux développeurs de logiciels, si ces protections peuvent un jour être construites et vérifiées. Sur le benchmark SWE-bench Verified qui évalue les capacités de codage des modèles d'IA, Mythos a été capable de résoudre 93,9 % de tous les problèmes, un score bien supérieur au taux de précision de 80,8 % de Claude Opus 4.6. De plus, Mythos a atteint une précision de 77,8 % sur SWE-bench Pro, ce qui est une évaluation plus difficile, contre seulement 53,4 % pour Opus 4.6.