Le puissant processeur Graviton5 d'AWS fait ses débuts dans les nouvelles instances cloud M9g et M9gd

Le silicium personnalisé de nouvelle génération d'Amazon Web Services Inc. est enfin rendu accessible aux clients pour la première fois avec le lancement des instances Elastic Compute Cloud M9g et M9gd.

Ils sont alimentés par la toute nouvelle unité centrale de traitement Graviton5, conçue pour offrir des performances de calcul supérieures pour diverses charges de travail cloud, y compris les applications d'intelligence artificielle.

La société a déclaré que Graviton5 est conçu pour prendre en charge le raisonnement de l'IA en temps réel, la génération de code, l'orchestration de tâches en plusieurs étapes et les charges de travail complexes et toujours actives pour permettre « une IA qui passe à l'action ». Il s’agit par là d’agents d’IA autonomes qui peuvent être configurés pour exécuter des tâches au nom d’humains avec une supervision minimale.

AWS a annoncé Graviton5 lors de sa conférence annuelle AWS re:Invent en décembre, affirmant qu'il représente un « bond architectural massif » pour l'infrastructure cloud d'entreprise.

La puce est la plus puissante de la famille Graviton à ce jour, spécialement conçue pour répondre aux exigences de l'IA agentique, qui nécessite que les processeurs exécutent un grand nombre d'environnements informatiques simultanés et maximisent les performances des unités de traitement graphique et autres accélérateurs d'IA. Selon AWS, Graviton 5 offre une amélioration de 25 % en termes de performances de calcul globales par rapport à son prédécesseur, Graviton4. Cela se fait tout en offrant une plus grande efficacité énergétique, permettant aux entreprises de réduire leurs coûts d’infrastructure.

AWS a déclaré que la nouvelle puce avait déjà conquis de nombreux fans. Par exemple, Meta Platforms Inc. prévoit de déployer « des dizaines de millions » de cœurs Graviton5 pour exécuter ses charges de travail agentiques, et la société d'entrepôt de données cloud Snowflake Inc. s'est également inscrite. Uber Technologies Inc. est un autre des premiers adaptateurs qui s'est engagé à déployer les processeurs.

Le géant du cloud estime qu'il va y avoir une demande massive pour les instances de calcul M9g et M9gd maintenant qu'elles sont généralement disponibles. Plus de 120 000 clients AWS dans le monde exécutent déjà des applications sur des processeurs Graviton de génération précédente, et les nouvelles puces sont les premières de la famille à prendre en charge la mémoire DDR5 et PCIe, regroupant 192 cœurs ultra-denses sur une seule puce.

Graviton5 est également livré avec un cache L3 cinq fois plus grand, qui est une mémoire tampon haute vitesse conçue pour conserver les données fréquemment consultées plus près du cœur de la puce. Cela signifie que chaque cœur Graviton peut accéder à 2,6 fois plus de cache L3 que Graviton4. Les performances de la mémoire ont également été améliorées, réduisant ainsi le temps passé par les puces à attendre l'arrivée des données. En conséquence, il permet des temps de réponse des applications plus rapides et exécute des processus gourmands en mémoire beaucoup plus efficacement, a déclaré AWS.

Ailleurs, le réseau et la capacité globale de stockage ont été augmentés. AWS a déclaré que Graviton5 dispose de 15 % de bande passante réseau en plus et de 20 % de bande passante Amazon Elastic Block Store en plus. Cela signifie que les instances plus grandes peuvent disposer d'une bande passante globale jusqu'à 100 % supérieure, ce qui se traduit par des transferts de données plus rapides, des sauvegardes plus rapides et des performances améliorées pour les applications distribuées.

En plus de l'amélioration globale des performances de calcul de 25 %, les instances M9g permettent des applications Web et des charges de travail d'inférence d'apprentissage automatique 35 % plus rapides, ainsi que des bases de données 30 % plus rapides. Les instances M9gd diffèrent car elles sont destinées aux charges de travail qui nécessitent un stockage local à haut débit, offrant jusqu'à 11,4 téraoctets de stockage sur disque SSD NVMe et des opérations d'entrée/sortie 30 % plus rapides par seconde que les puces de génération précédente.

AWS a expliqué que les nouvelles instances fonctionnent en tandem avec les cartes AWS Nitro pour décharger la mise en réseau, le stockage et la virtualisation vers du matériel dédié. Nitro est la couche de sécurité et de performances d'Amazon conçue pour les organisations soucieuses de la confidentialité dans des secteurs tels que la santé, les services financiers et le gouvernement. En supprimant ces besoins, Nitro peut aider les processeurs Graviton5 à fonctionner plus efficacement tout en améliorant la sécurité des données.

Ces instances sont les premières à prendre en charge le nouveau moteur d'isolation Nitro, qui améliore les capacités de sécurité de Nitro grâce à l'utilisation de la vérification formelle. Il fournit la certitude mathématique que les charges de travail s'exécutent indépendamment les unes des autres et des autres opérateurs AWS.

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine