L'étape Vera Rubin de CoreWeave ouvre la voie à la couverture de l'IA agentique de theCUBE

L'ère de l'IA agentique exerce une nouvelle pression sur la pile d'infrastructures, et la dernière étape franchie par CoreWeave Inc. donne à la conversation un avantage plus net.

Cette semaine, la société a annoncé avoir achevé ce qu'elle décrit comme la première mise en place et validation de Nvidia Vera Rubin NVL72 sur CoreWeave Cloud.

« Vera Rubin est la plate-forme d'IA la plus performante que Nvidia ait jamais construite », a déclaré Ian Buck, vice-président du calcul hyperscale et haute performance chez Nvidia Corp. « CoreWeave a toujours été à la frontière du déploiement de chaque nouvelle génération d'architecture Nvidia à grande échelle, et son approche complète et de bout en bout de Vera Rubin, du refroidissement à l'orchestration, est la façon dont les équipes d'IA les plus ambitieuses au monde repousseront la prochaine frontière de l'IA. « 

Cette étape importante intervient alors que les modèles d'IA atteignent une échelle de plusieurs milliards de paramètres, que les fenêtres contextuelles s'étendent sur des millions de jetons et que les performances d'inférence deviennent l'une des plus grandes contraintes pratiques pour exécuter l'IA agentique en production. (* Divulgation ci-dessous.)

L'infrastructure de l'IA agentique est au centre de l'attention

C'est la toile de fond du prochain événement virtuel de theCUBE, « Scaling the Agentic Era With Nvidia Vera Rubin NVL72 on CoreWeave Cloud », le 30 juin, au cours duquel theCUBE organisera une conversation avec les équipes CoreWeave, Nvidia et Dell sur ce qu'il faut pour construire une infrastructure informatique accélérée pour cette prochaine phase de l'IA.

L'événement examinera comment Nvidia Vera Rubin NVL72 est conçu pour prendre en charge l'inférence à grande échelle, les sessions de raisonnement persistantes et les charges de travail d'IA de production qui nécessitent plus que la densité brute du GPU. L'annonce de CoreWeave souligne le travail plus approfondi des systèmes derrière le déploiement, notamment le refroidissement liquide, le contrôle des racks, la mise en réseau, les opérations mutualisées sécurisées et le rôle de Dell Technologies dans la fourniture des serveurs PowerEdge XE9812 qui prennent en charge la plate-forme.

« L'ère agentique exige une approche fondamentalement différente de l'infrastructure, une approche qui s'adapte aux charges de travail qui raisonnent en continu, évoluent de manière imprévisible et fonctionnent en production 24 heures sur 24 », a déclaré Chen Goldberg, vice-président exécutif des produits et de l'ingénierie chez CoreWeave. « Ce qui différencie une infrastructure performante en laboratoire d'une infrastructure performante en production, c'est la profondeur de l'ingénierie qui la sous-tend. Avec des innovations en attente de brevet comme Valvey et Racky, CoreWeave a réalisé le travail d'orchestration complet pour permettre à Vera Rubin de fonctionner comme elle a été conçue, non seulement dans un laboratoire, mais à l'échelle de la production pour les équipes d'IA les plus exigeantes au monde. »

Pour les leaders technologiques d’entreprise, la grande question n’est pas simplement de savoir quand la prochaine génération de matériel d’IA arrivera. C’est ainsi que ce matériel devient utilisable, fiable et efficace à l’échelle de la production. Alors que les charges de travail d'IA agentique raisonnent en continu et fonctionnent sur des sessions plus longues, la conversation sur l'infrastructure s'oriente vers le coût par jeton, l'efficacité de l'inférence, l'observabilité des clusters, l'alimentation, le refroidissement et l'orchestration.

L'événement de TheCUBE approfondira ce changement à travers des discussions dirigées par des analystes et un regard sur Vera Rubin depuis un centre de données CoreWeave. La conversation devrait relier la percée matérielle aux exigences opérationnelles plus larges des nuages ​​​​d’IA, au déploiement de modèles à grande échelle et à l’architecture de centre de données de nouvelle génération.

À mesure que les entreprises passent de l’expérimentation de l’IA aux systèmes de production, les décisions en matière d’infrastructure deviennent des décisions stratégiques. L'étape Vera Rubin de CoreWeave ouvre la voie à une discussion opportune sur la manière dont l'IA agentique va remodeler les exigences de calcul, les écosystèmes de partenaires et les aspects économiques de l'exécution d'une IA avancée à grande échelle.

Ne manquez pas la couverture par theCUBE de l'événement « Scaling the Agentic Era With Nvidia Vera Rubin NVL72 on CoreWeave Cloud » le 30 juin.

(* Divulgation : TheCUBE est un partenaire média payant pour l'événement « Scaling the Agentic Era ». Ni CoreWeave, le sponsor de la couverture de theCUBE, ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine