Dell et Nvidia font de l'infrastructure IA le nouveau centre de puissance de la technologie d'entreprise

À mesure que l’intelligence artificielle évolue, l’infrastructure de l’IA devient le facteur décisif pour déterminer si l’IA d’entreprise apporte une réelle valeur ou s’arrête.

L’IA passe de l’expérimentation à des systèmes unifiés où l’infrastructure, les données et les logiciels fonctionnent ensemble. Des partenariats tels que Dell Technologies Inc. et Nvidia Corp. alignent ces couches pour simplifier le déploiement et prendre en charge des plates-formes évolutives à long terme, selon Varun Chhabra (photo de gauche), vice-président senior de l'ISG et du marketing des télécommunications chez Dell Technologies.

« Le mot qui, à mon avis, vient en tête pour tout le monde est agentique », a déclaré Chhabra. « Avec OpenClaw et les annonces faites par Nvidia autour de NemoClaw, nous avons l'impression d'être à ce moment ChatGPT pour l'agentic. Tout le monde nous demande comment adopter l'agentic plus rapidement que jamais. »

Chhabra et Anne Hecht (à droite), directrice principale du marketing produit, entreprise chez Nvidia, se sont entretenues avec John Furrier de theCUBE pour la série d'interviews CUBE + NYSE Wired : AI Factories – Data Centers of the Future, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de la manière dont les entreprises repensent les systèmes, les coûts et le déploiement de l'IA, à mesure que l'infrastructure devient essentielle à la mise à l'échelle de l'IA dans le monde réel.

L’infrastructure d’IA devient la base de l’IA à l’échelle de l’entreprise

Les entreprises reconnaissent de plus en plus que la vitesse à elle seule n'est pas une contrainte ; le véritable défi consiste à gérer la complexité des technologies en évolution rapide. À mesure que les modèles, les outils et les architectures évoluent, les organisations donnent la priorité aux systèmes capables d'absorber ce changement sans refonte constante. Cela signifie construire autour de la flexibilité, de l'évolutivité et de la viabilité à long terme plutôt que des gains de performances à court terme, selon Hecht.

« Cela évolue très rapidement, et je pense que c'est l'un des défis auxquels les entreprises sont également confrontées », a-t-elle déclaré.  » L'année dernière, nous parlions de modèles de raisonnement parce que DeepSeek venait d'être abandonné. Maintenant, nous parlons d'agents qui évoluent et créent d'autres agents parce qu'OpenClaw a abandonné. Avec chacune de ces vagues, nous travaillons avec Dell et l'écosystème, évaluons ces technologies et les apportons ensuite aux entreprises de manière à ce qu'elles puissent tirer parti de ces avancées, mais en toute sécurité, afin qu'elles puissent toujours tirer le meilleur parti de l'IA et utiliser ces technologies qui sortent si rapidement. « 

Ce changement redéfinit également l’endroit où se trouvent les charges de travail de l’IA. L’hypothèse selon laquelle tout fonctionnera dans le cloud public cède la place à des approches plus distribuées couvrant les environnements sur site, les emplacements périphériques et les postes de travail des développeurs. L’objectif n’est pas la centralisation, mais le contrôle, notamment en termes de coûts, de gouvernance et de performances.

« Des technologies telles que l'informatique confidentielle, c'est là que l'on voit l'écosystème se rassembler où des modèles de pointe comme le modèle Gemini de Google peuvent désormais fonctionner sur site sur un serveur Dell parce qu'ils construisent une pile informatique confidentielle », a ajouté Hecht. « Les entreprises vont voir leurs charges de travail d’IA s’exécuter sur une architecture très distribuée, et en tant qu’écosystème, nous devons construire les systèmes pour rendre cela possible. »

La demande de jetons et l’économie remodèlent les décisions de déploiement

À mesure que l’IA s’implante davantage dans les opérations, la consommation de jetons apparaît comme un nouveau point de pression économique. Les premiers cas d'utilisation tels que l'assistance au codage révèlent déjà à quelle vitesse la demande peut évoluer, obligeant les entreprises à repenser si les modèles basés sur la consommation sont durables à long terme. Les décisions en matière d'infrastructure sont désormais directement liées à l'efficacité avec laquelle les organisations peuvent générer et gérer cette demande, a expliqué Hecht.

« Vous pouvez confier à un agent l'exécution d'une tâche, puis revenir le matin et le tour est joué », a-t-elle déclaré. « C'est une recherche effectuée. C'est un rapport. Il peut prendre des mesures de votre part avec votre approbation, et il a généré et gravé un tas de jetons pour ce faire. Vous avez besoin de systèmes qui peuvent réellement prendre en charge ce niveau d'inférence, comme presque toujours pour l'inférence à grande échelle. « 

Cette dynamique renforce les arguments en faveur d’une plus grande part de la pile d’infrastructure, en particulier pour les organisations exécutant des charges de travail d’inférence à volume élevé. Au lieu de s'appuyer entièrement sur des prestataires externes, nombreux sont ceux qui commencent à évaluer l'investissement en capital comme moyen de stabiliser les coûts et d'assurer la disponibilité.

«Je pense que les entreprises doivent examiner les coûts variables de leur IA dont elles disposent actuellement», a-t-elle déclaré. « L'entreprise peut gérer la disponibilité et hiérarchiser ces charges de travail, ce qui est parfois plus difficile en fonction de votre relation contractuelle et de l'endroit où vous louez votre AI Factory si vous faites appel à un tiers et ne possédez pas votre propre infrastructure. »

Dans le même temps, la montée en puissance des systèmes agentiques soulève de nouvelles questions en matière de gouvernance et de contrôle. À mesure que les systèmes d’IA deviennent plus autonomes, les entreprises sont obligées de définir des limites quant au niveau d’accès et à l’autorité décisionnelle que ces systèmes devraient avoir. Cette tension entre productivité et surveillance devient rapidement une considération centrale en matière de conception, a souligné Chhabra.

« Nous travaillons beaucoup avec la plate-forme d'automatisation Dell », a-t-il déclaré. (Nous travaillons) en étroite collaboration avec Nvidia pour créer des plans qui peuvent aider à accélérer le déploiement de l'ensemble de la pile d'IA, qu'il s'agisse de l'infrastructure, des logiciels fournis par Nvidia, des modèles, ainsi que des capacités en plus de cela, toutes ces choses.

Voici l'interview vidéo complète, qui fait partie de la couverture par SiliconANGLE et theCUBE de la série d'interviews CUBE + NYSE Wired : AI Factories – Data Centers of the Future :

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine