Réaliser la valeur des investissements en IA est devenu aujourd’hui le prix ultime pour la plupart des entreprises. Cela nécessite la capacité des données et du calcul à fonctionner ensemble, une mission clé du partenariat entre Nvidia Corp. et DataDirect Networks Inc.
Les deux sociétés ont collaboré sur des solutions qui facilitent la consommation de l'IA au sein d'une organisation, en mettant l'accent sur l'optimisation de l'utilisation des GPU au sein de la couche d'orchestration.
« Nvidia est désormais une société d'infrastructures d'IA, il s'agit donc avant tout de construire une infrastructure et de créer de la valeur à partir de cette infrastructure », a déclaré Alex Bouzari (photo), PDG de DDN. « Je pense que la création de valeur et la monétisation, rendre les GPU productifs et rentables, voilà ce dont il s'agit. C'est sur cela que nous nous concentrons avec une extrême précision. »
Bouzari s'est entretenu avec Dave Vellante de theCUBE pour la série d'interviews CUBE + NYSE Wired : AI Factories – Data Centers of the Future, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de la manière dont DDN et Nvidia se concentrent sur la création de nouvelles architectures pour tirer profit de l’IA.
Maximiser les investissements en IA pour les agents
Pour maximiser la valeur de l'IA, Nvidia et DDN ont travaillé sur des solutions qui renforcent l'efficacité des GPU dans les usines d'IA. Plus tôt ce mois-ci, DDN a annoncé de nouvelles avancées dans son portefeuille d'intelligence de données IA alignées sur BlueField-4, le processeur de stockage utilisé au sein de la plateforme d'IA Vera Rubin de Nvidia.
« Vera Rubin a été développée spécifiquement pour les cas d'utilisation agentique », a noté Bouzari. « Un chatbot envoie une requête ; un agent envoie 30 requêtes. Cela représente 30 fois plus de puissance, 30 fois plus de calcul, 30 fois plus de données. À moins que vous ne disposiez d'un cadre et d'une infrastructure d'IA où le calcul est très efficace et les données sont très efficaces, eh bien, vos agents ne peuvent pas fonctionner. Vous devez adopter de nouvelles approches, de nouvelles architectures développées spécifiquement pour ce type d'échelle pour que l'IA puisse évoluer dans ce nouveau monde d'activation agentique. »
Un autre facteur de création de valeur concerne le coût par jeton, une mesure de tarification utilisée par les fournisseurs de modèles pour quantifier les dépenses liées au traitement des jetons de texte dans les charges de travail d'IA. Alors que le coût du déploiement de l’IA devient une préoccupation croissante pour les entreprises, les constructeurs d’infrastructures tels que Nvidia et DDN s’efforcent de réduire considérablement les coûts des jetons.
« Les aspects économiques doivent être étudiés, ce qui réduit considérablement le coût par jeton », a déclaré Bouzari au CUBE. « Nvidia parle d'améliorer le coût par jeton d'un facteur 10, d'un facteur 20. Nous le faisons jour après jour dans tous les secteurs et chez les clients. Vous connectez ces deux choses ensemble, et c'est ainsi que l'adoption rapide de l'IA en entreprise se produit. Quand Elon (Musk) parle du marché adressable de SpaceX qui approche les 30 000 milliards de dollars, cela nécessite l'adoption de l'IA par les entreprises. Et pour cela, vous avez besoin que la couche de données soit permise. C'est le travail que fait DDN. «
Voici l'interview vidéo complète, qui fait partie de la couverture par SiliconANGLE et theCUBE de la série d'interviews CUBE + NYSE Wired : AI Factories – Data Centers of the Future :