Alors que les coûts des jetons augmentent, Dell redouble d'efforts en matière d'IA de bureau

Alors que les entreprises sont confrontées à des factures d’inférence cloud croissantes, l’informatique IA sur site apparaît comme le levier décisif pour rendre l’IA agentique économiquement viable à grande échelle.

L'annonce par Dell Technologies Inc. de Dell Deskside Agentic AI a placé l'informatique IA sur site au centre de sa stratégie d'entreprise, encadrant le calcul local non seulement comme une alternative au cloud, mais aussi comme la base essentielle des flux de travail agentiques où les coûts des jetons peuvent faire ou défaire le retour sur investissement. Le calcul est simple : les agents de recherche qui dépensent 600 $ par cloud exécuté en une seule session deviennent une proposition financière très différente lorsque le calcul est entièrement détenu et assis au bureau, selon Marc Hammons (photo, à droite), ingénieur senior distingué chez Dell.

« Le cloud est l'endroit où les modèles de pointe passent en premier. C'est là que l'IA de pointe passe en premier », a déclaré Hammons. « C'est aussi là que vos coûts vont être enterrés si vous ne faites rien à ce sujet. L'opportunité… est d'apporter une partie de ce calcul localement sur la machine et de commencer à ajuster les aspects symboliques de la situation. »

Hammons et Charlie Walker (à gauche), directeur principal et directeur général de Dell Pro Max et Dell Pro Rugged, se sont entretenus avec John Furrier et Dave Vellante de theCUBE au Dell Technologies World 2026, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de la façon dont l'IA agentique arrive sur le bureau, de la tokenomique de l'inférence sur site par rapport au cloud et de cas d'utilisation allant des agents de recherche souverains aux superordinateurs de bureau. (* Divulgation ci-dessous.)

Informatique IA sur site et tokenomique des charges de travail agentiques

L’argument économique en faveur du calcul local devient plus clair lorsque l’on examine la nature récursive du travail agent. Contrairement aux simples échanges à réponse rapide, les agents itèrent en continu – lisant, raisonnant et agissant dans des boucles qui aggravent rapidement la consommation de jetons. Les entreprises découvrent de plus en plus que l'investissement matériel est amorti en quelques mois une fois que le taux de combustion est transféré du cloud vers une machine locale, a noté Walker.

« Quand vous pensez à un agent de recherche, il part, trouve un article, puis trouve autre chose, l'analyse, et donc il apprend continuellement, se développe continuellement. Cela brûle des jetons », a déclaré Walker. « Les gens regardent (le Dell Pro Max) et se disent : « C'est un appareil très cher », mais quelque chose comme un GB300, vous le payez en trois à six mois. Cela devient très économique lorsque vous commencez à réfléchir aux aspects symboliques qui se cachent derrière par rapport au simple investissement matériel. »

Le portefeuille de Dell s'étend du Dell Pro Max avec GB10, capable d'exécuter des agents locaux persistants dans un format compact, jusqu'au Pro Max avec GB300, qui offre 20 pétaFLOPS de performances et 748 Go de mémoire cohérente dans une tour de bureau. Cette extrémité supérieure du portefeuille amène effectivement le calcul à l'échelle du centre de données au bureau individuel, permettant aux agents à l'échelle de milliers de milliards de paramètres de fonctionner entièrement sur site, a expliqué Hammons. La pile logicielle s'adapte de manière transparente à toute la gamme, ce qui signifie qu'une équipe peut réaliser un prototype sur un GB10 et passer à un GB300 sans modifier ses outils ou son flux de travail.

« Vous avez besoin de ces modèles pionniers dans le cloud pour raisonner à l'échelle du référentiel et planifier à grande échelle », a déclaré Hammons. « Mais ensuite, il peut déléguer cela à ces machines qui sont au bureau et les laisser réellement prendre le relais et diriger les efforts individuels. »

Voici l'interview vidéo complète, faisant partie de la couverture par SiliconANGLE et theCUBE de Dell Technologies World 2026 :

(* Divulgation : TheCUBE est un partenaire média payant pour Dell Technologies World. Ni Dell, le sponsor de la couverture de l'événement theCUBE, ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine