La modernisation des centres de données libère une marge budgétaire pour l'IA à mesure que les entreprises financent de nouvelles charges de travail d'IA

Alors que les budgets d’IA des entreprises atteignent leurs limites chaque année, la pression exercée pour financer de nouvelles charges de travail d’agent et d’inférence sans augmenter les dépenses totales oblige à repenser fondamentalement la modernisation des infrastructures et des centres de données.

Le rapport State of FinOps 2026 révèle que 98 % des praticiens gèrent désormais les dépenses en IA, même si la plupart des organisations dépensent encore quatre à cinq fois plus que leur budget initial en charges de travail en IA. La tension centrale – demande accrue d'IA, budgets limités, matériel vieillissant – est exactement le problème pour lequel Advanced Micro Devices Inc. dit qu'il est conçu pour résoudre, selon Mike Thompson (photo, à droite), directeur des produits cloud chez AMD et FinOps Foundation Project, une série de LF Projects LLC, membre du conseil d'administration.

« L'ère du maximum de jetons est en quelque sorte révolue parce que les dépenses montent en flèche », a déclaré Thompson. « Je pense que l'industrie traverse actuellement une période de rationalisation, en particulier en ce qui concerne les applications d'IA et les charges de travail agents, car celles-ci sont vraiment pratiques. … Les budgets ont tendance à être dépensés un à deux trimestres dans l'année. Il y a tellement de développement dynamique dans le domaine de l'IA que deux à trois trimestres plus tard, les budgets sont déjà épuisés. »

Thompson et Jim Greene (à gauche), directeur du marketing des produits serveurs chez AMD, se sont entretenus avec John Furrier et Paul Nashawaty de theCUBE lors de FinOps X 2026, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de la manière dont la modernisation des centres de données, la consolidation des processeurs EPYC et l'architecture de cloud hybride x86 peuvent libérer la marge budgétaire dont les entreprises ont besoin pour financer l'IA de nouvelle génération. (* Divulgation ci-dessous.)

La modernisation des centres de données libère de la capacité pour les investissements en IA

Le gaspillage des infrastructures d’entreprise est le levier caché de l’équation budgétaire de l’IA. Une grande partie de la base de serveurs d'entreprise fonctionne depuis six ou sept ans – un matériel bien au-delà de sa durée de vie utile qui ne peut tout simplement pas prendre en charge les charges de travail d'IA modernes, a noté Greene, ce qui rend la modernisation des centres de données essentielle. Le remplacement de huit serveurs existants par un seul système basé sur AMD EPYC peut réduire considérablement la consommation d'énergie, l'encombrement du rack et les coûts de licences logicielles, créant ainsi de la place pour de nouveaux investissements en IA, a-t-il expliqué.

« Nous pouvons avoir des clients qui nous disent : « Je peux remplacer huit de ces anciens serveurs Ice Lake ou un ancien Intel de génération précédente, et je peux le remplacer par un serveur EPYC – cela va économiser de l'énergie, cela va économiser de l'espace », a déclaré Greene. « Au fil du temps, comme il est beaucoup plus économe en énergie et beaucoup plus efficace en termes de licences, vous économisez également de l'argent. »

La faible utilisation du serveur aggrave le problème. Une grande partie du marché utilise les unités centrales de traitement à un taux d'utilisation d'environ 10 %, ce qui laisse 90 % de la puissance de calcul inutilisée et brûle de l'énergie sans rien faire, a noté Thompson. Dans le cadre de sa contribution à la Fondation FinOps, AMD promeut une philosophie de « shift-left » dans laquelle les choix d'architecture, y compris la sélection du processeur, sont traités comme des décisions financières. L'écart entre une instance x86 bien choisie et une alternative mal adaptée peut avoir un impact significatif sur les dépenses d'exploitation annuelles, a déclaré Thompson.

« Il y a une différence OPEX de 30 à 40 %, une différence OPEX annuelle entre quelques plates-formes de calcul qui se ressemblent », a-t-il déclaré. « Beaucoup de gens ne considèrent pas que de nos jours, et en particulier lorsque vous déposez des candidatures, il est préférable de faire ces choix judicieux dès le départ. Sinon, un an ou deux ans plus tard, l'équipe FinOps découvrira ce gaspillage flagrant et vous forcera ensuite à un changement plus douloureux plutôt que de faire un choix intelligent dès le départ. « 

L’architecture x86 façonne également l’équation du cloud hybride. Les instances cloud basées sur Arm peuvent sembler compétitives sur le papier, mais les coûts cachés liés au portage d'applications, au maintien de deux bases de code et à la gestion de deux à trois environnements en parallèle compensent les économies apparentes, selon Greene. La compatibilité x86 d'AMD EPYC signifie que les charges de travail peuvent se déplacer entre des serveurs sur site et des instances cloud, y compris en cas de pointe de demande, sans recompilation et avec une surcharge opérationnelle minimale.

« Si vous utilisez x86 sur site, vous disposez d'un seul panneau de verre pour tout gérer », a déclaré Greene. « Il suffit d'appuyer sur un bouton pour déborder ou éclater dans le cloud. Si vous essayez de faire cela entre Arm et x86, vous devez tout recompiler, avoir un environnement complètement différent. Les environnements hybrides demandent une architecture unique. »

Restez à l'écoute pour l'interview vidéo complète, qui fait partie de la couverture de SiliconANGLE et theCUBE sur FinOps X 2026 :

(* Divulgation : TheCUBE est un partenaire média payant pour l'événement FinOps X. Ni la Fondation FinOps, le sponsor de la couverture de l'événement theCUBE, ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine