Le marché des GPU AI appartient aux hyperscalers, mais le MI350P d'AMD arrive pour les entreprises

L'accès aux GPU d'entreprise s'étend à mesure qu'Advanced Micro Devices Inc. abaisse les barrières grâce au GPU Instinct MI350P refroidi par air et à une pile logicielle prête à l'emploi conçue pour les serveurs d'entreprise standard.

La prochaine vague d’adoption de GPU en entreprise ne dépend pas seulement des performances du silicium brut, mais aussi de la réduction considérable des obstacles au déploiement. AMD parie que l'association de facteurs de forme de serveur grand public avec des logiciels prêts à l'emploi raffinés sera le déverrouillage qui convertira un énorme marché d'entreprise inexploité, selon Mike Darby (photo, à droite), directeur principal du développement commercial, Instinct Data Center GPU, chez AMD. Cela inclut un point d'entrée à faible engagement via Dell Technologies Inc., qui met le matériel à disposition pour des tests de validation de principe à distance avant que les entreprises ne s'engagent dans un déploiement complet.

« Ce qui est cool… c'est que (les XE9785 et XE9785L) se trouvent actuellement dans le centre de solutions client de Dell, en direct, prêts à effectuer des POC à distance », a déclaré Darby. « Vous n'avez pas besoin d'acheter un énorme serveur pour l'essayer et prouver qu'il fonctionne. Dell l'a prêt à être mis en service dès maintenant. »

Darby s'est entretenu avec Gemma Allen (à gauche) au Dell Technologies World 2026, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de l'accès aux GPU d'entreprise, de la nouvelle série Instinct MI350P et des opportunités liées à l'infrastructure d'IA sur site. (* Divulgation ci-dessous.)

L'accès au GPU d'entreprise s'étend avec AMD Instinct MI350P

La pièce maîtresse de l'histoire Dell Technologies World 2026 d'AMD est le nouvel Instinct MI350P, un GPU basé sur PCIe conçu pour fonctionner sur les serveurs PowerEdge grand public à 450 watts – bien à la portée des centres de données d'entreprise standard refroidis par air. Le MI350P offre 144 Go de mémoire HBM3E, ce qui se positionne comme un différenciateur clé en matière de performances d'inférence étant donné le rôle critique que joue la bande passante mémoire dans le temps de latence jusqu'au premier jeton, a expliqué Darby.

« C'est beaucoup de mémoire, mais c'est aussi du HBM3E, donc (il a) une quantité incroyable de bande passante », a déclaré Darby. « Le principal cas d'utilisation est l'inférence : tout dépend de la latence, du temps nécessaire au premier jeton et de l'expérience utilisateur afin que votre capacité d'attention ne se déplace pas ailleurs pendant que vous attendez votre réponse. »

Du côté logiciel, AMD associe le MI350P avec ROCm 7 et AMD Inference Microservices, offrant ainsi aux entreprises une pile pré-optimisée pour les modèles d'IA à poids ouvert les plus populaires. L’objectif est d’éliminer l’expertise spécialisée qui a historiquement rendu les déploiements de GPU inaccessibles aux organisations informatiques traditionnelles, a noté Darby.

« Ce qui va enthousiasmer les gens cette année, en particulier dans le secteur des entreprises, ce sont les performances prêtes à l'emploi avec ROCm 7, avec les microservices d'inférence AMD », a-t-il déclaré. « Vous l'allumez, lancez l'AIM et vous bénéficiez de performances prêtes à l'emploi sur les modèles d'IA les plus populaires sans avoir besoin d'un doctorat ou d'un diplôme en informatique pour le comprendre. »

Voici l'interview vidéo complète, faisant partie de la couverture par SiliconANGLE et theCUBE de Dell Technologies World 2026 :

(* Divulgation : AMD a sponsorisé ce segment de theCUBE. Ni AMD ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine