À mesure que les usines d’IA évoluent vers les « centres de données du futur », la pile d’infrastructures doit également se transformer en un mélange de plates-formes CPU et GPU capables de fournir un ensemble complet de solutions informatiques d’IA.
Cela couvre toute la gamme, de l'hébergement d'applications à la génération d'intelligence et des flux de travail statiques aux systèmes d'orchestration agentique. Pour les principaux fournisseurs informatiques d'entreprise, tels que Hewlett Packard Enterprise Co., cela signifie que les organisations s'attendent de plus en plus à une IA d'entreprise prête pour la production, dotée de la gouvernance, de la sécurité et de l'évolutivité nécessaires pour passer efficacement du pilote à la production.
Le défi auquel sont confrontées de nombreuses organisations aujourd'hui est d'aller au-delà du bruit entourant la pile informatique et d'utiliser l'infrastructure de l'IA pour améliorer la vitesse d'inférence, selon Robin Braun (photo, à gauche), vice-président du développement commercial de l'IA, cloud hybride, chez HPE.
« Les gens essaient de trouver le signal dans le bruit ; ils essaient d'utiliser leurs données pour améliorer leur efficacité… pour améliorer leur activité », a déclaré Braun. « C'est là que l'inférence entre en jeu : il est si important d'essayer de l'utiliser pour comprendre sous-jacente vos données. C'est là que je constate que de nombreux clients se concentrent désormais vraiment sur la manière dont ils résolvent certains des problèmes de type de données les plus banals et les plus compliqués. »
Braun s'est entretenu avec Rob Strechay de theCUBE pour la série « Unleash AI Momentum » de HPE, lors d'une interview exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Elle a été rejointe par Luke Norris (à droite), co-fondateur et PDG de Kamiwaza Corp., et ils ont discuté de l'informatique IA pour la vitesse d'inférence et de l'importance réelle de l'architecture. (* Divulgation ci-dessous.)
Une nouvelle approche de l'informatique IA
En réponse aux demandes croissantes d'inférence, HPE a travaillé avec des partenaires tels que Kamiwaza et Nvidia Corp. pour améliorer les performances et l'efficacité des GPU dans la gestion de charges de travail d'IA plus volumineuses et plus complexes. Cela a nécessité une toute nouvelle approche de la façon dont les systèmes sont architecturés, selon Norris.
« Le concept d'architecture pour l'inférence n'a probablement que deux ans, et il présente des problèmes assez importants pour maximiser la partie la plus coûteuse de l'infrastructure, à savoir le GPU », a-t-il déclaré au CUBE. « Vous devez concevoir l'environnement de telle sorte que lorsqu'un utilisateur fait une demande, les données, cette demande et les réponses soient chargées dans ce GPU. Lorsque l'utilisateur fait une autre demande, elle doit être redirigée vers le même GPU qui a déjà le cache. C'est extrêmement complexe et extrêmement limitant car vous avez maintenant verrouillé la session de cet utilisateur dans le GPU. De nouvelles architectures, de nouveaux paradigmes sont nécessaires. «
Une partie de la solution HPE pour répondre à ces exigences difficiles est Unleash AI, un programme visant à fournir une IA d'entreprise prête pour la production sur une infrastructure qui fournit la puissance, la gouvernance, la sécurité et l'évolutivité nécessaires. Unleash AI se concentre sur un ensemble sélectionné de partenaires ISV sélectionnés, tels que Kamiwaza, qui intègrent des solutions spécifiques au secteur aux offres HPE pour permettre le déploiement de l'IA à l'échelle de l'entreprise.
« Nous essayons d'offrir ce résultat, cette valeur pour l'utilisateur final à nos clients communs, mais le matériel, l'architecture et les limites du centre de données empêchent généralement nos clients d'aller de l'avant », a expliqué Norris. « Le partenariat HPE Unleash AI élimine vraiment tout cela du point de vue de la complexité, du point de vue de l'accélération et du point de vue du packaging, (et) nous permet de continuer à nous concentrer sur ce que nous voulons avec nos clients.
Cette orientation a permis à HPE de travailler plus étroitement avec ses clients pour développer un rôle plus clair pour l'inférence de l'IA. Les avantages incluent des économies de coûts et une plate-forme plus durable sur le plan environnemental, selon Braun.
« Nous avons vraiment changé la boîte noire de l'inférence : nous sommes désormais en mesure d'explorer véritablement la façon dont vous concevez votre entreprise pour l'inférence et de réaliser cet investissement judicieusement », a déclaré Braun. « La véritable magie que cela peut apporter est que vous pouvez augmenter considérablement les performances sans avoir à investir considérablement dans davantage de serveurs et sans avoir à investir dans une facture d'électricité plus importante. »
L’un des éléments de cette solution implique une base de stockage de données cloud native et prête pour l’IA pour prendre en charge les charges de travail d’inférence intensives. En mai, HPE a élargi son portefeuille de plateformes de cloud et de données hybrides avec de nouvelles offres de cloud privé et de stockage conçues pour les charges de travail d'intelligence artificielle. Cela comprenait la quatrième génération de HPE Private Cloud, ainsi qu'une prise en charge étendue du stockage de fichiers et d'objets dans la plate-forme HPE Alletra Storage MP X10000.
« Nous avons été à la pointe de la technologie pour rassembler la technologie afin de générer des avantages pour le client et de pouvoir vraiment commencer à examiner et à simplifier l'architecture d'inférence », a déclaré Braun au CUBE. » Existe-t-il des moyens de le faire plus rapidement, mieux et de manière plus économique simplement en améliorant la façon dont vous stockez les données non structurées ? Ce que nous avons trouvé, c'est que la réponse est oui. (Les clients) n'ont pas besoin de manipuler toutes leurs données désordonnées ; il leur suffit de les mettre sur un Alletra X 10K, et nous pouvons faire tout le gros du travail à leur place. «
Voici l'interview vidéo complète, qui fait partie de la couverture par SiliconANGLE et theCUBE de la série d'interviews « Unleash AI Momentum » de HPE :
(* Divulgation : TheCUBE est un partenaire média payant pour la série d'interviews « Unleash AI Momentum » de HPE. Ni HPE, le sponsor de la couverture de l'événement theCUBE, ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)