L’intelligence artificielle d’entreprise devient de plus en plus complexe et l’ingénierie des plateformes devient la couche de contrôle qui la maintient en mouvement.
À mesure que l’IA entre en production, le défi ne consiste plus seulement à choisir des modèles : il s’agit également de faire fonctionner les données, les applications, les machines virtuelles, les conteneurs et les charges de travail d’inférence dans des environnements hybrides désordonnés. C'est là que la stratégie de cloud hybride ouvert de Red Hat Inc. devient plus pertinente, offrant aux entreprises un moyen de transformer une infrastructure dispersée en une couche opérationnelle plus cohérente pour l'IA, selon Paul Nashawaty, analyste principal chez theCUBE Research.
« Le Red Hat Summit 2026 reflète l'évolution actuelle du développement d'applications vers l'ingénierie de plate-forme et les flux de travail basés sur l'IA », a déclaré Nashawaty. « Les entreprises standardisent les plates-formes basées sur Kubernetes pour prendre en charge une livraison cohérente d'applications dans des environnements hybrides, tout en intégrant des capacités d'IA dans les pipelines de développement. Cela accroît l'alignement entre les équipes de développement et d'infrastructure, car les applications, les données et les modèles sont construits et exploités sur des plates-formes partagées plutôt que via des chaînes d'outils isolées. »
Dans le cadre de l'étude continue de SiliconANGLE Media sur les choix d'infrastructure qui façonnent l'IA d'entreprise, cette analyse examine comment les plates-formes partagées, la virtualisation et le contrôle du cloud hybride ouvert changent le marché. Ne manquez pas les interviews et les analyses de SiliconANGLE lors du Red Hat Summit 2026, du 11 au 13 mai, pour en savoir plus sur la prochaine étape de Red Hat sur le marché. (* Divulgation ci-dessous.)
L’ingénierie des plateformes devient le point de contrôle de l’IA
La stratégie d'IA de Red Hat repose sur l'idée selon laquelle les entreprises ont besoin d'une base unique pour les applications traditionnelles, les machines virtuelles, les conteneurs et les charges de travail d'IA. Cela fait de l'ingénierie de plate-forme une exigence pratique plutôt qu'une tendance technologique, car l'IA de production dépend autant des systèmes autour du modèle que du modèle lui-même, a expliqué Rob Strechay, analyste principal chez CUBE Research.
« L'IA n'est plus un projet scientifique », a-t-il déclaré. « Au Red Hat Summit, la conversation s'oriente vers la manière dont les organisations opérationnalisent l'IA de manière efficace, la gèrent de manière responsable et génèrent réellement un retour sur l'IA. Le véritable goulot d'étranglement dans l'IA ne réside pas dans les modèles, mais dans la plate-forme. La vision « du métal aux agents » de Red Hat montre comment les entreprises peuvent exécuter l'IA, les applications traditionnelles et les systèmes agent sur une base unifiée. «
Ce cadre donne à Red Hat une voie de marché claire. De nombreuses entreprises ne sont pas en difficulté parce qu’elles manquent d’ambition en matière d’IA ; ils rencontrent des difficultés parce que leurs équipes utilisent des outils fragmentés, des processus déconnectés et une infrastructure qui n'a pas été conçue pour des charges de travail distribuées et à forte inférence. Kubernetes est en train de devenir la couche de coordination pour ces environnements, mais les entreprises ont toujours besoin de plates-formes qui le rendent utilisable à grande échelle, a noté Strechay.
« L’économie des jetons est en train de devenir le nouveau modèle de coûts du cloud, mais elle est très déroutante pour les directeurs financiers et les chefs d’entreprise », a-t-il déclaré. « Les organisations qui gagneront seront celles qui optimisent l'inférence, et ne se contentent pas de construire des modèles plus grands. J'attends de Red Hat qu'il parle de rendre toute l'infrastructure nécessaire à cela transparente et simple. »
La position de Red Hat sur ce marché est ancrée dans son histoire avec Linux, Kubernetes et l'infrastructure open source. Cela donne à l'entreprise une base crédible pour affirmer que l'IA a besoin d'un plan de contrôle pouvant s'étendre à tous les environnements, plutôt que d'une pile conçue autour d'un cloud, d'un accélérateur ou d'un modèle de déploiement, selon Brian Stevens, vice-président senior et directeur de la technologie pour l'IA chez Red Hat.
« Ce que nous avons réalisé, c'est que l'IA est développée par des data scientists et, dans ce cadre, ils construisent leur propre infrastructure pour l'exécuter », a-t-il récemment déclaré au CUBE. « Si l'on réfléchit à la manière dont les entreprises ont procédé à leur transformation numérique, elles ont très vite réalisé que chaque équipe de développement ne pouvait pas créer son propre cloud. »
La virtualisation se transforme en modernisation
La virtualisation offre à Red Hat une autre ouverture. De nombreuses entreprises réévaluent leurs environnements de machines virtuelles existants, mais elles ne recherchent pas une perturbation en soi. Ils ont besoin d'un chemin de migration qui prend en charge les applications existantes tout en leur donnant un moyen de moderniser l'infrastructure pour les conteneurs, les charges de travail d'IA et les opérations cloud natives, a expliqué Daniel Messer, directeur principal de la gestion des produits chez Red Hat.
« C'est un concept très puissant de réappliquer cela – et également de le consolider sur la même plate-forme avec moins de fournisseurs et moins de surface d'attaque pour les changements dans les différentes courbes d'apprentissage, ce qui, je pense, a toujours été la puissance de Kubernetes », a déclaré Messer. « Nous pensons que la virtualisation et les conteneurs ne devraient pas vivre en silos. Ils devraient être sur une seule plateforme – et KubeVirt rend cela possible. »
C'est là que la position concurrentielle de Red Hat devient la plus claire. VMware reste profondément ancré dans la virtualisation d'entreprise, tandis que les hyperscalers continuent de courtiser les charges de travail de modernisation. La réponse de Red Hat consiste à regrouper les machines virtuelles, les conteneurs et les systèmes basés sur l'IA sur une seule plate-forme, faisant ainsi de la virtualisation OpenShift une partie d'une histoire plus large de modernisation des applications plutôt qu'un simple remplacement de machines virtuelles.
« Mais cette conversation n'est pas seulement une conversation sur la migration vers la virtualisation », a déclaré Ashesh Badani, vice-président senior et directeur des produits chez Red Hat. « De plus en plus, il s'agit d'une conversation de modernisation, car vous voulez vous assurer que la plate-forme dont vous disposez intègre ces machines virtuelles, en vous assurant que vous prenez en charge ces charges de travail cloud natives, mais de plus en plus, vous voulez également en faire une plate-forme pour les charges de travail basées sur l'IA. Nous croyons fermement que la même plate-forme vous permettra de le faire. «
Le thème plus large est la simplification des plateformes d’entreprise. Les entreprises tentent d’étendre leurs efforts en matière d’IA tout en réduisant la prolifération des outils, en renforçant la sécurité et en améliorant la cohérence opérationnelle. Cela donne à Red Hat un message opportun : moins de systèmes déconnectés, plus de contrôle partagé et un modèle basé sur Kubernetes capable de prendre en charge les charges de travail anciennes et de nouvelle génération, a noté Siamak Sadeghianfar, directeur principal de la gestion des produits chez Red Hat.
« Nous investissons beaucoup dans OpenShift Dev Spaces, (qui) offre aux développeurs un environnement de développement réglementé basé sur le Web en un clic avec toutes les capacités dont ils disposent sur leur poste de travail, mais aussi dans leur IDE, à la différence qu'ils n'ont pas à gérer eux-mêmes les dépendances ou la configuration », a-t-il déclaré. « Vous demandez à n'importe quel développeur s'il change d'ordinateur portable ou de projet, cela prend une semaine pour se mettre à niveau. Nous réduisons cela à un (processus) en un seul clic avec Dev Spaces. »
La souveraineté et l’inférence font monter les enjeux
L’IA souveraine devient une préoccupation au niveau des conseils d’administration, car les entreprises ont besoin de contrôler leurs modèles, leurs données, leurs résultats et leur conformité. Pour Red Hat, cela crée une nouvelle ouverture pour une infrastructure cloud hybride ouverte, d'autant plus que les gouvernements et les industries réglementées cherchent des moyens de maintenir les systèmes d'IA transparents, portables et alignés sur les exigences locales, a souligné Vincent Caldeira, directeur de la technologie pour l'Asie-Pacifique chez Red Hat.
« La façon dont nous définissons réellement la souveraineté est la capacité d’exercer un contrôle sur votre destin numérique », a-t-il déclaré au CUBE. « Cela nous amène au-delà des discussions sur la conformité réglementaire et la sécurité vers d'autres dimensions, telles que la compétitivité économique. Les pays qui n'ont pas suffisamment accès aux GPU ne peuvent pas avoir d'usines d'IA, ce qui signifie qu'ils ne peuvent pas construire leurs propres modèles, leur propre capacité d'IA. »
L’inférence ajoute une autre couche à la pression du marché. La formation domine peut-être encore une grande partie du débat sur l’IA, mais l’IA de production dépend de l’exécution de modèles efficaces, sécurisés et suffisamment proches des données de l’entreprise pour être utiles. Le travail de Red Hat autour d'InstructLab, du llm-d et des modèles rentables reflète la volonté plus large de rendre l'IA de production durable, selon Roberto Carratalá, architecte principal de la plateforme d'IA chez Red Hat.
« Nous avons déjà constaté que beaucoup de nos clients sont passés de la phase exploratoire à la mise en production, (et) cela consomme beaucoup de jetons différents », a-t-il déclaré. « Ils montent en flèche sur cette consommation. Il faut pouvoir disposer de ces modèles rentables. »
C’est également là que l’écosystème Nvidia, la disponibilité des accélérateurs et l’économie des jetons entrent en ligne de compte. Les entreprises découvrent que le passage de l’IA à la production modifie le profil des coûts. Il ne suffit pas de construire des modèles ; les organisations doivent les exécuter de manière répétée, les gouverner de manière cohérente et optimiser l’infrastructure qui les sous-tend.
« Tout le monde sait que si vous essayez d'obtenir un GPU de nos jours, c'est presque impossible. Dans un environnement d'entreprise, c'est bien pire », a déclaré Messer au CUBE. « Vous devez vraiment vous assurer que ces GPU coûteux ne sont pas sous-utilisés ou mal gérés. »
(* Divulgation : TheCUBE est un partenaire média payant pour le Red Hat Summit. Les sponsors de la couverture de l'événement theCUBE n'ont aucun contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)