Pour maîtriser le chaos de l'IA en entreprise, l'open source s'articule autour d'une couche d'exécution standard

La confiance dans l’IA open source est devenue une préoccupation centrale pour les entreprises qui mettent l’IA agentique en production, où la gouvernance, la sécurité et la fiabilité comptent autant que les performances du modèle.

Cette pression s'exerce directement sur les sociétés de plateforme, pour qu'elles fournissent des fondations standardisées et partagées qui absorbent la complexité afin que les entreprises n'aient pas à le faire. Notamment, l'industrie a déjà été là – avec Linux et Kubernetes – mais la rapidité des cycles de matériel et de modèles d'IA impose un nouveau type de discipline de co-ingénierie, selon Chris Wright (photo), directeur de la technologie et vice-président senior de l'ingénierie mondiale chez Red Hat Inc.

« Alors que vous créez des agents capables d'écrire du code et de faire des choses – de réaliser des actions réelles au sein de votre véritable entreprise – comment pouvez-vous leur faire confiance ? » a déclaré Wright. « Vous devez lui donner le bon sandboxing. Vous devez mettre des protections autour de l'agent, lui donner le moins de privilèges pour qu'il ne pense pas à la lecture ou à la lecture-écriture – une très grande différence. Comment gérer cela à grande échelle avec potentiellement des centaines ou des milliers d'agents ? Je pense qu'il est essentiel d'instaurer la confiance. »

Wright s'est entretenu avec Rob Strechay et Rebecca Knight de theCUBE au Red Hat Summit 2026, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de la confiance dans l'IA open source, de l'économie de l'inférence, de la gouvernance de l'identité des agents et des efforts de Red Hat pour établir une couche d'exécution standard pour l'ère de l'IA. (* Divulgation ci-dessous.)

La confiance dans l’IA open source et la couche d’inférence standardisée

La réponse de Red Hat à la complexité de l'IA d'entreprise repose sur la même logique qui a rendu Linux et Kubernetes omniprésents : établir un point focal vers lequel l'ensemble de l'écosystème s'appuie. La société fait ce pari sur vLLM en tant que moteur d'inférence open source standard, soutenue par son acquisition de Neural Magic Inc., qui a apporté une expertise approfondie de vLLM dans l'ingénierie des performances de quantification et d'inférence, a noté Wright.

« (Les fournisseurs de modèles) construisent vLLM avant même de publier le modèle », a-t-il déclaré. « Cela crée cette efficacité à grande échelle. Lorsque vous l'introduisez dans l'entreprise, vous avez la même capacité à créer une efficacité opérationnelle. Vous savez ce que vous ciblez en tant que constructeur. Je pense qu'il est vraiment important d'avoir ces éléments de base standardisés et de contribuer à faire avancer rapidement l'industrie. »

Mais à mesure que l'économie de l'inférence devient une préoccupation au niveau du conseil d'administration, la voie à suivre nécessite de traiter la production de jetons de la même manière que les entreprises traitent tout autre coût d'infrastructure – avec des choix d'outils délibérés et un matériel adapté à la charge de travail, a expliqué Wright. La bonne approche consiste à sélectionner l'option la plus performante par coût et par rapport de puissance pour chaque tâche spécifique, plutôt que de choisir par défaut le modèle le plus puissant, quelle que soit la tâche. Ce calcul exige de l'hétérogénéité – entre le matériel, la taille des modèles et les environnements de déploiement, du cloud jusqu'à l'atelier – et c'est exactement là que Red Hat voit sa plate-forme convergée créer une valeur durable.

« L'hétérogénéité est définitivement l'avenir », a déclaré Wright. « Construire l'hétérogénéité, pas seulement au niveau du matériel, mais aussi dans les charges de travail et le type de modèles que vous utilisez pour prendre en charge vos charges de travail – les plus grosses, les plus petites, adaptées à une tâche spécifique – c'est exactement ce sur quoi nous nous concentrons. »

Voici l'interview vidéo complète, faisant partie de la couverture par SiliconANGLE et theCUBE de l'événement Red Hat Summit 2026 :

(* Divulgation : Red Hat a sponsorisé ce segment de theCUBE. Ni Red Hat ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Pour maîtriser le chaos de l'IA en entreprise, l'open source s'articule autour d'une couche d'exécution standard

La confiance dans l’IA open source et la couche d’inférence standardisée

Photo : SiliconANGLE