Red Hat maintient que l'open source bat les géants du cloud sur l'économie de l'IA

Red Hat Inc. veut être la seule couche autour de laquelle tout le reste est construit : l'écosystème d'IA durable de l'ère open source.

L'entreprise a misé sa prochaine décennie de croissance sur la conviction que l'open source soutiendra l'IA d'entreprise de la même manière que Linux et Kubernetes ont défini l'ère du cloud. Avec le lancement de Red Hat AI 3.4, l'entreprise se positionne comme la plateforme de référence en matière d'inférence à grande échelle, de déploiement d'agents et d'économie de jetons – les éléments constitutifs de tout écosystème d'IA durable, selon Brian Stevens (photo de droite), vice-président senior et directeur de la technologie de l'IA chez Red Hat. Au cœur de ce discours se trouve l’affirmation selon laquelle l’inférence privée sur site peut désormais correspondre aux économies unitaires des grands fournisseurs de cloud.

« (Les fournisseurs de modèles) sont en concurrence sur deux attributs : la valeur du jeton – qui possède le meilleur modèle – et l'économie du coût de ce jeton », a déclaré Stevens. « C'est ce que nous avons changé. Nous mettons entre les mains de nos clients et d'une communauté open source l'économie de jetons la plus efficace possible. »

Stevens et Joe Fernandes (à gauche), vice-président et directeur général de l'unité commerciale IA chez Red Hat, se sont entretenus avec Rob Strechay et Rebecca Knight de theCUBE au Red Hat Summit 2026, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de l’économie de l’inférence, de la gouvernance des agents et de la voie open source vers un écosystème d’IA durable. (* Divulgation ci-dessous.)

Écosystème d'IA durable fondé sur l'inférence ouverte et la gouvernance des agents

À mesure que les entreprises passent de l’expérimentation basée sur le cloud à la production privée d’IA sur site, la pression pour gérer à la fois les coûts des jetons et le comportement des agents s’intensifie. Red Hat AI 3.4 ajoute une couche de modèle en tant que service au-dessus de son moteur d'inférence vLLM et de son cadre d'inférence distribué llm-d, offrant aux équipes de plate-forme un accès gouverné aux points de terminaison du modèle sans les obliger à gérer l'infrastructure en dessous, a expliqué Fernandes.

« En tant que fournisseur de services, vos utilisateurs finaux ne se soucient pas de l'infrastructure en dessous. Ils veulent juste un accès rapide aux points de terminaison du modèle et (pour) sécuriser les jetons pour les déployer ainsi que pouvoir mesurer cette consommation », a déclaré Fernandes. « Mais maintenant, qu'est-ce qui va être le plus gros consommateur d'inférence ? Ce seront ces agents. »

L’autonomie des agents – la propriété même qui rend les agents puissants – est aussi ce qui les rend risqués. Red Hat AI 3.4 résout ce problème grâce à une nouvelle fonctionnalité AgentOps qui regroupe le traçage, l'observabilité, la gestion des identités et les contrôles du cycle de vie en une seule couche opérationnelle, a noté Fernandes. L’objectif est de donner aux entreprises les garde-fous qui permettent aux agents de fonctionner sans avoir recours à un acte de foi en matière de gouvernance.

« L'élément clé qui distingue un agent est l'autonomie », a déclaré Fernandes. « Vous voulez donner une identité à cet agent et vous assurer qu'il est autorisé à faire les choses que vous voulez qu'il fasse, mais pas autorisé à faire les choses qu'il (ne devrait pas faire). Vous devez comprendre comment transmettre les informations d'identification, à quoi il devrait pouvoir accéder dans votre réseau, sur votre système de fichiers – et ensuite être en mesure de retracer ce qu'il a fait pour pouvoir déboguer. « 

Dans les trois à cinq prochaines années, la fin du jeu n’est pas une plate-forme dominante unique mais un écosystème riche et ouvert – le même modèle qui a fait de Linux le système d’exploitation d’entreprise par défaut, a expliqué Stevens. L’IA étant encore fragmentée entre les choix de matériel, de modèle et de cloud, l’opportunité réside dans le fait de devenir la seule couche durable de l’écosystème de l’IA sur laquelle tout le reste peut s’appuyer.

« Je pense que c'est là où nous en sommes actuellement en matière d'IA. Nous sommes dans ce monde cloisonné », a déclaré Stevens. « Si nous y parvenons, nous aurons simplement ouvert ce monde entier en étant cette chose durable qui permet à cet écosystème de se construire autour de lui. »

Voici l'interview vidéo complète, faisant partie de la couverture par SiliconANGLE et theCUBE du Red Hat Summit 2026 :

(* Divulgation : Red Hat a sponsorisé ce segment de theCUBE. Ni Red Hat ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine