Les entreprises réalisent que les hypothèses qui ont alimenté l’ère du cloud ne suffisent plus

L’ère de l’IA agentique impose une refonte fondamentale de l’infrastructure de l’entreprise, pas seulement dans le cloud, mais jusqu’au centre de données sur site. Les industries réglementées, les gouvernements et les entreprises ayant des exigences strictes en matière de souveraineté des données exigent désormais une infrastructure prête pour l'IA, capable d'exécuter des modèles frontières localement sans abandonner le contrôle de leurs données.

La base cloud native construite par Kubernetes au cours de la dernière décennie apparaît comme le fondement des charges de travail agentiques, même si la périphérie sur site de la pile nécessite une réflexion entièrement nouvelle en matière de calcul, de stockage et de gouvernance. Il est évident que les hypothèses d'infrastructure du passé ne suffisent plus pour l'ère agentique, selon Muninder Sambi (photo, à gauche), vice-président et directeur général des réseaux et de la sécurité chez Google LLC. La solution commence par ne pas obliger les entreprises à choisir entre souveraineté et capacité.

« Le défi est que (les entreprises) avaient un choix : soit elles peuvent être souveraines et se conformer, soit y renoncer et passer au cloud », a-t-il déclaré. « Avec Google Distributed Cloud, nous apportons réellement la puissance et l'intelligence de Gemini et tout ce que Google a à offrir pour un environnement sur site. »

Sambi et Drew Bradstock (à droite), directeur produit senior pour Kubernetes et Google Compute Engine chez Google, se sont entretenus avec John Furrier de theCUBE chez Google Cloud Next, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de l'infrastructure prête pour l'IA, du déploiement souverain de l'IA et de Kubernetes en tant que système d'exploitation de l'ère agentique. (* Divulgation ci-dessous.)

Kubernetes devient le système d'exploitation pour une infrastructure prête pour l'IA

La réponse de Google à la demande sur site consiste à intégrer les modèles de base Gemini dans des environnements sur site isolés et connectés en partenariat avec Nvidia Corp. et Dell Technologies Inc, selon Sambi. Google a également annoncé que les modèles Gemini Flash sont désormais disponibles sur les GPU Nvidia Blackwell B200 et B300 pour un déploiement sur site, permettant aux entreprises d'exécuter des charges de travail d'IA souveraines sans que les données ne quittent leur environnement.

« Nous travaillons en partenariat avec Nvidia et Dell sur les accélérateurs matériels », a déclaré Sambi. « Je l'appelle le moteur d'IA – la différence (par rapport à une usine d'IA) étant que nous vous donnons le moteur pour construire votre propre usine d'IA. »

Du côté de l’orchestration, Kubernetes a consolidé son rôle de plan de contrôle de l’IA – une position qui était loin d’être garantie lorsque les grands modèles de langage ont commencé à remplacer les paradigmes d’infrastructure antérieurs, a noté Bradstock. L'investissement de la communauté open source pour rendre Kubernetes compatible avec l'IA porte désormais ses fruits alors que les entreprises cherchent à exécuter des agents dans des environnements hybrides.

« Kubernetes est devenu ce système d'exploitation pour l'IA, de la formation à l'inférence en passant par (l'apprentissage par renforcement) », a déclaré Bradstock. « Cela a vraiment été au cœur de tout. Nous sommes de plus en plus pressés d'adapter Kubernetes assez rapidement, encore plus vite que la (communauté open source) ne peut suivre. »

Ce changement modifie également la façon dont les équipes d’infrastructure perçoivent leurs utilisateurs finaux – et la réponse ne consiste plus seulement à garder à l’esprit les développeurs humains. Alors que les agents IA assument une plus grande part de la charge de travail d'ingénierie, Google repense ses outils, sa documentation et ses interfaces autour de la consommation des agents comme considération centrale.

« L'étoile polaire de l'expérience utilisateur pour notre groupe, ce ne sont plus les gens, mais plutôt la façon dont nous offrons la meilleure expérience aux agents », a déclaré Bradstock. « Les nouveaux DevOps utilisent simplement Claude, utilisent Gemini pour faire tout leur travail, nous sommes donc en train de repenser nos interfaces utilisateur, notre documentation… tout est désormais conçu autour des compétences.

Voici l'interview vidéo complète, qui fait partie de la couverture de Google Cloud Next par SiliconANGLE et theCUBE :

(* Divulgation : Google a sponsorisé ce segment de theCUBE. Ni Google ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine