Maximiser Gemini : Google Cloud tente de créer le système d'exploitation pour l'IA d'entreprise

Google LLC est devenu le seul « hyperscaler » du cloud doté d'un grand modèle de langage d'intelligence artificielle de pointe – Gemini – et a publié aujourd'hui une série d'annonces conçues pour capitaliser sur cet avantage actuel.

L'unité cloud du géant de la recherche a lancé Gemini Enterprise Agent Platform comme nouvelle plateforme de création d'agents IA. Google a également dévoilé une nouvelle application Gemini Enterprise conçue pour faire passer l'IA d'un outil isolé à un ingénieur autonome sécurisé et collaboratif pour l'entreprise. Les dernières versions ont été décrites par Thomas Kurian, directeur général de Google Cloud (photo), comme le prochain chapitre de la saga de l'IA en cours.

« Vous avez dépassé le stade pilote, la phase expérimentale est derrière nous », a déclaré Kurian lors de son discours d'ouverture au Google Cloud Next à Las Vegas. « Comment intégrer l'IA dans l'ensemble de votre entreprise ? La réponse est une pile unifiée. »

Construire des contrôles agents

Comme l’ont noté les analystes de SiliconANGLE, Google est l’un des rares acteurs technologiques clés à disposer des ressources nécessaires pour optimiser la pile de bout en bout. Son objectif, sur la base des annonces de cette semaine lors du Google Cloud Next, a été de maximiser la couche de calcul, le réseau mondial, la sécurité, les moteurs de données et la plate-forme d'applications pour générer de la valeur de l'IA d'entreprise.

Gemini joue un rôle central dans cette stratégie, comme en témoigne son intégration dans une multitude d'annonces faites aujourd'hui. La nouvelle application Gemini Enterprise est conçue pour résoudre les frustrations liées aux agents d'IA cloisonnés qui se sont avérés difficiles à superviser. Il ajoute une nouvelle « Boîte de réception » pour la gestion des agents, fournissant une commande plus centralisée pour guider et gérer les agents utilisés.

Gemini alimente également le kit Data Agent récemment annoncé, une expérience d'ingénierie de données permettant de tirer parti des outils privilégiés des praticiens, ainsi qu'une nouvelle fonctionnalité d'espace de travail partagé, appelée Projets, permettant de faire passer Gemini d'un assistant d'IA solo à un outil collaboratif. Gemini figurait en bonne place dans les annonces de sécurité de Google Cloud, autour de nouveaux outils de gouvernance et de solutions d'identité agent.

« Nous agissons de manière audacieuse et responsable », a déclaré Sundar Pichai, PDG de Google et de sa société mère Alphabet Inc., qui s'est exprimé lors de la conférence dans une vidéo préenregistrée.  » Considérez-le comme un contrôle de mission pour l'entreprise agentique. Une chose est parfaitement claire : nous sommes fermement dans l'ère agentique des Gémeaux. « 

De nouvelles puces dévoilées

Être un « contrôle de mission » pour le monde agent nécessitera toujours un matériel puissant capable d'exécuter les modèles permettant de fournir la matière grise derrière les machines à raisonner. Google a également résolu ce problème en annonçant aujourd'hui deux nouvelles unités de traitement tensoriel ou TPU.

La société a présenté les TPU 8t et TPU 8i, des siliciums personnalisés conçus pour servir de bêtes de somme pour la formation et l'inférence de modèles. TPU 8t utilise un accélérateur spécialisé pour résoudre les problèmes d'accès à la mémoire pour les LLM et les problèmes d'optimisation de la bande passante mémoire qui ont entravé la progression du déploiement de l'IA.

« (TPU) 8t est une centrale optimisée pour la formation », a déclaré aujourd'hui Amin Vahdat, technologue en chef pour l'infrastructure IA chez Google, dans une présentation. « Nous pouvons désormais transformer des mois de formation en semaines. »

Le TPU 8i, conçu sur mesure, est conçu pour héberger un cache clé-valeur plus grand au moment de l'inférence pour les LLM, ce qui peut accélérer considérablement la génération de texte. La technologie derrière la conception 8i améliore la latence, un autre obstacle à l'IA, en réduisant le diamètre du réseau et le nombre de sauts qu'un paquet de données doit effectuer pour traverser le système.

« Nous avons enfin brisé le mur de mémoire qui ralentit le décodage de contextes longs », a déclaré Vahdat.

Dynamique du marché en évolution

Bien que les annonces de Google cette semaine aient souligné sa confiance dans Gemini pour ancrer une stratégie d'IA agentique, les déclarations des dirigeants de l'entreprise ont souligné un développement qui mérite d'être surveillé dans l'évolution de l'IA pour l'entreprise. La concurrence pour la part de marché des entreprises dans le domaine de l'IA d'entreprise reposera sur la capacité des principaux acteurs de l'industrie technologique à servir de niveau de contrôle au sein duquel l'IA fait son travail.

Pichai y a fait allusion dans sa description du « contrôle de mission », et les annonces de Google cette semaine concernant de nouvelles fonctionnalités telles que l'orchestration d'agent à agent, la passerelle d'agent et l'observabilité d'agent mettent en évidence la nécessité d'apporter une certaine mesure d'ordre dans l'équation de l'IA.

« Nous avons construit la plateforme d'agent pour gérer l'intégralité du cycle de vie d'un agent », a noté Kurian.

Ou comme Brian Delahunty, vice-président de l'IA cloud chez Google Cloud, l'a dit dans une séance de questions-réponses avec la presse : «Notre vision est cette entreprise alimentée par l’IA.

Certains éléments indiquent que la stratégie de Google commence à se traduire par des résultats financiers et une dynamique de marché. Alphabet a enregistré une croissance de 48 % des revenus d’une année sur l’autre pour ses opérations cloud au quatrième trimestre 2025, un chiffre qui représente le taux de croissance le plus rapide parmi les « trois grands » hyperscalers. Le backlog cloud a également augmenté de 55 % d'un trimestre à l'autre.

Des points de données tels que ceux-ci prouvent que la vague d’apprentissage automatique et d’IA permet à Google Cloud de connaître plus de succès qu’il n’en a connu auparavant. La proposition de Google de devenir le système d'exploitation pour l'IA d'entreprise a été renforcée cette semaine et son succès futur dépendra probablement de l'influence de ce message sur le nombre croissant d'utilisateurs qui adoptent l'IA pour travailler.

« Les entreprises ne se contentent pas de repenser les flux de travail, elles transforment leurs employés en bâtisseurs d'IA », a déclaré Kurian. « Nous vous proposons une pile intégrée avec la liberté de choisir les meilleurs puces et modèles au monde. Cette plate-forme est prête, alors que chacun d'entre vous va-t-il construire ? »

Photo : Robert Hof/SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine