Grafana tente de combler le déficit d'observabilité de l'IA avant que les agents d'entreprise ne règnent en maître

La startup d'observabilité Grafana Labs Inc. a déclaré aujourd'hui qu'elle tentait de mettre en lumière le fonctionnement interne de la « boîte noire » des modèles d'intelligence artificielle avec le lancement de nouvelles fonctionnalités qui permettront aux entreprises de mieux leur faire confiance et de les contrôler en production.

L'annonce a eu lieu lors de la conférence annuelle des utilisateurs de Grafana, GrafanaCON 2026 à Barcelone, où elle a également révélé la création d'une « organisation IA » dédiée qui sera dirigée par son nouveau directeur de l'IA Mat Ryer.

Grafana a déclaré qu'un grand nombre d'entreprises s'efforcent d'intégrer des agents d'IA dans leurs flux de travail en vue d'améliorer l'automatisation, mais que cela présente de nombreux défis en termes d'observabilité. Tout d’abord, le comportement des applications d’IA est très différent des logiciels traditionnels qui ont permis à Grafana de s’imposer comme un acteur majeur de l’observabilité.

Parce qu'ils fonctionnent très différemment, les outils de surveillance existants ont du mal à fournir beaucoup d'informations sur les agents, ce qui les rend difficiles à déboguer. De plus, les développeurs se retrouvent souvent constamment à basculer entre les environnements de codage tels que GitHub Copilot et Cursor et les outils d'observabilité qu'ils utilisent pour garder un œil sur leur code en production.

La solution de la startup consiste à traiter les sessions d'agent et les conversations de grands modèles de langage comme des signaux de télémétrie standard, similaires aux journaux, métriques et traces associés aux applications traditionnelles. L'idée est que les utilisateurs pourront surveiller les performances des agents dans le contexte de leur infrastructure informatique plus large.

La nouvelle mise à jour la plus importante est une nouvelle capacité d'observabilité de l'IA qui est lancée aujourd'hui en avant-première publique dans Grafana Cloud. Il est chargé d'observer le comportement des agents d'IA, y compris leurs entrées, sorties et flux d'exécution, afin que ceux-ci puissent être surveillés en permanence pour détecter les réponses de mauvaise qualité, les violations de politique et autres activités anormales. Selon Grafana, il est capable de faire apparaître des risques tels que l'exposition de données ou la fuite d'informations d'identification beaucoup plus rapidement que les outils d'observabilité existants non conçus pour les agents d'IA.

Les développeurs apprécieront probablement le nouvel outil de ligne de commande Grafana Cloud CLI, ou GCX, qui est une nouvelle « interface agent » conçue pour vivre là où ils travaillent. Ainsi, plutôt que d'avoir à passer de leur environnement de développement intégré à un tableau de bord Grafana, ils peuvent utiliser GCX pour appeler l'assistant Grafana directement dans des environnements comme Claude Code ou GitHub Copilot. L'idée est de créer un « cycle de rétroaction continu », dans lequel les développeurs peuvent surveiller en permanence leurs agents d'IA en production, corréler les alertes et recevoir des suggestions de correctifs de code en temps réel.

En back-end, Grafana explique qu'elle remanie son moteur d'observabilité principal pour mieux gérer les volumes massifs de données générés par les systèmes d'IA. L'objectif principal ici est l'outil d'agrégation de journaux de Grafana, qui a été mis à jour vers Grafana Loki Evolution. Loki a été reconstruit à partir de zéro sur une architecture basée sur Apache Kafka et est livré avec un nouvel outil de planification de requêtes qui accélère de dix fois les performances sur les requêtes agrégées tout en analysant 20 fois moins de données.

Grafana met également son outil Grafana Assistant basé sur l'IA à la disposition d'un plus grand nombre d'utilisateurs. Auparavant limité à Grafana Cloud uniquement, l'acolyte IA est désormais intégré aux déploiements Grafana Enterprise sur site pour répondre aux clients ayant des exigences strictes en matière de confidentialité des données. Il bénéficie également de nouvelles fonctionnalités telles qu'un « espace de travail assistant » pour les interactions en plein écran et une « API assistant » qui peut extraire les informations de Grafana dans des outils tiers.

Enfin, en clin d'œil à la communauté open source, Grafana a publié un nouvel outil de benchmarking appelé o11y-bench. Il est destiné à mesurer dans quelle mesure les agents d'IA effectuent diverses tâches du monde réel, telles que réparer le tableau de bord défectueux d'une application ou enquêter sur une panne, par rapport à une pile Grafana en direct. Selon l'entreprise, il s'agit d'un « test de QI » standardisé qui mesure l'efficacité des agents d'observabilité de l'IA.

Même si cela n'a pas été dit, les mises à jour d'aujourd'hui illustrent la vision à long terme de Grafana. Si les agents d’IA veulent commencer à gérer des entreprises à grande échelle, ils auront besoin d’un superviseur. En formant une unité dédiée à l'IA, chargée de « coordonner le travail sur l'observabilité de l'IA, les expériences des assistants et les flux de travail pilotés par les agents », Grafana est déterminée à assumer ce rôle avant que quelqu'un d'autre n'intervienne.