Honeycomb introduit des fonctionnalités d'observabilité des agents pour garder un œil sur la production

La startup d'observabilité full-stack Hound Technology Inc., qui exerce ses activités sous le nom de Honeycomb, a introduit un certain nombre de nouvelles mises à jour de plate-forme visant à enquêter sur l'activité des agents d'intelligence artificielle en production.

Les nouvelles fonctionnalités améliorées offrent une visibilité plus approfondie sur ce que font les agents IA pendant leur exécution, a indiqué la société. Les fonctionnalités améliorées incluent la chronologie de l'agent, l'agent Canvas et les compétences Canvas. Les équipes d'ingénierie peuvent les mettre en œuvre sans avoir besoin de kits de développement logiciel propriétaires ou de frameworks spécialisés.

«Les agents IA font désormais partie de l'équipe d'ingénierie», a déclaré la cofondatrice et directrice générale Christine Yen. « Mais pour le moment, la plupart des équipes ne peuvent pas voir ce que font ces agents en production : quels outils ils ont appelés, ce qu'ils ont décidé, s'ils ont amélioré ou pire les choses. »

Honeycomb a déclaré que ses nouvelles capacités améliorées visent à changer cette dynamique entre les agents et les équipes informatiques. Yen a ajouté qu'Honeycomb utilise son expertise déjà existante dans la conception d'observabilité centrée sur l'humain et l'utilise pour suivre le comportement des agents, qui se voient attribuer des rôles et des paradigmes d'utilisation d'outils similaires à ceux de leurs homologues humains.

La société a déclaré que les nouvelles mises à jour font apparaître une analyse des systèmes d’IA, y compris le comportement, les performances et les interactions des agents d’IA, ainsi qu’une visibilité plus approfondie des systèmes utilisant l’IA elle-même.

Agent Timeline fournit une vue unique qui connecte chaque appel de modèle de langage important, transfert d'agent et appel d'outil, comme l'affichage des e-mails, l'ouverture d'un éditeur de texte, l'appel du système de gestion de contenu, etc. Le tableau de bord permet aux utilisateurs de visualiser l'impact du système en aval en temps réel, permettant ainsi aux équipes d'ingénieurs de suivre l'activité, de reconstruire les chemins de décision des agents et de comprendre les échecs sans avoir besoin d'effectuer des analyses approfondies manuelles dans les journaux.

Honeycomb a récemment reconstruit Canvas, l'espace de travail collaboratif IA-humain de l'entreprise, qui agit désormais à la fois comme une interface de discussion et un agent autonome. Il permet aux équipes d'ingénierie de se plonger dans l'étude des problèmes d'observabilité à l'aide de requêtes simples en anglais et de produire des instantanés visuels de l'activité du système.

Pour renforcer les capacités de Canvas, la société a ajouté Canvas Skills, qui permettent aux équipes d'ingénierie d'enseigner aux agents IA les connaissances de routine et les meilleures pratiques de débogage sous forme de playbooks réutilisables pouvant s'exécuter de manière autonome. Cela signifie que lorsqu'un problème similaire survient à l'avenir, les ingénieurs n'ont pas besoin de rédiger de longues invites explicatives. L’agent IA utilise ces connaissances enseignées comme base pour explorer et enquêter, permettant ainsi à l’équipe d’ingénierie de poser des questions plus pointues sur les découvertes.

« Honeycomb a été conçu pour faire face aux « inconnues », à ces échecs imprévus qui défient la planification. » dit Yen.

Honeycomb a également ajouté des enquêtes automatiques, qui permettent aux ingénieurs de configurer Canvas pour qu'il lance automatiquement des enquêtes lorsqu'une alerte arrive. Au lieu d'attendre que l'équipe pose des questions, elle exécutera des playbooks contre les anomalies, collectera des données, créera et testera des hypothèses et suggérera des réponses, le tout avant même que l'équipe d'ingénierie n'atteigne ses terminaux.

La société a déclaré qu'Agent Timeline est désormais disponible en accès anticipé et sera généralement disponible dans quelques semaines. Les autres mises à jour sont immédiatement disponibles pour les clients à partir d'aujourd'hui.

Image : SiliconANGLE/Microsoft Designer

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine