La startup de sécurité de l'intelligence artificielle générative Portal26 Inc. a annoncé aujourd'hui le lancement d'un nouveau module conçu pour freiner la consommation incontrôlée de jetons par les agents d'IA autonomes, un problème qui, selon la société, entraîne des coûts imprévisibles et une instabilité opérationnelle dans les entreprises qui déploient des flux de travail agentiques.
Le nouveau module permet aux administrateurs de définir des budgets de jetons pour des agents individuels, des flux de travail spécifiques ou pour l'ensemble de l'organisation. Les agents qui s'approchent d'un plafond sont limités et ceux qui le franchissent peuvent être mis en pause ou carrément tués.
Portal26 soutient que les agents autonomes en plusieurs étapes construits sur de grands modèles de langage peuvent involontairement entrer dans des boucles récursives, surinterroger les systèmes ou étendre les tâches au-delà de leur portée d'origine, conduisant à une utilisation exponentielle des jetons et à des factures surprises. L'entreprise présente le nouveau module comme le premier outil dédié à la gestion des risques à l'échelle de l'entreprise.
« L'IA agentique est puissante, mais sans contrôle des coûts, elle peut rapidement devenir coûteuse et chaotique », a déclaré le directeur général Arti Raman. Il a cité Uber Technologies Inc. comme exemple d'entreprise qui a découvert que « la vitesse d'adoption et la prévisibilité des coûts sont sur une trajectoire de collision », et a déclaré que le nouveau module donne aux clients une télémétrie pour faire évoluer les agents « sans se réveiller avec une facture qu'ils n'avaient pas prévue ».
Parallèlement à la couche d'application, le module offre une visibilité en temps réel sur où et comment les jetons sont dépensés dans les systèmes agentiques, avec des protections adaptatives qui interviennent automatiquement à l'approche des limites. Les contrôles visent à faire de la prévisibilité des coûts une valeur par défaut plutôt qu'un exercice financier post-hoc.
La consommation de jetons est devenue un problème croissant à mesure que de plus en plus d'entreprises passent des déploiements expérimentaux d'IA générative à des systèmes agentiques de production qui enchaînent les appels de modèles entre les tâches. Chaque appel entraîne un coût et les agents qui bouclent ou étendent la portée peuvent rapidement multiplier ce coût sans déclencher les contrôles budgétaires traditionnels.
Ce lancement fait suite au récent déploiement par Portal26 d'outils de gestion agent plus larges axés sur la sécurité de l'IA et la mesure de la valeur commerciale. Pakshi Rajan, responsable des produits et de l'IA chez Portal26, a noté que le nouveau module est « plus que des contrôles de coûts » et représente « une couche fondamentale pour des opérations d'IA responsables ».