Anthropic laisse les agents de Claude « rêver » pour qu'ils ne dorment pas au travail

Anthropic PBC a déclaré aujourd'hui qu'elle donnait à ses agents d'IA la capacité de « rêver » et de se souvenir des interactions passées et du travail qu'ils ont effectué afin de pouvoir identifier les erreurs récurrentes et s'améliorer au fil du temps.

Dans une mise à jour annoncée lors de la conférence des développeurs Code with Claude, Anthropic a déclaré qu'elle donnait aux agents gérés de Claude une nouvelle capacité de « rêver ». Il ne s'agit pas de mettre ses agents d'intelligence artificielle au lit, mais plutôt de leur permettre de passer en revue les événements récents et d'identifier des souvenirs utiles qui méritent d'être stockés dans leur mémoire pour éclairer les tâches et interactions futures.

Les agents gérés d'Anthropic offrent aux développeurs une alternative à la création d'agents IA directement sur l'API Messages. La société le décrit comme un « faisceau d'agents prédéfinis et configurables » qui fonctionne sur une infrastructure entièrement gérée et affirme qu'il est destiné aux situations dans lesquelles plusieurs agents travaillent sur le même projet ou la même tâche sur une période de quelques minutes ou heures.

Quant au rêve, il s'agit d'un processus planifié qui permet aux agents de revoir les sessions précédentes et leurs réserves de mémoire, d'en extraire des modèles, puis de conserver des souvenirs qui pourraient être utiles à l'avenir. Les utilisateurs peuvent décider à quelle fréquence ils souhaitent que leurs agents rêvent, et ils peuvent également choisir si l'agent est autorisé à mettre à jour sa mémoire automatiquement ou s'ils souhaitent vérifier les modifications apportées avant leur mise en œuvre.

Il s'agit d'une fonctionnalité intéressante car les grands modèles de langage comme Claude ont du mal à gérer des fenêtres de contexte limitées, ce qui signifie que des informations importantes peuvent être perdues lorsque les agents qu'ils alimentent travaillent sur de longues tâches. Dans les chatbots de base, la plupart des modèles utilisent un processus appelé « compactage », dans lequel ils analysent périodiquement de longues conversations et tentent d'identifier uniquement les informations les plus pertinentes à conserver comme contexte. Mais ce processus se limite à des conversations uniques avec des agents uniques.

Le rêve, en revanche, permet d’analyser les sessions passées et les réserves de mémoire par plusieurs agents d’IA, afin qu’ils puissent tous conserver les souvenirs les plus importants.

« Le rêve fait apparaître des modèles qu'un seul agent ne peut pas voir seul, notamment des erreurs récurrentes, des flux de travail sur lesquels les agents convergent et des préférences partagées au sein d'une équipe », a expliqué Anthropic dans un article de blog. « Il restructure également la mémoire afin qu'elle reste à un signal élevé au fur et à mesure de son évolution. Ceci est particulièrement utile pour les travaux de longue durée et l'orchestration multi-agents. »

Résultats et orchestration multi-agents

La capacité de rêve est actuellement en phase de recherche, ce qui signifie que les développeurs devront demander l'accès à la nouvelle fonctionnalité et devront peut-être attendre avant d'être approuvés. Cependant, la société a déclaré qu'elle rendrait également plus largement disponibles deux fonctionnalités qui étaient auparavant en avant-première à partir d'aujourd'hui.

Le premier d’entre eux concerne les « résultats », qui sont une nouvelle astuce conçue pour aider les agents d’IA à se concentrer sur leur intention. Comme l'explique Anthropic, « les agents font de leur mieux lorsqu'ils savent à quoi ressemble le « bien » » et les résultats permettent de le leur montrer avec des exemples spécifiques.

Les utilisateurs peuvent créer un exemple de résultat idéal pour chaque tâche qu'ils assignent à un agent IA. Ensuite, un « agent de notation » distinct évaluera les résultats de l'agent sur la base de cet exemple pour s'assurer qu'ils sont conformes aux normes attendues. Selon Anthropic, cette fonctionnalité devrait être particulièrement utile pour les agents travaillant sur des tâches qui nécessitent « plus d'attention aux détails et une couverture exhaustive ». Cela devrait également être utile pour les travaux où la qualité des résultats est plus subjective, par exemple lorsqu'un agent tente de reproduire la voix d'une marque dans un blog ou une publication sur les réseaux sociaux.

Anthropic a déclaré que ses propres tests et les premiers utilisateurs montrent que l'utilisation des résultats améliore la réussite des tâches jusqu'à 10 points par rapport à la simple utilisation d'invites standard, sans aucun exemple.

La deuxième nouvelle fonctionnalité largement disponible aujourd'hui est « l'orchestration multi-agents », qui permet aux agents gérés de diviser des tâches complexes en tâches plus petites et de demander à un agent principal de les affecter à différents sous-agents. Lorsque les utilisateurs feront cela, ils pourront consulter la console Claude pour voir exactement ce que chaque sous-agent a fait pour accomplir une tâche et examiner attentivement les processus et les résultats de chacun.

Ces nouvelles fonctionnalités sont désormais disponibles dans la version bêta publique de Managed Agents. Dans une dernière mise à jour, la société a annoncé qu'elle doublerait également les limites d'utilisation actuelles de cinq heures pour les abonnés Pro et Max, de sorte qu'ils disposent désormais de 10 heures.

Anthropic laisse les agents de Claude « rêver » pour qu'ils ne dorment pas au travail

Résultats et orchestration multi-agents

Image en vedette : SiliconANGLE/Microsoft Designer