Non content de fournir l'infrastructure pour la prochaine génération d'agents d'intelligence artificielle, Nvidia Corp. fournit également aux développeurs les outils nécessaires pour les créer.
Lors du Nvidia GTC Taipei 2026, parallèlement à la conférence Computex, la société a dévoilé la dernière itération de son Agent Toolkit. Il s'agit d'une suite complète de logiciels, de modèles et de plans open source permettant de créer des collaborateurs numériques puissants et durables, capables d'exécuter des flux de travail complexes dans les opérations commerciales, les tâches d'ingénierie et de cybersécurité.
Le Nvidia Agent Toolkit est censé être une pile de base ouverte et accessible qui fournit tout ce dont les développeurs ont besoin pour transformer de puissants modèles frontières en agents d'IA entièrement fonctionnels. La suite comprend une sélection de modèles hautement optimisés et un environnement d'exécution sécurisé qui tente de réduire les frictions qui ont empêché de nombreuses entreprises de déployer des agents d'IA à grande échelle.
Bien que les grands modèles de langage se soient révélés être des assistants de codage et des concepteurs graphiques performants, ils ont tendance à avoir des difficultés lorsqu'ils tentent d'assumer des tâches commerciales et opérationnelles plus complexes. L'un des principaux défis pour les développeurs est de créer une sorte de couche d'orchestration, souvent appelée « harnais », qui gère la mémoire du modèle pour préserver le contexte au cours des sessions de plusieurs jours, permet aux agents d'utiliser des outils tiers et de collaborer avec d'autres agents.
Il y a aussi les problèmes de sécurité créés par les agents IA. Lorsque les organisations donnent aux agents autonomes la liberté d'accéder aux fichiers sensibles, d'apporter des modifications au code de leur application et de créer leurs propres sous-agents pour décharger les tâches, cela introduit des risques de sécurité massifs qui ne peuvent être maîtrisés par les politiques d'entreprise logicielles traditionnelles.
Tels sont les défis que Nvidia cherche à relever, en fournissant aux développeurs une gamme de blocs de construction open source qui leur permettent de créer le harnais agent dont ils ont besoin. Grâce à Agent Toolkit, les développeurs pourront orchestrer et sécuriser en toute sécurité les collaborateurs numériques à grande échelle.
Jensen Huang, directeur général de Nvidia, a déclaré que si la révolution de l'IA que tout le monde imagine devait se produire, les agents d'IA doivent disposer d'un moyen d'opérer au sein des systèmes où le travail de l'entreprise est effectué.
Le cœur d'Agent Toolkit est Nvidia NemoClaw, un nouveau framework qui sert de modèle principal pour la création de couches d'orchestration agentique. Avec NemoClaw, les développeurs ont accès à des modèles prêts à l'emploi qui structurent la manière dont leurs agents planifient, raisonnent, exécutent et délèguent les tâches qui leur sont demandées.
« NemoClaw fournit aux développeurs de logiciels d'entreprise les éléments de base ouverts pour créer des collaborateurs IA plus sécurisés et plus durables qui amplifient l'expertise humaine à mesure qu'ils remodèlent la façon dont le travail est effectué », a expliqué Huang.
Un autre composant clé est le Nemotron 3 Ultra de Nvidia, un nouveau modèle massif de 550 milliards de paramètres composé d'experts spécialement conçu pour les agents autonomes de longue durée. Selon Nvidia, il permet un raisonnement de pointe dans les flux de travail de codage et de recherche, avec des vitesses d'inférence jusqu'à cinq fois plus rapides et des coûts de fonctionnement 30 % inférieurs à ceux des modèles frontières comparables de sa catégorie.
Nvidia souhaite que les développeurs exécutent ces agents dans OpenShell Secure Runtime, qui est un environnement de conteneur sécurisé prenant en charge des contrôles de sécurité et de confidentialité personnalisés. Le runtime OpenShell a été développé en collaboration avec Microsoft Corp., Canonical Ltd. et Red Hat d'IBM Corp. et s'intègre aux primitives de sécurité natives de Windows pour garantir que les agents IA resteront sous le contrôle total de leurs utilisateurs et éviteront les comportements dangereux. Grâce au runtime, les développeurs peuvent masquer intelligemment les données sensibles avant d'envoyer des requêtes aux modèles basés sur le cloud, et garantir que les charges de travail les plus sensibles sont acheminées vers le matériel local uniquement.
Enfin, Nvidia a introduit un certain nombre de bibliothèques CUDA-X en tant que « compétences d'agent » réutilisables, permettant aux agents d'accéder à une gamme de fonctionnalités spécialisées sans avoir besoin de suivre au préalable une formation approfondie. Les compétences plug-and-play incluent cuDF, qui permet aux agents de traiter rapidement des ensembles de données structurés massifs et de raisonner sur leurs conclusions, et cuOpt, qui donne aux agents la capacité de résoudre des problèmes complexes liés au routage, à la planification, à la chaîne d'approvisionnement, à l'allocation des ressources et à l'optimisation des décisions en temps réel.
D'autres compétences incluent AI-Q, qui intègre un routage intelligent avec un contexte persistant et une évaluation intégrée pour les flux de travail de recherche d'entreprise ; NeMo, pour accélérer l'optimisation, l'évaluation et la gouvernance des agents ; PhysicsNeMo, permettant aux agents d'entreprendre des simulations scientifiques et techniques complexes ; et CUDA-Q, qui peut donner aux agents les connaissances dont ils ont besoin pour générer, tester et installer des programmes quantiques, simuler des systèmes informatiques quantiques et orchestrer des applications quantiques.
Nvidia a partagé ce qu'un certain nombre de premiers utilisateurs ont fait avec la nouvelle boîte à outils d'agent. Par exemple, la société de logiciels de conception de semi-conducteurs Cadence Design Systems Inc. a utilisé OpenShell pour déployer un super agent ChipStack AI capable de vérifier automatiquement les nouvelles conceptions de puces, Nvidia étant le premier client à utiliser cet agent. Siemens AG a utilisé cette boîte à outils pour développer un agent Fuse EDA capable d'orchestrer des flux de travail multi-outils dans la conception de cartes de circuits imprimés.
En plus de l’ingénierie, d’autres utilisent des agents d’IA pour automatiser les charges de travail de cybersécurité. Par exemple, CrowdStrike Holdings Inc. a développé un certain nombre d'agents basés sur le modèle NemoTron 3 Ultra de Nvidia pour identifier et corriger en permanence les vulnérabilités de sécurité. Un autre client est Palantir Technologies Inc., qui a intégré plusieurs modèles d'IA dans sa plateforme Forward Deployed Engineer pour créer des systèmes autonomes et isolés qui apprennent en permanence de leurs interactions précédentes.
Nvidia a déclaré que le framework NemoClaw est aujourd'hui mis à la disposition des développeurs, tandis que le runtime OpenShell est actuellement accessible en avant-première. Nemotron 3 Ultra devrait être lancé le 4 juin et sera disponible en tant que microservice Nvidia NIM via Hugging Face, ModelScope et OpenRouter, ainsi que sur la propre plate-forme Build de Nvidia. Les compétences d'agent CUDA-X sont également disponibles dès maintenant via la place de marché Claude Code et le Hermes Skills Hub.