Cinq réflexions du discours d'ouverture du PDG de Nvidia, Jensen Huang, au GTC Taipei 2026

L’intelligence artificielle utile est arrivée, et si le PDG de Nvidia, Jensen Huang a raison, elle est sur le point de remodeler non seulement les centres de données, mais aussi la structure de l’économie mondiale et le marché du travail technologique.

Dans son GTC Taipei 2026 Dans son discours d'ouverture, Huang a exposé sa vision de « l'ère des agents », des systèmes d'IA agentique qui ne se contentent pas de répondre aux questions, mais qui observent, raisonnent, planifient et agissent également au sein d'une infrastructure distribuée. Pour les responsables des technologies de l’information d’entreprise, le message clé était que le calcul est désormais directement convertible en revenus et que les choix architecturaux qu’ils feront au cours des prochaines années définiront à la fois la compétitivité et la structure des coûts dans un monde saturé d’IA.

Vous trouverez ci-dessous cinq points à retenir du discours d'ouverture de Huang :

1. L'« IA utile » est arrivée et elle est créatrice d'emplois

La première affirmation majeure de Huang était que l'industrie était allée au-delà de l'expérimentation pour produire un impact économique. « Aujourd’hui, nous pouvons dire que l’IA agentique est arrivée, que l’IA utile est arrivée », a-t-il déclaré au public de Taipei. Il a confirmé cela avec les données de GitHub : les commits ont presque triplé entre 2023 et début 2026, même si le nombre de développeurs professionnels n’a pas augmenté. Selon lui, les quelque 30 à 40 millions de développeurs de logiciels génèrent désormais beaucoup plus de résultats grâce aux copilotes IA.

Surtout, Huang a rejeté l’idée selon laquelle l’IA serait un destructeur net d’emplois. Soulignant l’augmentation massive de la productivité, il a fait valoir que l’économie se renforce d’elle-même : si chaque développeur peut désormais générer « 9 000 milliards de dollars de travail productif » pour 3 000 milliards de dollars de salaire, les entreprises voudront plus de développeurs, pas moins. « Les gens parlent de l’IA qui réduit les emplois – c’est complètement absurde », a-t-il déclaré. « Si vous pouvez embaucher un ingénieur logiciel et générer un travail productif d'une valeur de 9 000 milliards de dollars, pourquoi ne voudriez-vous pas embaucher davantage d'ingénieurs logiciels ? » Pour les directeurs de l’information et les directeurs de la technologie, cela considère l’IA non pas comme un levier de réduction des effectifs mais comme un multiplicateur de force pour des talents techniques déjà rares. Les entreprises connaissent une pénurie de personnel technique depuis des décennies, et l’IA peut contribuer à combler cet écart.

2. Les jetons sont désormais des unités rentables

Le deuxième point majeur à retenir est que l’unité économique centrale de l’IA a changé. Selon les mots de Huang, « les jetons sont désormais des unités de revenus rentables ». Une fois que l’on suppose que les jetons – les tranches de sortie du modèle qui alimentent les copilotes, les agents et les services génératifs – sont directement monétisables, la logique de l’industrie change : chaque jeton généré efficacement constitue un revenu supplémentaire, et chaque watt gaspillé est un manque à gagner.

Huang a directement lié cela au déséquilibre actuel entre l’offre et la demande dans le domaine du calcul haut de gamme. Parce que les services d’IA peuvent désormais être tarifés et mesurés en jetons, « les entreprises d’IA veulent créer beaucoup plus de jetons, générer beaucoup plus de jetons, construire plus d’usines d’IA, ce qui explique pourquoi la demande de calcul ici à Taiwan a explosé. » Il a clairement indiqué que la conception des centres de données est en train de devenir un exercice d’ingénierie financière : « Si vous disposez d’un gigawatt d’énergie, alors le débit par watt représente un chiffre d’affaires, car chaque jeton est rentable, chaque jeton constitue un chiffre d’affaires. »

Pour les fournisseurs de cloud et les entreprises qui construisent leurs propres clusters, cela implique de choisir des architectures qui maximisent le nombre de jetons par watt et minimisent le délai d'obtention du premier jeton, sous peine d'être définitivement en retard en termes d'économie unitaire. Cela peut sembler trop dramatique, mais dans le domaine de l’IA, un léger retard entraînera un écart croissant au fil du temps.

3. Agentic AI est le nouveau modèle d'application

Huang a passé une partie importante du discours à définir ce qu'il entend par « agent » et pourquoi cela est plus important que les applications traditionnelles. Dans l’ancien monde, du code s’exécutait dans une application sur un système d’exploitation. Dans le nouveau monde, « il s’agit d’un agent constitué d’un grand modèle de langage ou de plusieurs assis à l’intérieur d’un harnais, et cet harnais l’orchestre pour effectuer un travail productif ».

Ce harnais gère le cycle de vie du travail. Il comprend l'intention de l'utilisateur, observe le contexte, les raisons, les plans, appelle des outils et jongle entre la mémoire de travail et la mémoire à long terme, que ces outils soient des feuilles de calcul, des compilateurs, des bases de données ou des bibliothèques accélérées par CUDA. Huang l'a comparé à une personne dans un atelier : « Vous pouvez considérer le modèle comme le cerveau, le harnais comme le corps et les outils qu'il utilise pour travailler dans un environnement d'exécution. Pensez-y comme à un atelier. »

Il s'agit d'un modèle informatique fondamentalement désagrégé et distribué dans lequel différentes étapes de la boucle d'un agent activent des parties distinctes du centre de données, telles que les unités de traitement graphique pour la réflexion, les unités centrales de traitement pour les outils, les unités de traitement de données pour la sécurité, le stockage pour la mémoire et la structure pour l'orchestration. Pour les entreprises, le changement ne consiste pas seulement à adopter des interfaces de programmation d’applications à grand modèle de langage, mais également à repenser les systèmes, les flux de travail et même les organigrammes autour d’agents capables de posséder des processus métier entiers de bout en bout.

4. Usines IA et DSX : Nvidia en tant que société d'infrastructure IA

Si l’IA agentique est la nouvelle charge de travail, la nouvelle unité d’infrastructure est « l’usine à IA ». Huang a décrit les usines d’IA comme la plus grande construction d’infrastructures de l’histoire de l’humanité, avec des sites uniques se dirigeant vers 1 gigawatt et des coûts d’investissement « entre 50 et 60 milliards de dollars, et bientôt entre 80 et 100 milliards de dollars par gigawatt ». Ces installations doivent « fonctionner du premier coup, et elles doivent fonctionner immédiatement », car tout retard représente un capital inactif extrêmement coûteux.

Pour résoudre ce problème, Nvidia propose DSX, un modèle complet pour la conception et l'exploitation d'usines d'IA, couvrant la simulation dans Omniverse (DSX SIM), les opérations d'exécution (DSX OS) et l'optimisation de l'alimentation (DSX Max LPS et DSX Flex). L’idée est de co-concevoir les puces, les racks, les réseaux, l’alimentation, le refroidissement et les interactions avec le réseau en tant que système unique, puis de les valider dans un jumeau numérique avant « l’atterrissage d’un seul rack ».

Huang a clairement indiqué que cela marquait une autre transformation pour Nvidia. « Il y a longtemps, Nvidia était une société de GPU, mais au fil des années, nous avons évolué pour devenir une société de systèmes », a-t-il déclaré. Aujourd’hui, « Nvidia a vraiment commencé à se transformer encore une fois » en une société d’infrastructure d’IA qui aide ses clients à construire des usines d’IA entières, et pas seulement à acheter des serveurs. Pour les hyperscalers, les opérateurs de télécommunications et un nombre croissant de cloud régionaux, cela positionne Nvidia comme un partenaire stratégique dans l’architecture technique et économique de l’IA.

5. Vera Rubin et Vera CPU : matériel conçu pour la boucle agentique

Enfin, Huang a présenté Vera Rubin et les processeurs Vera en tant que plates-formes matérielles spécialement conçues pour l'ère agentique. Vera Rubin n'est pas un seul GPU ; il s'agit d'un système multi-rack à l'échelle d'un pod qui intègre des GPU de nouvelle génération, des processeurs Vera, des DPU BlueField, des LPU Grok, NVLink 72 et Spectrum-X dans une conception de rack sans câble pour maximiser le débit, la fiabilité et la vitesse d'assemblage. « Vera Rubin est l'entreprise la plus ambitieuse de l'histoire de notre entreprise », a-t-il déclaré, soulignant que ce qui prenait auparavant deux heures à assembler dans les racks Grace Blackwell prend désormais environ cinq minutes.

Du côté du processeur, Vera est présenté comme « le processeur pour les agents », avec une conception monolithique à 88 cœurs, des instructions par horloge élevées, une bande passante extrême par cœur, une mémoire LPDDR5X et une bande passante de structure conçue pour éliminer les goulots d'étranglement du processeur qui limitent l'utilisation du GPU. Historiquement, les processeurs étaient construits « pour les humains », loués par le cœur et mesurés en secondes ; Selon Huang, les agents « vivent dans un monde qui se déroule en nanosecondes » et sont impatients face aux appels d'outils et à l'accès aux bases de données. Les quatre piliers de conception qu'il a soulignés étaient les performances monothread, la bande passante par cœur, la bande passante totale et l'efficacité énergétique – ce dernier étant essentiel pour intégrer plus de processeur dans une enveloppe de puissance fixe sans voler de watts lors de la génération de jetons.

Huang a résumé la nouvelle division du travail : « Le CPU est désormais le chef d’orchestre et le GPU est l’orchestre. » Pour les entreprises, cela se traduit par un nouveau problème d'optimisation : concevoir des systèmes dans lesquels les CPU, les GPU, les DPU et le stockage sont adaptés aux besoins de latence et de débit des agents, plutôt que de traiter les CPU comme des bêtes de somme à usage général et les GPU comme des accélérateurs isolés.

Réflexions finales

Les keynotes de Jensen Huang sont devenues des émissions télévisées incontournables, quel que soit le fuseau horaire. Son message depuis Taipei est que l’histoire de l’IA a dépassé les preuves de concept et est entrée dans la production. Ce changement fait passer le récit de bits et d’octets à une discussion sur l’économie, l’architecture et la discipline opérationnelle. L'IA utile est ici. Cela crée plus de travail pour plus de personnes, et les gagnants seront ceux qui seront capables de transformer les jetons, les watts et les racks en un avantage commercial durable. Il est temps de reconnaître que les risques de ne pas monter dans le train de l’IA dépassent de loin les risques d’aller trop vite.

Zeus Kerravala est analyste principal chez ZK Research, une division de Kerravala Consulting. Il a écrit cet article pour SiliconANGLE.