Alors que l’adoption de l’intelligence artificielle s’accélère au sein des entreprises, les aspects économiques de l’IA générative obligent à repenser fondamentalement. Les coûts incontrôlables des jetons, les exigences de souveraineté des données et l’écart croissant entre les pilotes d’IA et le retour sur investissement de la production poussent les organisations à reconsidérer l’endroit où leurs modèles s’exécutent – et le type de modèles d’IA verticaux dont elles ont réellement besoin.
La réponse pointe de plus en plus vers une infrastructure sur site et des modèles d'IA verticaux spécialement conçus pour des secteurs spécifiques, plutôt que vers de grands modèles à usage général consommant des jetons à grande échelle dans le cloud, selon Satish Iyer (photo, à droite), vice-président et directeur technologique de l'innovation technologique et des écosystèmes chez Dell Technologies Inc.
« Notre ambition chez Dell (est) d'amener l'IA là où se trouvent les données client, aussi simple que cela », a déclaré Iyer à theCUBE, le studio de diffusion en direct de SiliconANGLE Media. » Il n'y a pas d'IA sans données, et la plupart des données d'entreprise restent sur site. Il est important pour nous de soutenir un parcours d'entreprise où nous pouvons nous assurer que les entreprises sont en mesure de tirer parti de l'IA pour obtenir les bons résultats au sein de leur entreprise sans se soucier du coût des jetons. «
Iyer et Sri Ambati (à gauche), fondateur et PDG de H2O.ai Inc., se sont entretenus avec Gemma Allen de theCUBE à Dell Technologies World, lors d'une diffusion exclusive sur theCUBE. Ils ont discuté des modèles d'IA verticaux, de l'économie des jetons, du déploiement souverain de l'IA et du partenariat Dell-H2O.ai pour l'activation de l'IA en entreprise. (* Divulgation ci-dessous.)
Les modèles d’IA verticaux alimentent la prochaine vague de retour sur investissement des entreprises
L’urgence derrière la conversation est réelle. Dell a dépassé plus de 5 000 déploiements d'usines d'IA dans le monde, les entreprises des services financiers, de la santé et des télécommunications étant en tête de l'adoption alors qu'elles recherchent des coûts prévisibles et un contrôle des données. La pression sur les dépenses en jetons est désormais une conversation au niveau de la salle de réunion, les principaux développeurs de H2O.ai brûlant 1 000 $ par jour en jetons – mais de nombreux utilisateurs génèrent un retour sur investissement beaucoup moins mesurable, selon Ambati.
« Il s'agit de savoir comment réaliser différentes pièces, les orchestrer dans différents écosystèmes, qu'il s'agisse de Gemini ou… de modèles OpenAI et de modèles open source », a déclaré Ambati. « Les modèles open source, qui fonctionnent sur une usine Dell AI, peuvent vous offrir cette prévisibilité pour votre consommation de jetons, ainsi que pour le prix des jetons. Certains de nos clients utilisent des milliards de jetons, des dizaines de milliards de jetons par jour. Nous avons déplacé près de la moitié d'entre eux vers Dell et H2O avec des modèles de langage réduits. «
L'approche de H2O.ai reflète une évolution plus large du marché vers des modèles d'IA verticaux qui combinent des capacités prédictives et génératives dans un cadre unique et spécifique à l'industrie. Le modèle de base tabulaire TabH2O récemment publié par la société est conçu pour fournir des prédictions sur des données d'entreprise structurées sans nécessiter de réglages coûteux de paramètres, a expliqué Ambati. La voie à suivre consiste à distiller de grands modèles en actifs plus petits et plus déployables qui peuvent fonctionner en périphérie – dans les opérations minières, les réseaux hospitaliers et les centres de contact – où les données sont générées et où les décisions doivent être prises localement, selon Ambati et Iyer.
« H2O a réalisé de nombreux modèles d'IA spécifiques à des secteurs verticaux, résolvant de nombreux problèmes spécifiques à l'industrie », a déclaré Iyer. « Pour eux, tirer parti de notre AI Factory pour créer certains de ces modèles verticaux et résoudre certains des problèmes verticaux est un excellent moyen pour nous d'activer l'entreprise. »
Voici l'interview vidéo complète, faisant partie de la couverture par SiliconANGLE et theCUBE de Dell Technologies World 2026 :
(* Divulgation : TheCUBE est un partenaire média payant pour Dell Technologies World 2026. Les sponsors de la couverture de l'événement theCUBE n'ont pas de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)