Les données prêtes pour l'IA sont le chaînon manquant qui maintient l'IA d'entreprise bloquée en mode pilote

Les entreprises ont investi des milliards dans l'infrastructure d'intelligence artificielle (GPU, capacité cloud, outils de modélisation), mais la plupart des déploiements restent embourbés dans l'expérimentation plutôt que de générer une valeur commerciale mesurable. Le goulot d’étranglement n’est pas le calcul. Ce sont des données prêtes pour l’IA.

L’écart entre la possession de données et la disponibilité de données prêtes pour l’IA s’avère être l’obstacle déterminant de ce cycle d’infrastructure. Une enquête mondiale commandée par IDC sur l'état de préparation à l'IA a révélé que 94 % des responsables des technologies de l'information identifient la qualité des données comme le principal facteur de réussite de l'IA. Pourtant, la plupart des données d'entreprise restent non classifiées, non gouvernées et inadaptées aux charges de travail d'IA de production. Everpure Inc. et Nvidia Corp. ciblent conjointement ce problème grâce à une co-ingénierie qui couvre l'intelligence des données, la vectorisation et les pipelines d'inférence accélérés par GPU, selon Jason Hardy (photo, à droite), vice-président de la technologie de stockage chez Nvidia Corp.

« Il y a cette nervosité à s'engager pleinement – ​​cela a un coût, mais c'est aussi par où commencer », a déclaré Hardy. « Ils sont submergés, puis ils se figent en quelque sorte. Alors, là où nous aimons voir comment nous pouvons rationaliser cela, hé, réduisons cela à un chemin très ciblé, puis aidons à comprendre ce que cela signifie du point de vue de l'infrastructure, mais aussi du côté des données. « 

Hardy et Shawn Rosemarin (à gauche), vice-président de la R&D et de l'ingénierie client chez Everpure Inc., se sont entretenus avec Alison Kosik et Christophe Bertrand de theCUBE à Pure Accelerate 2026, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté du partenariat de co-ingénierie Everpure et Nvidia, du défi des données prêtes pour l'IA et de la manière dont le flux de données Everpure récemment annoncé réduit la préparation des données brutes de plusieurs mois à quelques minutes. (* Divulgation ci-dessous.)

Transformer les données brutes de l'entreprise en données prêtes pour l'IA

La thèse centrale du partenariat est qu'acheter des GPU sans résoudre le problème des données équivaut à construire une usine sans matières premières. Rosemarin a utilisé l’analogie du raffinage du pétrole brut pour illustrer pourquoi les données doivent être conservées, classées et vectorisées avant de pouvoir servir de matière première à une usine d’IA, notant que la plupart des données d’entreprise d’aujourd’hui sont l’équivalent des sables bitumineux – abondantes mais non raffinées.

« Cette matière première, ce sont les données », a déclaré Rosemarin. « Il ne s'agit pas de données prêtes pour l'IA. C'est donc vraiment le nœud du problème : quelle est la différence entre les données et les données prêtes pour l'IA qui nous permettent d'y penser à partir d'un terme de brut lourd ? À quoi ressemble le raffinement de l'état de vos données pour faire des données une matière première prête pour l'IA ? »

Selon les deux dirigeants, la réponse réside dans la recherche, la classification, la sécurisation, la vectorisation et l'indexation des données de l'entreprise avant de leur orienter un modèle. Everpure Data Stream automatise ce pipeline en intégrant l'intelligence des données, les bases de données vectorielles et le calcul accéléré par GPU dans une seule architecture, de sorte que l'inférence s'exécute sur un ensemble de données hautement contextuelles et organisées plutôt que sur une prolifération de silos déconnectés, a noté Rosemarin. Le rôle de Nvidia est de garantir que ses bibliothèques, ses conceptions de référence de réseau et de stockage sont co-conçues avec le logiciel d'Everpure afin que chaque GPU de l'usine reste occupé, a ajouté Hardy.

« J'ai acheté des GPU, je dois maintenant les renforcer avec le reste de l'infrastructure informatique pour pouvoir faire avancer cela », a déclaré Hardy. « L'investissement en lui-même n'est pas suffisant. C'est l'écosystème qui l'entoure qui est nécessaire pour avancer et obtenir, en fin de compte, ce résultat. »

Voici l'interview vidéo complète, qui fait partie de la couverture de Pure Accelerate 2026 par SiliconANGLE et theCUBE :

(* Divulgation : TheCUBE est un partenaire média payant pour Pure Accelerate 2026. Les sponsors de la couverture de l'événement theCUBE n'ont pas de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine