Everpure accélère les charges de travail d'IA avec Data Stream et dévoile une vision architecturale de la primauté des données

La société de stockage Big Data Everpure Inc., anciennement connue sous le nom de Pure Storage, repense les architectures de données d'entreprise pour faciliter un meilleur accès et une meilleure évolutivité pour les charges de travail d'intelligence artificielle.

Lors de sa conférence annuelle clients, Pure Accelerate, la société a annoncé aujourd'hui la disponibilité immédiate d'Everpure Data Stream, qui permet de transformer les données brutes et non structurées afin que les entreprises puissent les intégrer plus facilement dans les modèles d'IA.

Parallèlement à Data Stream, la société a dévoilé Everpure Data Intelligence pour simplifier la découverte et la classification des données, ainsi que des améliorations significatives des performances de sa plateforme Enterprise Data Cloud. Ces annonces signalent un changement fondamental de stratégie pour Everpure, qui exhorte les clients à abandonner leurs anciennes architectures de données centrées sur les applications au profit d'un nouveau modèle de « primauté des données ».

Charles Giancarlo, président et directeur général d'Everpure, a présenté les nouvelles offres dans un article de blog, dans lequel il a expliqué que le plus grand obstacle pour l'IA d'entreprise ne réside plus dans les modèles, mais dans la complexité des pipelines de données nécessaires pour les alimenter en informations. Il cite une enquête récente d'International Data Corp., qui révèle que 94 % des responsables des technologies de l'information considèrent la qualité des données comme le facteur ultime lorsqu'il s'agit de tirer de la valeur de l'IA.

Avec Everpure Data Stream, l'entreprise s'attaque au problème de l'accès aux données avec un nouveau moteur qui automatise la préparation des données brutes afin de réduire les temps d'ingestion de plusieurs mois à quelques minutes. Dans le même temps, la nouvelle plate-forme appliquera des contrôles d'accès au niveau du flux de données pour garantir la sécurité des données propriétaires.

La société a expliqué que Data Stream s'appuie sur la conception de référence AI Data Platform de Nvidia Corp., remplaçant les processus d'ingestion de données traditionnels et fortement manuels par un pipeline accéléré par l'unité de traitement graphique qui s'étend jusqu'à l'étape d'inférence. Giancarlo a déclaré que cette architecture permet à la fois au calcul et au stockage d'évoluer indépendamment les uns des autres, garantissant que les clusters GPU ne seront jamais privés de données, résolvant ainsi un problème clé lié à l'efficacité du calcul. Il est activé par les systèmes de stockage FlashBlade d'Everpure, notamment FlashBlade//S et FlashBlade/EXA, qui, selon Giancarlo, peuvent transmettre des données à un débit extrêmement rapide de 800 gigaoctets par nœud, éliminant une fois pour toutes la mise au ralenti du GPU.

Cette décision s'aligne sur un changement plus large dans l'industrie du stockage, tous les principaux acteurs cherchant à se concentrer davantage sur les données et moins sur l'endroit où se trouvent les bits, a déclaré Steve McDowell de NAND Research à SiliconANGLE. Il a expliqué que l'infrastructure de données intelligente de NetApp Inc. et la plate-forme de données IA de Dell sont des exemples antérieurs de cette tendance, qui consiste à garantir que l'IA obtienne suffisamment de données pour maintenir son rythme de travail incessant. « Pure a mis un gros enjeu sur le terrain avec son changement de marque plus tôt cette année », a déclaré McDowell. « Les annonces d'aujourd'hui sont les premiers vrais produits alignés sur sa nouvelle mission.

Robert Lee, directeur technologique d'Everpure, a déclaré que les futures architectures de données d'entreprise nécessiteront une plate-forme unifiée qui permettra aux entreprises de commencer par des projets plus petits avant de passer à l'échelle pour gérer des exaoctets de données. « Everpure résout ce défi en fournissant un pipeline de données fiable, sécurisé et hautes performances qui accélère l'obtention de résultats pour les données d'une entreprise », a-t-il déclaré.

L’architecture de primauté des données

Les performances du pipeline ne représentent qu’une partie de l’équation lorsqu’il s’agit de rationaliser l’accès aux données d’IA, c’est pourquoi Everpure a également lancé une nouvelle technologie appelée Everpure Data Intelligence. Il est basé sur les capacités d'une société appelée 1touch.io Inc., qui a été acquise il y a un peu plus de trois mois lorsqu'Everpure a annoncé son changement de nom.

1touch.io a vendu une plate-forme appelée Kontxtual, qui est utilisée pour analyser les infrastructures de données sur site et les environnements cloud des entreprises afin de créer un inventaire complet de leurs actifs de données, ainsi que des descriptions de chacun d'entre eux.

La couche Everpure Data Intelligence est destinée à remédier à la fragmentation sémantique des données d'entreprise en découvrant, classant et contextualisant les informations structurées et non structurées à leur source. Il fonctionne en mappant les dépendances dans un graphe de connaissances sémantique universel, auquel les agents d'IA autonomes peuvent ensuite accéder via le Model Context Protocol pour obtenir un contexte en temps réel sur tout ce sur quoi ils travaillent. Selon Giancarlo, cela a pour effet de minimiser les coûts des jetons d'IA tout en réduisant les risques de non-conformité, car cela applique également une gouvernance automatisée pour protéger les actifs sensibles tels que les informations personnellement identifiables.

McDowell estime qu'Everpure Data Intelligence sera l'annonce la plus marquante d'aujourd'hui. « Il donne instantanément à l'entreprise des capacités de connaissance des données, ainsi que l'ingestion automatisée des données fournies par Data Stream, qui égalent ou dépassent les capacités de ses concurrents », a-t-il expliqué. « 1touch.io a été une acquisition solide par Everpure et elle génère des retours immédiats. Data Intelligence place l'entreprise sur une base solide pour les besoins souverains en données d'IA, tout en ajoutant les détails contextuels qui sont si importants pour les flux de travail d'IA agentique. »

Everpure a également annoncé une série de mises à jour de la plateforme Enterprise Data Cloud. Par exemple, il bénéficie d'un coup de pouce avec Evergreen//One Overdrive, qui sera lancé au troisième trimestre et offrira une amélioration des performances de 25 % pour le stockage sur site lors des pics de trafic. Il existe également un nouveau plan de contrôle intelligent qui permet l'exécution de flux de travail copilote en langage naturel, une meilleure détection des cyber-anomalies et un rééquilibrage automatique de la charge de travail. Lorsque ce projet sera lancé plus tard dans l'année, il permettra aux entreprises de remplacer la gestion réactive du stockage par un système auto-optimisé, a indiqué la société. Enfin, il a introduit la prise en charge des machines virtuelles natives sur Microsoft Azure.

Cette dernière est une décision particulièrement intéressante de la part d'Everpure, car elle semble adopter une approche beaucoup plus mesurée que l'un de ses principaux concurrents, NetApp, qui a bâti une forte présence dans le stockage cloud grâce à la disponibilité de son service de stockage ONTAP sur les plateformes de cloud public, a déclaré McDowell. « Les machines virtuelles natives Azure permettent aux clients du cloud hybride d'Everpure de déplacer des charges de travail gourmandes en données vers Azure sans refactoriser le stockage sous-jacent, éliminant ainsi la difficulté liée à la migration des données », a expliqué l'analyste. « C'est une capacité puissante pour les entreprises qui en ont besoin. »

Giancarlo a déclaré que l'émergence de l'IA souligne sa conviction que les applications logicielles ne devraient pas être le centre de gravité des architectures informatiques. La plupart des entreprises ont adopté une conception centrée sur les applications, ce qui a entraîné une prolifération massive des applications avec des définitions de données cloisonnées et un processus d'extraction lent et coûteux qui conduisent à des performances d'IA inférieures.

« L'IA bouleverse complètement la hiérarchie informatique traditionnelle ; les entreprises qui ne passent pas d'une approche centrée sur les applications à une primauté des données prendront du retard », a-t-il soutenu. « Les données étant l'actif principal d'une entreprise, l'intégration du contexte, de la sémantique et de la gouvernance directement au niveau de la couche de données est le bon moyen de réduire la fragmentation des données. »

Giancarlo estime que la transition vers un cadre de primauté des données devrait devenir une priorité majeure pour les entreprises. « Les données d'une entreprise constituent désormais un corpus croissant de renseignements dont la valeur stratégique dépasse de loin les applications qui les ont créées », a-t-il ajouté. « Tout le monde parle de l'importance des données. Il est désormais temps de donner la priorité aux données, et tout le reste suivra. »