La spécification FinOps FOCUS devient le langage commun pour la responsabilité des coûts de l'IA

Alors que l’intelligence artificielle génère une nouvelle vague de dépenses basées sur des jetons dans les environnements cloud et sur site, les entreprises découvrent qu’il est plus difficile que jamais de comprendre ce qu’elles doivent réellement – ​​et à qui –. La spécification FinOps FOCUS apparaît comme la norme ouverte qui offre aux praticiens le langage de données partagé pour éviter le chaos de la facturation multi-fournisseurs.

La fragmentation des données de coût et d'utilisation entre les fournisseurs de cloud constitue depuis des années une taxe discrète pour les équipes FinOps, obligeant les praticiens à créer des pipelines de normalisation sur mesure avant de pouvoir commencer toute analyse. Cette douleur est un terrain familier pour Karl Kraft (photo), directeur principal de l'ingénierie logicielle chez Walmart Inc., qui a contribué à la spécification FOCUS depuis sa première ébauche pré-1.0 et aide désormais à orienter son développement continu.

« Lorsque j'ai rejoint le cabinet FinOps avant qu'il ne s'appelle FinOps, j'ai reçu des fichiers Excel de nos coûts et de notre utilisation de la part de nos fournisseurs de services cloud, deux fournisseurs de services cloud différents », a déclaré Kraft. « Je l'ai regardé et je me suis demandé : qu'est-ce que je vais faire avec ça ? … Je ne veux pas que tout le monde doive subir cette douleur encore et encore. »

Kraft s'est entretenu avec John Furrier et Paul Nashawaty de theCUBE lors de FinOps X 2026, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont expliqué comment la spécification FOCUS réduit les obstacles à la répartition des coûts multi-cloud, accélère la rétrofacturation à grande échelle et prépare les entreprises à prendre en compte l'économie des jetons d'IA. (* Divulgation ci-dessous.)

La spécification FinOps FOCUS débloque la rétrofacturation et la clarté des coûts de l'IA

La spécification FOCUS résout un problème d'une simplicité trompeuse : faire en sorte que les données de coûts parlent le même dialecte, quel que soit le fournisseur qui les a générées. Un exemple pratique est la façon dont FOCUS gère la tarification amortie basée sur l’engagement. Plutôt que de faire apparaître des frais mensuels forfaitaires que les équipes ne peuvent pas allouer, la spécification introduit une colonne de coûts efficace qui répartit un abonnement forfaitaire sur la consommation quotidienne afin que les équipes individuelles voient exactement ce qu'elles ont utilisé, a expliqué Kraft.

« Il y a le coût effectif : c'est une nouvelle colonne », a-t-il déclaré. « Je peux voir au fil du mois que mes 30 000 $ représentent mille dollars par jour et qui les consomme chaque jour, plutôt que simplement un gros coût initial qui… Je ne sais pas quoi en faire. »

Cette même logique s'étend aux charges de travail Kubernetes. La spécification FOCUS 1.3 a introduit une répartition des coûts définie par le fournisseur, permettant aux fournisseurs de cloud d'exposer les données de coûts au niveau des pods de manière native dans le flux de facturation plutôt que d'obliger les équipes à instrumenter elles-mêmes les projets open source, a noté Kraft. Le cycle de développement étant désormais ouvert sur la version 1.5, le groupe de travail sur la spécification FOCUS cible un ensemble de données de tarification unitaire de stockage pour standardiser la façon dont les fournisseurs de cloud communiquent les options de tarification – un domaine dans lequel même un seul fournisseur peut aujourd'hui faire apparaître trois variantes d'ensemble de données contradictoires.

L’IA accélère à la fois l’urgence et l’ambition de la feuille de route. La communauté FOCUS a introduit des directives pour les contributeurs pour les agents d'IA dans son propre flux de développement, les utilisant pour faire apparaître des incohérences subtiles dans une spécification trop volumineuse pour qu'un seul contributeur puisse la conserver en mémoire. À l’avenir, la version 1.5 inclura des fonctionnalités conçues pour répartir les dépenses en IA par type de jeton et charge de travail, offrant ainsi aux praticiens la granularité dont ils ont besoin pour lier les coûts d’inférence des modèles aux équipes qui les consomment.

« Il y a FinOps pour l'IA et il y a l'IA pour FinOps », a déclaré Kraft. « FOCUS est une nomenclature commune qui va vraiment aider les agents à exceller et à traiter les données. »

Voici l'interview vidéo complète, qui fait partie de la couverture de FinOps X 2026 par SiliconANGLE et theCUBE :

(* Divulgation : TheCUBE est un partenaire média payant pour FinOps X 2026. Les sponsors de la couverture de l'événement theCUBE n'ont pas de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine