La spécification FOCUS examine l'économie des jetons d'IA alors que la complexité de la facturation de l'IA atteint une nouvelle frontière

L’économie des jetons d’IA crée une crise de normalisation des données dans l’ensemble de la pile technologique alors que les entreprises s’efforcent d’appliquer des contrôles financiers cohérents aux clusters GPU, aux usines d’IA et à la consommation basée sur les jetons que les cadres de facturation cloud existants n’ont jamais été conçus pour gérer.

Alors que la communauté FinOps Foundation Project, une série de LF Projects LLC, se réunit à San Diego pour FinOps X 2026, l'attention se tourne vers FOCUS – la spécification ouverte de coût et d'utilisation de FinOps – et si le standard ouvert peut étendre sa lingua franca de facturation multicloud pour couvrir une nouvelle génération de dépenses en IA. Parmi les organisations dépensant 100 millions de dollars ou plus par an, environ 68 % utilisent ou expérimentent déjà des données au format FOCUS, signalant une large dynamique en faveur d'un langage de facturation commun, selon Shawn Alpay (photo de droite), directeur de l'ingénierie des données chez FinOps.

« Les données ne sont pas normalisées entre les fournisseurs, entre les catégories technologiques, le cloud public, l'IA, le SaaS, etc », a déclaré Alpay. « Être capable de raconter cette histoire avec les mêmes noms de colonnes, avec les mêmes définitions des valeurs autorisées… pouvoir raconter cette histoire de la même manière chez tous les fournisseurs – c'est incroyablement précieux. Et puis pouvoir intégrer cela dans votre lac de données, votre magasin de données, votre entrepôt de données, réduisez simplement le temps nécessaire pour arriver sur le marché pour les besoins analytiques, comptables et financiers de votre organisation. « 

Alpay et Matt Cowsert (à gauche), chef de produit principal chez FinOps, se sont entretenus avec John Furrier et Paul Nashawatyat de theCUBE lors de FinOps X 2026, lors d'une diffusion exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de l'évolution de la spécification FOCUS, de l'économie des jetons d'IA et de la manière dont la norme ouverte s'étend pour servir de nouvelles catégories de personnalités et de technologies. (* Divulgation ci-dessous.)

La spécification FOCUS s'étend à l'économie des jetons d'IA et aux nouveaux personnages d'entreprise

Avec le lancement de FOCUS 1.4 lors de la conférence, le groupe de travail s'attaque à de nouveaux ensembles de données et à de nouveaux personnages bien au-delà de ses racines de cloud public. FOCUS sert désormais non seulement les ingénieurs de données et les praticiens FinOps, mais également les équipes financières, de direction et d'approvisionnement, a noté Cowsert.

« FOCUS est également un langage que vous pouvez ensuite exploiter au sein de votre organisation », a déclaré Cowsert. « Nous avons fait un travail très solide pour nous assurer que les autres personnalités de votre organisation connaissent également la valeur qu'elles peuvent retirer de FOCUS.

La frontière la plus difficile est l’économie des jetons d’IA. Mesurer le coût de l'inférence nécessite une visibilité jusqu'au niveau par utilisateur, par session et par requête – un niveau de cardinalité qui introduit d'importants défis en matière d'ingénierie des données, a expliqué Alpay. Le groupe de travail réfléchit activement à l'opportunité de créer un nouvel ensemble de données d'observabilité ou de l'intégrer aux cadres existants tels que le projet OpenTelemetry, a-t-il ajouté.

« En ce qui concerne l'IA et les jetons dans ce domaine, vous commencez à parler par utilisateur, par session, par demande, par opération – et plus vous descendez dans cette échelle, plus la cardinalité des données est grande et plus il est difficile de recueillir ces informations », a déclaré Alpay. « Il se pourrait qu'un pourcentage non négligeable de votre coût doive être attribué simplement à l'obtention de vos données et à leur passage dans un pipeline. C'est un coût non nul rien que pour raconter l'histoire. Nous devons être très réfléchis sur la manière dont nous fournissons ces informations, vous permettant potentiellement, en tant que consommateur, de choisir de consommer ou non des données à ce niveau. « 

Voici l'interview vidéo complète, qui fait partie de la couverture de FinOps X 2026 par SiliconANGLE et theCUBE :

(* Divulgation : TheCUBE est un partenaire média payant pour l'événement FinOps X. Ni la Fondation FinOps, le sponsor de la couverture de l'événement theCUBE, ni les autres sponsors n'ont de contrôle éditorial sur le contenu de theCUBE ou SiliconANGLE.)

Photo : SiliconANGLE

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine