N'abandonnez pas le contrôle des données à la recherche de renseignements

À mesure que les organisations se réorganisent pour mettre l’intelligence artificielle au centre, nous avons constaté que l’information n’était plus un moyen précieux, mais un moyen d’atteindre l’intelligence, ce qui est bien plus important.

Mais qu’arrive-t-il aux données des organisations lorsqu’elles adoptent l’IA ? Le conservent-ils ou le confient-ils aux fournisseurs d’IA et de cloud ? Savent-ils au moins où se trouvent leurs données ?

Alors que l’IA passe du statut expérimental à celui essentiel, les dirigeants devraient se demander s’ils en font suffisamment pour contrôler leurs propres données.

Ce n'est pas une question philosophique. Les récentes annonces des grands fournisseurs de technologies de l’information ont suscité des inquiétudes. ServiceNow Inc., par exemple, a récemment lancé Context Engine, un produit qui regroupe les données clients dans une couche unifiée et les met à jour en temps réel. Mais il existe un problème possible pour les clients qui souhaitent utiliser leurs propres agents d'IA en dehors de l'écosystème ServiceNow : ils pourraient devoir payer des frais de consommation pour une utilisation au-delà du niveau choisi. Comme Constellation Research Inc. l'a noté dans un article de blog d'avril, les clients de ServiceNow verront leurs compteurs basés sur l'utilisation augmenter à mesure que la consommation augmente.

Pour moi, la question concerne plus le contrôle que le coût. Vos données – qui constituent vos connaissances institutionnelles et vos renseignements accumulés – risquent de devenir l'actif de quelqu'un d'autre lorsque vous concluez un accord les plaçant au centre d'un écosystème de fournisseurs.

Lorsque vous devenez dépendant d’un fournisseur, vous perdez un certain contrôle. CIO.com a cité Scott Bickley, membre consultatif d'Info-Tech Research Group Inc., soulignant que Context Engine crée une « dépendance implicite » à l'égard des modèles de données et de gouvernance de ServiceNow, ainsi que de son architecture de plateforme. C'est une préoccupation valable.

L'ingrédient manquant

Pour exploiter pleinement les données en les transformant en informations exploitables, vous avez besoin de contexte. Et le contexte n'est pas gratuit ; il doit être conçu.

L’ingénierie contextuelle est la discipline qui consiste à structurer, conserver et gouverner les informations sur lesquelles une IA opère. Il ne suffit pas de pointer un modèle vers vos données et de le laisser s'exécuter. Le modèle doit comprendre quelles données font autorité, lesquelles sont actuelles, lesquelles sont pertinentes pour une décision donnée et, surtout, ce qu'il ne sait pas. Sans ingénierie délibérée du contexte, même un LLM puissant hallucinera en toute confiance, s'appuyant sur des informations périmées, incomplètes ou simplement fausses pour produire des résultats qui semblent crédibles mais qui ne le sont pas.

L'ingénierie contextuelle consiste à intégrer les outils d'IA dans les limites des données d'une organisation, et non à transférer les données vers le cloud de quelqu'un d'autre. Toute architecture d’IA doit être capable de construire la riche couche contextuelle dont ces outils ont besoin pour raisonner avec précision. C’est ce qu’on entend par souveraineté des données. L'IA fonctionne dans votre contexte, pas dans le sien.

Mais l’ingénierie contextuelle à elle seule ne suffit pas. L’autre moitié de l’équation est la validation et la vérification des résultats de l’IA avant qu’ils ne fassent partie de votre base de connaissances organisationnelles. Il s’agit d’une étape que de nombreuses organisations sautent complètement, et c’est peut-être l’erreur la plus lourde de conséquences de la vague actuelle d’adoption de l’IA.

Lorsqu'un LLM génère une réponse, un résumé, une recommandation ou un rapport, cette sortie doit être testée par rapport à la vérité terrain avant d'être classée, partagée, mise en œuvre ou, pire encore, utilisée pour entraîner le modèle suivant dans votre pile (conduisant à l'effondrement redouté du modèle). Une fois qu’un résultat halluciné ou subtilement erroné est intégré dans votre infrastructure de connaissances, il se propage et devient le contexte qui façonne les futurs résultats de l’IA.

Les organisations qui y parviendront construiront des systèmes d’IA qui deviendront plus précis et plus fiables au fil du temps. Ceux qui ne le font pas se retrouveront confrontés à un risque de contagion de plus en plus grand, qu'ils ne pourront pas facilement auditer car l'erreur initiale est enfouie sous des couches d'inférences en aval.

Décisions critiques

Nous sommes relativement tôt dans la courbe d’adoption et de mise en œuvre de l’IA. Les organisations prennent désormais des décisions cruciales concernant l’architecture et les plateformes d’IA qu’elles souhaitent adopter. Bien que beaucoup d’argent et d’énergie organisationnelle soient en jeu, le choix d’un fournisseur d’IA n’est pas permanent.

Ce qui est plus durable, c’est l’approche adoptée par les entreprises et les gouvernements pour soumettre leurs données aux caprices d’entités extérieures. Vont-ils prendre toutes les mesures nécessaires pour garder le contrôle ? Ou en céderont-ils une partie à quelqu’un d’autre ?

Nous avons rapidement adopté les LLM en tant qu'outils qui nous fournissent des renseignements, un pas au-delà de l'information, qui a une longueur d'avance sur les éléments de base des données brutes. Dans cette progression par étapes, nous devrions nous demander si nous sommes devenus tellement épris d’intelligence que nous avons oublié de protéger nos données. La réponse pourrait s’avérer inconfortable.

Richard Boyd est PDG et co-fondateur d'UltiSim Inc., une société d'infrastructure d'IA et de jumeau numérique d'entreprise basée à Chapel Hill, en Caroline du Nord. Il a écrit cet article pour SiliconANGLE.