La tokenisation de l'IA est devenue essentielle pour les entreprises qui cherchent à équilibrer la sécurité des données avec l'innovation, permettant d'utiliser les données sensibles en toute sécurité dans les charges de travail d'IA sans compromettre leur utilité ou leur conformité.
Cette exigence remodèle la façon dont les responsables de la sécurité des données envisagent leur rôle au sein de l’organisation. L'ancien modèle – dans lequel les équipes de sécurité contrôlaient l'accès en le restreignant – est de plus en plus en contradiction avec la rapidité commerciale qu'exige l'IA, selon Vincent Goveas (photo), directeur de la gestion des produits chez Capital One Software, une division de Capital One Financial Corp.
« Historiquement, les équipes de sécurité devaient bloquer l’accès pour garantir la sécurité, mais… dans ce nouvel environnement qui provoque un conflit massif », a déclaré Goveas. « Par exemple, votre équipe de science des données ou votre équipe marketing veulent un accès en temps réel pour générer des revenus et doivent attendre, par exemple, plus de 30 jours. Le changement que nous observons est que les entreprises veulent passer d'une défense périmétrique à une sécurité centrée sur les données. «
Goveas s'est entretenu avec Christophe Bertrand de theCUBE pour une interview exclusive sur theCUBE, le studio de diffusion en direct de SiliconANGLE Media. Ils ont discuté de la tokenisation de l'IA, des stratégies de sécurité centrées sur les données et de la nécessité de rendre les données sensibles à la fois sûres et utiles à grande échelle.
Tokenisation de l'IA : de la défense du périmètre à la sécurité centrée sur les données
Capital One a été l'une des premières grandes entreprises à se lancer dans le cloud public et a rapidement découvert que le marché manquait d'outils capables de gérer son échelle sur des milliards de transactions mensuelles. Ce qu'il a construit en interne est finalement devenu Capital One Databolt, une solution de tokenisation d'entreprise actuellement commercialisée pour aider d'autres organisations à accélérer leurs propres parcours cloud et IA sans compromettre le contrôle des données.
« Il existe quatre éléments stratégiques qui font de la tokenisation un bien meilleur choix pour préparer vos données à l'IA », a déclaré Goveas. « La tokenisation remplace les données sensibles par un espace réservé non sensible… qui préserve ce format. Par exemple, une adresse e-mail ressemble toujours à une adresse e-mail. Un code postal comporte toujours cinq chiffres. Cela signifie que vos applications et bases de données existantes ne se cassent pas. C'est énorme. «
Les avantages de la tokenisation IA vont au-delà de la préservation du format. Étant donné que les données tokenisées conservent des propriétés structurelles clés, les modèles d’IA peuvent s’entraîner dessus tout en préservant une grande partie de la fidélité prédictive – et un mauvais acteur qui viole le système se retrouverait avec des espaces réservés largement inutiles plutôt que des données sensibles en texte clair. Pour valider cela dans la pratique, Capital One Software s'est associé à PwC Research pour tester la tokenisation par rapport aux données de masquage et en texte clair dans des cas d'utilisation réels de l'IA, notamment en prédisant le risque cardiaque des patients à partir de notes médicales non structurées et en prévoyant l'utilisation des soins des patients à partir d'une enquête de santé structurée. Dans le cas d'utilisation des données structurées, les données masquées n'ont atteint qu'une précision prédictive de 50 % par rapport à une référence en texte clair, tandis que les données tokenisées ont atteint une précision de 99,7 %, a noté Goveas.
« Ce que nous avons réalisé, c'est que la tokenisation peut conduire à de meilleures prévisions en matière d'IA et, plus important encore, avoir des résultats commerciaux impactants », a-t-il déclaré. « La recherche prouve que lorsqu'un modèle d'IA s'appuie sur des champs sensibles comme, par exemple, l'âge, le code postal ou l'historique des transactions, dans ce cas, pour faire une prédiction, le masquage détruit ce modèle. La tokenisation est le seul moyen de garder ce modèle intelligent et les données en sécurité. »
L’opérationnalisation de la tokenisation pour l’IA nécessite un changement stratégique dans la mentalité organisationnelle autant qu’un changement technologique. Goveas a recommandé aux entreprises de tokeniser les données lors de leur ingestion, avant qu'elles n'entrent dans un lac de données ou un entrepôt, afin que les pipelines en aval ne soient jamais pollués par des informations personnelles identifiables en texte clair. La découverte et la classification automatisées doivent fonctionner en continu car les volumes de données augmentent sans interruption, et les architectures d'accès en libre-service peuvent éliminer les temps d'attente de plus de 30 jours pour les tickets qui ralentissent actuellement les développeurs et les data scientists. Comme le montre une étude du Boston Consulting Group, 75 % des dirigeants classent déjà l’IA parmi les trois principales priorités commerciales – l’infrastructure de données derrière ces initiatives doit suivre le rythme.
« Ne laissez pas votre stratégie de données être définie par le passé alors que votre stratégie commerciale est axée sur l'avenir », a déclaré Goveas. « En tokenisant, vous séparez la valeur des données du risque, ce qui vous permet enfin d'utiliser 100 % de la puissance de vos données en toute sécurité, sans compromettre leur utilité. »
Voici l'interview vidéo complète :