Les agents de l'IA deviennent des extensions pour votre navigateur. Cela n'augmente que la probabilité d'être kidnappé

L'IA générative progresse à une vitesse vertigineuse, et chaque semaine, de nouvelles façons d'intégrer des modèles tels que Claude, Gemini ou Co -cilot apparaissent dans les outils que nous utilisons le plus. Et l'une des frontières les plus controversées (et juteuses) est le navigateur Web, cette fenêtre à travers laquelle nous gérons une grande partie de notre vie numérique, de nos réseaux sociaux à nos comptes bancaires.

Dans ce champ délicat, Anthropic a lancé une version Claude 'Aperçu' pour Chrome, avec la forme d'une extension qui permet à son modèle d'automatiser la navigation: lire des pages, appuyer sur les boutons, remplir des formulaires ou exécuter des tâches directement dans le navigateur. Mais l'entreprise elle-même prévient que l'invention est aussi utile que dangereuse.

Qu'est-ce que Claude pour Chrome?

Il s'agit d'une extension expérimentale, disponible uniquement pour environ 1 000 abonnés de paiement de Claude Max (avec des plans de 100-200 $ par mois). Selon l'entreprise, cela rend Claude « beaucoup plus utile » en s'intégrant dans le flux de travail réel. Et, malgré tout, Anthropic ne la considère pas comme « préparée » au grand public.

Le grand talon d'Achille: injections rapides

Le plus grand risque est les attaques d'injection d'instructions cachées (« injection rapide »). En eux, un texte apparemment innocent (un e-mail, un document, même un article sur les réseaux sociaux) comprend des commandes invisibles que l'IA pourrait interpréter comme légitime. Ce n'est pas la première fois que cela se produit ces derniers temps.

De vrais exemples:

Un e-mail malveillant a ordonné à Claude de supprimer le plateau d'entrée d'un utilisateur. L'IA a obéi sans confirmation.
Dans les tests de laboratoire, il a été démontré qu'un simple fragment caché pouvait demander à l'IA d'extraire des données sensibles telles que des e-mails ou d'activer les flux de récupération de mot de passe.

Anthropic admet que sans défense, les attaques ont réussi 23,6% du temps dans 123 tests effectués. Avec les atténuations, le chiffre est tombé à 11,2%. Dans des attaques de navigateur spécifiques, telles que des champs invisibles sous des formes, ils ont même réduit le taux de réussite de 35,7% à 0%.

Les défenses (et ses limites)

Pour atténuer les risques, Claude pour Chrome comprend:

Permet le site: L'utilisateur peut accorder ou révoquer l'IA à des pages spécifiques.
Confirmations à haut risque: Avant de publier, d'acheter ou de partager des données personnelles, Claude doit demander l'approbation.
Blocades automatiques: vous ne pouvez pas accéder à des sites financiers, crypto-monnaie, adultes ou piratage.

Même ainsi, des experts comme Simon Willison (qui a inventé le terme Injection rapide) qualifier le taux de défaillance restant de 11,2% comme « catastrophique », faisant valoir qu'il n'est pas réaliste d'attendre que les utilisateurs finaux gèrent des risques aussi complexes.

Un motif qui s'inquiète: les navigateurs kidnappés par l'IA

Claude pour Chrome ne se pose pas dans le vide. Des expériences similaires telles que Perplexity Comet, Gemini pour Chrome ou Copilot pour Edge ont fait face à de graves vulnérabilités. L'équipe de Brave a montré, par exemple, comment la comète pouvait être trompée pour entrer des comptes Gmail et tirer des récupérations de mot de passe avec des instructions simples cachées dans un thread Reddit.

Cela a conduit certains observateurs à déclarer que le concept même d'un navigateur « piloté » pourrait être intrinsèquement précaire.

Bien que cela semble alarmant, anthropique défend que la convergence entre les navigateurs et les modèles d'IA est «inévitable». La société est convaincue que l'essai fonctionne avec ce petit groupe d'utilisateurs découvrira les modèles d'attaque et concevra de meilleures défenses avant un lancement de masse.

Mais en attendant, les risques ne sont pas hypothétiques. Comme Willison résume:

« Je ne pense pas qu'il soit raisonnable de s'attendre à ce que les utilisateurs finaux prennent de bonnes décisions concernant des risques de sécurité aussi complexes. »