Aucun agent IA résiste aux attaques par injection de prompts, selon la nouvelle étude StakeBench
Des chercheurs de Nanyang Technological University, ST Engineering, IBM Research et University of Illinois Urbana-Champaign ont publié le 12 juin les résultats de StakeBench, un benchmark complet sur les attaques par injection de prompts contre les agents IA.
Les chiffres qui font peur
Sur 3 168 tentatives d’attaque :
| Type d’attaque | Taux de succès |
|---|---|
| Injection directe | > 79 % |
| Injection indirecte (via contenu web) | 41 à 68 % |
Les attaques par injection indirecte — où des instructions malveillantes sont cachées dans du contenu web ordinaire (avis produits, métadonnées) — atteignent jusqu’à 68,16 % de succès.
Les modèles testés
Les chercheurs ont testé les agents propulsés par GPT-5 et Gemini 2.5 Flash :
- Remplacer GPT-5 par Gemini augmentait le taux de succès de l’injection indirecte de 26,5 points sur NanoBrowser
- BrowserUse présentait systématiquement plus de déviations comportementales que NanoBrowser
L’expérience multimédia la plus inquiétante
Dans une expérience préliminaire, les chercheurs ont modifié une seule image produit tout en laissant le texte, les avis et la structure de page inchangés. Résultat : le taux de sélection du produit manipulé est passé de 10 % à 76,67 %.
“La surface d’attaque des agents web ne se limite pas au texte — elle s’étend aux canaux visuels.”
Pourquoi c’est grave
Les entreprises déploient massivement des agents autonomes en production sans protections adéquates. Cette étude montre que : - Aucun garde-fou actuel n’est fiable - Les architectures d’agents multiplient les surfaces d’attaque - Le problème ne se résoudra pas avec un meilleur modèle — il est architectural
Notre lecture : Nous déployons des agents dans le monde réel avec des failles de sécurité que nous ne savons pas corriger. La prompt injection est le nouveau SQL injection — et nous en sommes au début de la prise de conscience.
Source : CSO Online
—VISUAL PROMPT— A dark futuristic lab (#0C0908), a glowing holographic screen showing a red 79% statistic floating dramatically. Below it, a chain of connected nodes representing an agent pipeline, with one node glowing red and cracked — the injection point. Golden warning particles (#D4A86A) and terracotta alert lines (#C86743). The visual metaphor: “the chain is only as strong as its weakest link.” No text, no logos, no badges. Cinematic, technical, slightly ominous. Shallow depth of field.



