Google DeepMind veröffentlichte Ende März die Ergebnisse einer Untersuchung, wonach für Menschen nicht-lesbare Texte KI-Agenten manipulieren. Z.B. als Kommentar in einer HTML-Seite eingebettet oder via Steganographie in einem Bild versteckt bekommen KI-Agenten Befehle, welche auch vorhandene Befehle überschreiben können.
URLs:
- Google DeepMind: https://deepmind.goo … armful-manipulation/
- Bericht auf arXiv: https://arxiv.org/abs/2603.25326
- Pressebericht bei All-AI (deutsch): https://www.all-ai.d … agent-traps-studie-1
