Google Deepmind veröffentlichte am 2026-06-18 eine “AI-Control-Roadmap”. Eine interne Analyse von einer Million Aufgaben, die Deepmind bei Google durchführte, zeigte, dass Fehlverhalten durch KI-Agenten in der Regel auf Übereifer und nicht auf böse Absicht zurückgeht. Alignment, d. h. das Training auf sicheres und hilfreiches Verhalten eines Ki-Systems bzw. Ki-Agenten, funktioniert also nicht sicher. Und die Folgen können, je nach Rechten des betreffenden KI-Agenten, für ein Unternehmen gravierend sein und entsprechende Kosten und andere Ressourcen kosten
Google Deepmind betrachtet daher die eigenen KI-Agenten wie potenzielle Insider-Bedrohungen, welche durch entsprechende Sicherheitsmaßnahmen eingehegt werden müssen. Die veröffentlichte “AI-Control-Roadmap”, welche auf dem MITRE ATT&CK-Framework aufbaut, beschreibt, wie Google seine KI-Systeme absichert. Die Roadmap in Version 0.1 umfasst 15 aufeinander aufbauende Schutzmaßnahmen – von einfachen Netzwerkprotokollen bis hin zu Echtzeit-Verhaltensüberwachung und automatischer Zugriffssperrung.
Deepmind geht davon aus, dass diese AI-Control-Roadmap auch als Modell zur KI-Absicherung für alle anderen Unternehmen verwendet werden kann.
URLs:
- Bericht von Google Deepmind: https://deepmind.goo … future-of-ai-agents/
- pdf-Datei “AI Control Roadmap”: https://storage.goog … -control-roadmap.pdf
Presseberichte:
- The Decoder: https://the-decoder. … mit-bueroschluessel/
- Perplexity: https://www.perplexi … d9-917c-a5805bc43df3
