Logo

Freitag, Juni 19, 2026

Google Deepmind (GDM): AI-Control-Roadmap zur Absicherung von KI-Systemen und -Agenten veröffentlicht

Google Deepmind veröffentlichte am 2026-06-18 eine “AI-Control-Roadmap”. Eine interne Analyse von einer Million Aufgaben, die Deepmind bei Google durchführte, zeigte, dass Fehlverhalten durch KI-Agenten in der Regel auf Übereifer und nicht auf böse Absicht zurückgeht. Alignment, d. h. das Training auf sicheres und hilfreiches Verhalten eines Ki-Systems bzw. Ki-Agenten, funktioniert also nicht sicher. Und die Folgen können, je nach Rechten des betreffenden KI-Agenten, für ein Unternehmen gravierend sein und entsprechende Kosten und andere Ressourcen kosten
Google Deepmind betrachtet daher die eigenen KI-Agenten wie potenzielle Insider-Bedrohungen, welche durch entsprechende Sicherheitsmaßnahmen eingehegt werden müssen. Die veröffentlichte “AI-Control-Roadmap”, welche auf dem MITRE ATT&CK-Framework aufbaut, beschreibt, wie Google seine KI-Systeme absichert. Die Roadmap in Version 0.1 umfasst 15 aufeinander aufbauende Schutzmaßnahmen – von einfachen Netzwerkprotokollen bis hin zu Echtzeit-Verhaltensüberwachung und automatischer Zugriffssperrung.
Deepmind geht davon aus, dass diese AI-Control-Roadmap auch als Modell zur KI-Absicherung für alle anderen Unternehmen verwendet werden kann.
URLs:

Presseberichte: