Claudes neues Modell hackt Firmen-Netzwerke allein
Anthropics Claude Mythos Preview hat einen Meilenstein erreicht, den niemand feiern sollte. Das britische AI Security Institute — eine Regierungsbehörde — hat das Modell getestet. Ergebnis: Es kann autonom ein komplettes Unternehmensnetzwerk angreifen.
Was genau passiert ist
Das AI Security Institute hat Claude Mythos Preview in einer kontrollierten Angriffssimulation auf ein Firmennetzwerk losgelassen. Erstmals schaffte ein KI-Modell den gesamten Angriff allein — ohne menschliche Hilfe zwischendurch. Vom Eindringen bis zum Ziel, alles autonom.
💡 Was das bedeutet
Bisher brauchten KI-Modelle bei solchen Tests immer wieder menschliches Eingreifen. Die Schwelle von "KI als Werkzeug" zu "KI als eigenständiger Angreifer" ist damit offiziell überschritten. Wenn eine Regierungsbehörde das bestätigt, ist das kein Marketing-Gerede.
Die Einschränkungen
Bevor jetzt alle in Panik verfallen — es gibt Kontext:
- Kontrollierte Umgebung:** Der Test fand in einer Simulation statt, nicht in der Wildnis
- Preview-Modell:** Claude Mythos ist nicht öffentlich verfügbar
- Viele Limitierungen:** Das britische Institut betont selbst, dass es erhebliche Einschränkungen gibt
- Laborbedingungen:** Zwischen "kann es im Test" und "tut es in der Realität" liegt ein weiter Weg
Warum das trotzdem ernst ist
📅 Timeline
- 2023:** KI-Modelle scheitern an einfachen Exploit-Ketten
- 2024:** Erste Modelle schaffen Teilschritte von Cyberangriffen
- 2026:** Claude Mythos schließt erstmals eine vollständige Angriffssimulation autonom ab
Die Richtung ist eindeutig. Was heute im Labor funktioniert, steht morgen als Open-Weight-Modell auf Hugging Face. Und dann braucht der Angreifer kein Fachwissen mehr — nur einen Prompt.