Claude Code bekommt Auto-Modus mit KI-Aufpasser
Anthropic schaltet eine neue Permissions-Stufe für Claude Code frei. Statt dem riskanten `--dangerously-skip-permissions` übernimmt jetzt ein zweites KI-Modell die Sicherheitskontrolle.
Was konkret neu ist
Auto Mode heißt das Feature. Claude Code trifft Entscheidungen eigenständig — darf Dateien schreiben, Befehle ausführen, Code ändern. Aber nicht unbeaufsichtigt.
Vor jeder Aktion prüft ein separates Classifier-Modell den gesamten Gesprächsverlauf. Laut Dokumentation läuft dieser Wächter auf Claude Sonnet 4.6. Hält der Classifier eine Aktion für riskant, wird sie geblockt.
Warum das wichtig ist
- Bisher:** Entweder jede Aktion manuell bestätigen (nervig) oder `--dangerously-skip-permissions` nutzen (gefährlich)
- Jetzt:** Ein Mittelweg — Claude arbeitet autonom, aber mit Leitplanken
- Wie:** Ein zweites, günstigeres Modell überwacht das teurere Modell in Echtzeit
✅ Pro
- Kein manuelles Abnicken bei jeder Dateiänderung mehr
- Sicherer als der bisherige Skip-Permissions-Hack
- Separates Modell als Kontrollinstanz — nicht der gleiche Agent prüft sich selbst
❌ Con
- Classifier-Modell kann falsch liegen — zu streng oder zu locker
- Zusätzliche Latenz durch doppelte Prüfung
- Blindes Vertrauen in Sonnet 4.6 als Torwächter
Die größere Idee
Ein KI-Modell überwacht ein anderes KI-Modell. Das ist kein Gimmick — das ist Anthropics Antwort auf die Frage, wie autonome Coding-Agents sicher laufen sollen. Wenn das funktioniert, wird jeder Agent-Anbieter dieses Muster kopieren.