EXPERIMENTAL
KI-Denken lässt sich nicht kontrollieren
Forscher zwingen KI-Modelle, ihre Gedankengänge zu verstecken. Es funktioniert nicht. Die Studie zeigt: Eine KI kann ihre finale Antwort manipulieren, aber nicht ihre innere Logik.
AI Alignment Forum
· 2026-04-17 22:22:42.772390+00:00
· Score 2/10