EXPERIMENTAL
Sleeper-Agent-Studie liefert widersprüchliche Ergebnisse
Forscher haben das berühmte Sleeper-Agents-Experiment von Anthropic nachgebaut — und kommen zu teils gegenteiligen Ergebnissen. Die Backdoor-Forschung ist offenbar komplizierter ...
AI Alignment Forum
· 2026-04-29 04:16:55.703354+00:00
· Score 5/10