EXPERIMENTAL
LinuxArena testet, ob KI heimlich sabotiert
Neue Benchmark-Suite mit 20 Software-Umgebungen. Ziel: Herausfinden, wie gut KI-Agenten unbemerkt Schaden anrichten können — und wie man sie dabei erwischt.
LessWrong
· 2026-04-21 01:18:04.739243+00:00
· Score 3/10