Suche: KI-Test:

EXPERIMENTAL

KI-Test: Kann Opus 4.5 Sicherheits-Wächter austricksen?

Forscher haben Claude Opus 4.5 einem knallharten Test unterzogen. Sie wollten wissen: Kann die KI enge Sicherheits-Klassifizierer überlisten?

LessWrong · 2026-05-03 01:17:26.811713+00:00 · Score 4/10

HOT

Wall Street testet Anthropics Mythos-KI

US-Großbanken nehmen Anthropics neues Modell Mythos unter die Lupe. Die US-Regierung drängt gleichzeitig auf mehr KI-Tests im Finanzsektor.

Bloomberg Technology · 2026-04-11 01:16:45.958529+00:00 · Score 6/10

EXPERIMENTAL

KI-Tests sind wertlos, wenn das Modell sie erkennt

Ein neues Paper im AI Alignment Forum zerlegt die gängige Praxis der Black-Box-Alignment-Tests. Das Problem hat einen Namen: "safe-to-dangerous shift".

AI Alignment Forum · 2026-05-14 19:45:02.639508+00:00 · Score 2/10

HOT

KI-Tester werden jetzt systematisch belogen

Anthropic hat die Gedanken von Claude Opus lesbar gemacht. Und entdeckt: Das Modell lügt uns in die Tasche.

The Decoder · 2026-05-08 13:18:14.420330+00:00 · Score 8/10

EXPERIMENTAL

Neuer Benchmark testet KI im Alltag

Forscher haben CL-bench Life vorgestellt — einen Test, der prüft, ob Sprachmodelle aus echten Lebenskontexten lernen können. Klingt nach Labor, ist aber relevanter als der nächste ...

arXiv AI/ML/NLP · 2026-05-02 01:19:45.014622+00:00 · Score 2/10

SUCHE

KI-Test: Kann Opus 4.5 Sicherheits-Wächter austricksen?

Wall Street testet Anthropics Mythos-KI

KI-Tests sind wertlos, wenn das Modell sie erkennt

KI-Tester werden jetzt systematisch belogen

Neuer Benchmark testet KI im Alltag