AGENTS
Alibabas HopChain knackt 20 von 24 Bild-Benchmarks
KI-Modelle, die über Bilder nachdenken, haben ein Drecksproblem: Kleine Fehler beim Hinsehen werden über mehrere Denkschritte immer größer — bis am Ende kompletter Unsinn ...
The Decoder
· 2026-04-06 10:18:50.169446+00:00
· Score 6/10