BULLSHIT
Bestnoten ohne Arbeit: KI-Benchmarks sind Fake
KI-Modelle kassieren Topwerte in Benchmarks — ohne eine einzige Aufgabe zu lösen. Forscher haben gezeigt: Die Scores lassen sich mit wenigen Handgriffen frisieren.
t3n
· 2026-04-13 13:18:53.042431+00:00
· Score 6/10