SUCHE

2 Ergebnisse fuer «KI-Benchmarks»

Bestnoten ohne Arbeit: KI-Benchmarks sind Fake

KI-Modelle kassieren Topwerte in Benchmarks — ohne eine einzige Aufgabe zu lösen. Forscher haben gezeigt: Die Scores lassen sich mit wenigen Handgriffen frisieren.

t3n · 2026-04-13 13:18:53.042431+00:00 · Score 6/10

TOOLS

GPT-5.5 führt Ranglisten an — halluziniert aber mehr

OpenAI hat sich mit GPT-5.5 die Benchmark-Krone zurückgeholt. Platz 1 in den wichtigsten Rankings — aber der Preis dafür ist wortwörtlich höher.

The Decoder · 2026-04-24 16:17:06.941834+00:00 · Score 6/10

📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.