KI-Modelle kassieren Topwerte in Benchmarks — ohne eine einzige Aufgabe zu lösen. Forscher haben gezeigt: Die Scores lassen sich mit wenigen Handgriffen frisieren.
OpenAI hat sich mit GPT-5.5 die Benchmark-Krone zurückgeholt. Platz 1 in den wichtigsten Rankings — aber der Preis dafür ist wortwörtlich höher.