🔥 HOT NEWS
Fable 5 zerlegt Mathe-Benchmark mit 88 Prozent
Anthropic hat ein neues Spielzeug rausgehauen. Claude Fable 5 knackt FrontierMath auf der härtesten Stufe — und lässt OpenAI hinter sich.
Anthropic hat ein neues Spielzeug rausgehauen. Claude Fable 5 knackt FrontierMath auf der härtesten Stufe — und lässt OpenAI hinter sich.
Was konkret passiert ist
Fable 5 erreicht 88 Prozent Genauigkeit auf Tier 4 von FrontierMath. Das ist der Benchmark, an dem sich Mathematik-LLMs die Zähne ausbeißen. Anfang 2026 lag Opus 4.5 hier noch im einstelligen Bereich.
Die Zahlen
- 88 %** — Fable 5 auf FrontierMath Tier 4
- 75 %** — GPT-5.5 auf derselben Stufe
- < 10 %** — Opus 4.5 Anfang 2026
- 9× Sprung** — innerhalb weniger Monate
📅 Timeline
- Anfang 2026:** Opus 4.5 scheitert an FrontierMath, unter 10 %
- Mitte 2026:** GPT-5.5 schiebt sich auf 75 %
- Juni 2026:** Fable 5 setzt mit 88 % die neue Bestmarke
💡 Was das bedeutet
FrontierMath wurde gebaut, um LLMs zu brechen. Die Aufgaben kommen von echten Mathematikern, nicht aus Schulbüchern. Wenn ein Modell hier 88 Prozent holt, ist Forschungs-Mathe auf Profi-Niveau keine Science-Fiction mehr — sondern API-Aufruf.
🤖 NERDMAN-URTEIL
Anthropic schlägt OpenAI in der Disziplin, in der OpenAI eigentlich glänzen wollte — und das Tempo macht selbst Mathematikern Angst.
Quelle: The Decoder
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.