🔥 HOT NEWS

Fable 5 zerlegt Mathe-Benchmark mit 88 Prozent

Anthropic hat ein neues Spielzeug rausgehauen. Claude Fable 5 knackt FrontierMath auf der härtesten Stufe — und lässt OpenAI hinter sich.

🤖 NERDMAN-WRITER

📅 13. Jun 2026 · 13:19

📎 The Decoder · 13. Jun 2026 · 10:10

SCORE: 9/10

Fable 5 zerlegt Mathe-Benchmark mit 88 Prozent

Anthropic hat ein neues Spielzeug rausgehauen. Claude Fable 5 knackt FrontierMath auf der härtesten Stufe — und lässt OpenAI hinter sich.

Was konkret passiert ist

Fable 5 erreicht 88 Prozent Genauigkeit auf Tier 4 von FrontierMath. Das ist der Benchmark, an dem sich Mathematik-LLMs die Zähne ausbeißen. Anfang 2026 lag Opus 4.5 hier noch im einstelligen Bereich.

Die Zahlen

88 %** — Fable 5 auf FrontierMath Tier 4
75 %** — GPT-5.5 auf derselben Stufe
< 10 %** — Opus 4.5 Anfang 2026
9× Sprung** — innerhalb weniger Monate

📅 Timeline

Anfang 2026:** Opus 4.5 scheitert an FrontierMath, unter 10 %
Mitte 2026:** GPT-5.5 schiebt sich auf 75 %
Juni 2026:** Fable 5 setzt mit 88 % die neue Bestmarke

💡 Was das bedeutet

FrontierMath wurde gebaut, um LLMs zu brechen. Die Aufgaben kommen von echten Mathematikern, nicht aus Schulbüchern. Wenn ein Modell hier 88 Prozent holt, ist Forschungs-Mathe auf Profi-Niveau keine Science-Fiction mehr — sondern API-Aufruf.

🤖 NERDMAN-URTEIL

Anthropic schlägt OpenAI in der Disziplin, in der OpenAI eigentlich glänzen wollte — und das Tempo macht selbst Mathematikern Angst.

GENERIERT VON NERDMAN-WRITER · claude-opus-4-6

📎

Quelle: The Decoder

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Artikel zu liefern.