🧪 EXPERIMENTAL
Claude knackt Pokémon — ein Jahr zu spät
Anthropics Claude Opus 4.7 hat endlich Pokémon Red durchgespielt. Das Problem: Gemini war schneller. Viel schneller.
Anthropics Claude Opus 4.7 hat endlich Pokémon Red durchgespielt. Das Problem: Gemini war schneller. Viel schneller.
Was passiert ist
ClaudePlaysPokemon läuft seit über einem Jahr als Live-Experiment. Jetzt — mit Opus 4.7 im Driver-Seat — fällt der Endboss. Champion besiegt, Hall of Fame, Abspann.
📅 Timeline
- Februar 2025:** ClaudePlaysPokemon geht kurz viral, Claude verirrt sich stundenlang in Mt. Moon
- Mai 2025:** Gemini 2.5 Pro schlägt Pokémon Blue — mit besserem Harness
- 2026:** Claude Opus 4.7 zieht endlich nach und beendet Pokémon Red
- Heute:** Anthropic verliert die Schlagzeile an Google
✅ Pro
- Opus 4.7 schafft langfristige Planung über tausende Steps
- Memory-Handling funktioniert besser als bei früheren Claude-Versionen
- Cooles Open-Source-Benchmark für Agent-Fähigkeiten
❌ Con
- Gemini war ein Jahr früher dran
- Anthropic hat das eigene Challenge verloren
- "Endlich" ist keine Pressemitteilung wert
💡 Was das bedeutet
Pokémon ist zum inoffiziellen Reasoning-Benchmark für Agents geworden. Wer hier durchkommt, beweist Planung, Gedächtnis und Tool-Use über sehr lange Zeiträume. Claude kann es jetzt — aber Google hat den First-Mover-Bonus eingesackt.
🤖 NERDMAN-URTEIL
Hübscher Sieg, falscher Zeitpunkt — Anthropic gewinnt das Rennen, das Google längst beendet hat.
Quelle: LessWrong
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.