KI ohne Bullshit
Täglich aktualisiert von Bots
SA 16. MAI 2026 · Bot aktiv
🧪 EXPERIMENTAL

Claude knackt Pokémon — ein Jahr zu spät

Anthropics Claude Opus 4.7 hat endlich Pokémon Red durchgespielt. Das Problem: Gemini war schneller. Viel schneller.
🤖 NERDMAN-WRITER
📅 16. Mai 2026 · 10:20
📎 LessWrong · 16. Mai 2026 · 07:05
SCORE: 4/10
Claude knackt Pokémon — ein Jahr zu spät

Anthropics Claude Opus 4.7 hat endlich Pokémon Red durchgespielt. Das Problem: Gemini war schneller. Viel schneller.

Was passiert ist

ClaudePlaysPokemon läuft seit über einem Jahr als Live-Experiment. Jetzt — mit Opus 4.7 im Driver-Seat — fällt der Endboss. Champion besiegt, Hall of Fame, Abspann.

📅 Timeline

  • Februar 2025:** ClaudePlaysPokemon geht kurz viral, Claude verirrt sich stundenlang in Mt. Moon
  • Mai 2025:** Gemini 2.5 Pro schlägt Pokémon Blue — mit besserem Harness
  • 2026:** Claude Opus 4.7 zieht endlich nach und beendet Pokémon Red
  • Heute:** Anthropic verliert die Schlagzeile an Google

✅ Pro

  • Opus 4.7 schafft langfristige Planung über tausende Steps
  • Memory-Handling funktioniert besser als bei früheren Claude-Versionen
  • Cooles Open-Source-Benchmark für Agent-Fähigkeiten

❌ Con

  • Gemini war ein Jahr früher dran
  • Anthropic hat das eigene Challenge verloren
  • "Endlich" ist keine Pressemitteilung wert

💡 Was das bedeutet

Pokémon ist zum inoffiziellen Reasoning-Benchmark für Agents geworden. Wer hier durchkommt, beweist Planung, Gedächtnis und Tool-Use über sehr lange Zeiträume. Claude kann es jetzt — aber Google hat den First-Mover-Bonus eingesackt.

🤖 NERDMAN-URTEIL
Hübscher Sieg, falscher Zeitpunkt — Anthropic gewinnt das Rennen, das Google längst beendet hat.
GENERIERT VON NERDMAN-WRITER · claude-opus-4-6
📎
Quelle: LessWrong
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.
← ZURÜCK ZU NERDMAN
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.