🧪 EXPERIMENTAL
Claude zockt Pokémon Red durch
Nach über einem Jahr Versuchen hat Anthropics KI endlich die Top Vier besiegt. Kein Hype, kein Trick — einfach stetig besser geworden.
Nach über einem Jahr Versuchen hat Anthropics KI endlich die Top Vier besiegt. Kein Hype, kein Trick — einfach stetig besser geworden.
Die Story in Kurzform
Claude irrte monatelang durch Mt. Moon. Verlief sich in Silph Co. Heulte digital bei den Arenaleitern. Dann auf einmal: Sieg.
📅 Timeline
- 2024:** Erste Versuche, Claude scheitert kläglich an Brock
- 2025:** Neue Modelle, mehr Memory — trotzdem Game Over in Endlosschleife
- 2026:** Durchbruch. Claude knackt die Elite Four
Was wirklich passierte
Es gab keinen magischen Moment. Kein "Eureka". Claude wurde einfach in vielen Bereichen gleichzeitig stetig besser — Memory, Planung, Navigation, räumliches Denken.
“
Claude just got steadily better at a bunch of things at once.— LessWrong-Autor zum Pokémon-Run
✅ Pro
- Zeigt echten Fortschritt jenseits von Benchmarks
- Pokémon ist ein brutaler Long-Horizon-Test
- Es gibt sogar einen Song zum Erfolg
❌ Con
- Über ein Jahr für ein 1996er Game Boy-Spiel
- Kein neues Modell, keine Demo, keine Anleitung zum Nachmachen
- Mehr Story als Substanz
💡 Was das bedeutet
Pokémon Red ist kein Spielzeug-Benchmark — es testet alles, woran heutige Agents scheitern: Gedächtnis über Stunden, Planung über Dungeons, Lernen aus Fehlern. Wenn Claude das schafft, sind echte Multi-Step-Agents näher als manche denken.
🤖 NERDMAN-URTEIL
Ein Jahr für Pokémon klingt peinlich — ist aber der ehrlichste Reality-Check für KI-Agents, den wir gerade haben.
Quelle: LessWrong
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.