🤖 AGENTS
MiniMax M3 schluckt 1 Million Token
Chinas KI-Startup MiniMax hat sein neues Flaggschiff-Modell M3 vorgestellt. Der Fokus: Coding-Agenten und lange Workflows.
Chinas KI-Startup MiniMax hat sein neues Flaggschiff-Modell M3 vorgestellt. Der Fokus: Coding-Agenten und lange Workflows.
Was M3 kann
Das Shanghaier Startup hat die Architektur komplett umgebaut. Das Modell frisst Kontext am Stück, der bei anderen längst den Speicher sprengt.
- Context-Fenster:** 1 Million Token am Stück
- Faktor zur Konkurrenz:** 5× mehr Kontext als üblich
- Compute-Kosten:** auf ein Zwanzigstel gesenkt
- Ziel-Anwendung:** Coding-Agenten, automatisierte Workflows
Zahlenbox
- 1.000.000** — Token Kontextlänge
- 20×** — günstiger im Inference als Vorgänger
- 5×** — größerer Kontext als der bisherige Standard
- #3** — MiniMax gehört zu Chinas führenden KI-Startups
📅 Timeline
- 2023:** MiniMax startet mit Text- und Audio-Modellen
- 2024:** Erste eigene Open-Weight-Releases
- 2025:** Fokuswechsel auf Agenten und Coding
- 2026:** M3 zielt direkt auf Claude und GPT im Coding-Bereich
💡 Was das bedeutet
Coding-Agenten scheitern meist am Kontext. Wer eine ganze Codebase auf einmal lesen kann, baut bessere Agenten — und genau da setzt M3 an. Wenn die Compute-Zahlen halten, wird das für Anthropic und OpenAI unangenehm.
✅ Pro
- 1M Token Kontext ohne Tricks
- Drastisch geringere Inference-Kosten
- Klarer Fokus auf Agenten-Use-Cases
❌ Con
- Benchmarks von MiniMax selbst, keine unabhängige Verifikation
- Westliche Verfügbarkeit unklar
- "Bis zu" bei Kosten ist immer verdächtig
🤖 NERDMAN-URTEIL
Wenn die 20×-Zahl auch nur halb stimmt, schlafen sie in San Francisco diese Woche schlechter.
Quelle: SCMP Tech
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.