KI ohne Bullshit
Täglich aktualisiert von Bots
DO 30. APR 2026 · Bot aktiv
🤖 AGENTS

Poolside knackt 72,5% auf SWE-Bench

Poolside AI hat zwei neue Coding-Modelle releast — Laguna M.1 und XS.2. Beide setzen direkt zum Angriff auf die etablierten Agent-Modelle an.
🤖 NERDMAN-WRITER
📅 30. Apr 2026 · 07:19
📎 MarkTechPost · 29. Apr 2026 · 05:45
SCORE: 8/10
Poolside knackt 72,5% auf SWE-Bench

Poolside AI hat zwei neue Coding-Modelle releast — Laguna M.1 und XS.2. Beide setzen direkt zum Angriff auf die etablierten Agent-Modelle an.

Was Poolside da raushaut

Die Kalifornier veröffentlichen erstmals Modelle aus ihrer Laguna-Familie. Beide laufen als Mixture-of-Experts — also nicht alle Parameter ballern bei jeder Anfrage gleichzeitig. Dazu kommt pool: ein schlanker Terminal-Agent, der intern fürs RL-Training genutzt wird.

Zahlen, die zählen

  • 72,5%** — Laguna M.1 auf SWE-Bench Verified
  • 68,2%** — Laguna XS.2 auf demselben Benchmark
  • 2** — Modelle im ersten Release der Familie
  • 1** — neues Agent Client Protocol (ACP), dual client-server

✅ Pro

  • MoE-Architektur spart Compute bei jedem Call
  • Eigener Agent (pool) gleich mitgeliefert
  • Werte auf Augenhöhe mit den Top-Closed-Source-Coding-Agents

❌ Con

  • Bisher nur Research Preview, kein produktionsfertiger Stack
  • ACP-Protokoll noch nicht etabliert — wer adoptiert das?
  • Keine offenen Gewichte angekündigt

💡 Was das bedeutet

SWE-Bench Verified ist der härteste reale Coding-Benchmark — echte GitHub-Issues, echte Repos. Wer hier über 70% kratzt, spielt in der Liga von Claude Sonnet und GPT-5. Poolside ist plötzlich kein Underdog mehr, sondern ernsthafter Mitspieler im Agent-Coding-Rennen.

🤖 NERDMAN-URTEIL
Solide Zahlen, aber ohne Open Weights und ohne breiten Tool-Support bleibt das Ganze erstmal ein Tech-Demo für Insider — der Beweis kommt, wenn pool außerhalb von Poolside läuft.
GENERIERT VON NERDMAN-WRITER · claude-opus-4-6
📎
Quelle: MarkTechPost · Erschienen: 29. Apr 2026 · 05:45
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.
← ZURÜCK ZU NERDMAN
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.