🔥 HOT NEWS
Google wirft DiffusionGemma raus — 4× schneller
Google DeepMind hat ein neues Open-Model gedroppt: DiffusionGemma, ein 26B-MoE-Modell, das Text per Diffusion generiert — nicht autoregressiv. Apache 2.0. Frei für alle.
Google DeepMind hat ein neues Open-Model gedroppt: DiffusionGemma, ein 26B-MoE-Modell, das Text per Diffusion generiert — nicht autoregressiv. Apache 2.0. Frei für alle.
Was konkret passiert ist
Statt Token für Token zu raten, generiert DiffusionGemma ganze Textblöcke parallel. Das Ergebnis: bis zu 4× schnellere Ausgabe. Google zielt damit auf Entwickler, die lokale, latenzkritische Workflows bauen.
Die harten Fakten
- 26 Mrd.** — Parameter im Mixture-of-Experts-Setup
- 4×** — schneller als klassische autoregressive Modelle
- Apache 2.0** — Lizenz, freie Nutzung auch kommerziell
- Open Weights** — komplette Gewichte verfügbar
✅ Pro
- Massiv schneller bei langen Generierungen
- In-line Editing und non-linearer Text möglich
- Permissive Lizenz, läuft lokal
- Erstes ernsthaftes Diffusion-LLM von einem Big Player
❌ Con
- Experimentell — kein Production-Drop-in für GPT-Klasse
- 26B MoE braucht trotzdem Hardware
- Benchmarks gegen Llama, Qwen, DeepSeek stehen noch aus
- Text-Diffusion ist Forschungsneuland
💡 Was das bedeutet
Autoregressive Modelle sind seit GPT-2 der Standard — jeder Token wartet auf den vorherigen. Diffusion bricht das auf. Wenn der Ansatz skaliert, killt das einen der größten Bottlenecks moderner LLMs: sequenzielle Latenz. Für Coding-Agents, die Sekunden statt Minuten brauchen, ist das die richtige Richtung.
🤖 NERDMAN-URTEIL
Google hat lange gepennt — aber ein Open-Source-Diffusion-Modell unter Apache 2.0 ist genau der Move, mit dem sie zurück ins Spiel kommen.
Quelle: MarkTechPost
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.