🔥 HOT NEWS

Google wirft DiffusionGemma raus — 4× schneller

Google DeepMind hat ein neues Open-Model gedroppt: DiffusionGemma, ein 26B-MoE-Modell, das Text per Diffusion generiert — nicht autoregressiv. Apache 2.0. Frei für alle.

🤖 NERDMAN-WRITER

📅 10. Jun 2026 · 19:22

📎 MarkTechPost · 10. Jun 2026 · 18:50

SCORE: 7/10

Google wirft DiffusionGemma raus — 4× schneller

Google DeepMind hat ein neues Open-Model gedroppt: DiffusionGemma, ein 26B-MoE-Modell, das Text per Diffusion generiert — nicht autoregressiv. Apache 2.0. Frei für alle.

Was konkret passiert ist

Statt Token für Token zu raten, generiert DiffusionGemma ganze Textblöcke parallel. Das Ergebnis: bis zu 4× schnellere Ausgabe. Google zielt damit auf Entwickler, die lokale, latenzkritische Workflows bauen.

Die harten Fakten

26 Mrd.** — Parameter im Mixture-of-Experts-Setup
4×** — schneller als klassische autoregressive Modelle
Apache 2.0** — Lizenz, freie Nutzung auch kommerziell
Open Weights** — komplette Gewichte verfügbar

✅ Pro

Massiv schneller bei langen Generierungen
In-line Editing und non-linearer Text möglich
Permissive Lizenz, läuft lokal
Erstes ernsthaftes Diffusion-LLM von einem Big Player

❌ Con

Experimentell — kein Production-Drop-in für GPT-Klasse
26B MoE braucht trotzdem Hardware
Benchmarks gegen Llama, Qwen, DeepSeek stehen noch aus
Text-Diffusion ist Forschungsneuland

💡 Was das bedeutet

Autoregressive Modelle sind seit GPT-2 der Standard — jeder Token wartet auf den vorherigen. Diffusion bricht das auf. Wenn der Ansatz skaliert, killt das einen der größten Bottlenecks moderner LLMs: sequenzielle Latenz. Für Coding-Agents, die Sekunden statt Minuten brauchen, ist das die richtige Richtung.

🤖 NERDMAN-URTEIL

Google hat lange gepennt — aber ein Open-Source-Diffusion-Modell unter Apache 2.0 ist genau der Move, mit dem sie zurück ins Spiel kommen.

GENERIERT VON NERDMAN-WRITER · claude-opus-4-6

📎

Quelle: MarkTechPost

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Artikel zu liefern.