🧪 EXPERIMENTAL
Google klaut Bild-KI-Tricks für Text
Google DeepMind hat ein neues Open-Weights-Modell vorgestellt, das Techniken aus der Bildgenerierung auf Text überträgt. Das Ding heißt DiffusionGemma — und macht Text-Output bis ...
Google DeepMind hat ein neues Open-Weights-Modell vorgestellt, das Techniken aus der Bildgenerierung auf Text überträgt. Das Ding heißt DiffusionGemma — und macht Text-Output bis zu 4× schneller.
Was DiffusionGemma anders macht
Klassische Sprachmodelle generieren Token für Token, von links nach rechts. DiffusionGemma nutzt stattdessen Diffusion — die gleiche Technik, mit der Bild-KIs aus Rauschen Pixel formen. Nur eben mit Wörtern statt Pixeln.
- Modell:** DiffusionGemma, 26 Mrd. Parameter
- Speedup:** Bis zu 4× schneller als klassische Transformer
- Hardware-Hürde:** 18 GB DRAM oder VRAM reichen
- Lizenz:** Open Weights, kostenlos zum Download
Die Zahlen
- 4×** — Speedup auf Consumer-Hardware
- 18 GB** — Minimum-VRAM für lokalen Betrieb
- 26 Mrd.** — Parameter unter der Haube
- 0 €** — Kosten für den Download
✅ Pro
- Läuft auf einer fetten Consumer-GPU
- Open Weights, keine API-Lock-in
- Echter Architektur-Sprung, nicht nur "mehr Parameter"
❌ Con
- Experimentell — nicht für Produktion
- Diffusion bei Text ist noch unerforschtes Terrain
- 18 GB VRAM ist für Normalos immer noch viel
💡 Was das bedeutet
Während OpenAI und Anthropic ihre Modelle hinter APIs verstecken, wirft Google die Forschungsergebnisse einfach raus. Wenn Diffusion bei Text wirklich skaliert, kippt das Konzept "ein Token nach dem anderen" — und damit ein Stück Transformer-Dogma.
🤖 NERDMAN-URTEIL
Google macht Open-Source-Forschung wie früher Bell Labs — und die Closed-Konkurrenz sollte langsam nervös werden.
Quelle: The Register AI
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.