🔥 HOT NEWS
Google killt den Encoder — Gemma 4 läuft auf Laptop
Google DeepMind hat Gemma 4 12B veröffentlicht. Das Ding frisst Text, Bilder, Audio und Video — ohne separate Encoder. Und es läuft auf deinem Laptop.
Google DeepMind hat Gemma 4 12B veröffentlicht. Das Ding frisst Text, Bilder, Audio und Video — ohne separate Encoder. Und es läuft auf deinem Laptop.
Was konkret passiert ist
Gemma 4 12B ist ein dense Decoder-only Transformer mit 12 Milliarden Parametern. Vision und Audio fließen direkt in den LLM-Backbone. Keine Vision-Encoder. Keine Audio-Encoder. Nur ein Modell, das alles selbst macht.
- Architektur:** Decoder-only, encoder-frei
- Parameter:** 12 Milliarden, dense
- Modalitäten:** Text, Bild, Audio, Video — nativ
- Lizenz:** Apache 2.0, also vollständig frei
- Hardware:** Läuft mit 16 GB RAM auf Consumer-Laptop
⚖️ Gemma 4 vs. klassische Multimodal-Modelle
- Encoder:** Gemma 4 hat keine, andere brauchen zwei oder drei
- Latenz:** Direkter Pfad ins LLM, weniger Overhead
- Deployment:** Läuft lokal, statt Cloud-GPU zu fressen
- Lizenz:** Apache 2.0 statt geschlossener API
💡 Was das bedeutet
Wer agentische Workflows bisher in der Cloud bauen musste, kann jetzt lokal arbeiten. 16 GB RAM hat jedes halbwegs aktuelle MacBook. Google liefert hier ein Open-Weight-Modell, das genau die Lücke schließt, in der Meta und Mistral bisher dominierten.
🤖 NERDMAN-URTEIL
Google hat aufgehört, OpenAI hinterherzulaufen — und stattdessen die Open-Source-Krone übernommen.
Quelle: MarkTechPost
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.