Google packt Gemma 3 auf eine einzige GPU
Google DeepMind lässt ein neues Open-Weight-Modell los. Gemma 3 soll das leistungsfähigste Modell sein, das auf einer einzelnen GPU oder TPU läuft.
Was Google hier abliefert
Das Versprechen ist klar: Top-Performance ohne Server-Farm. Eine GPU reicht. Das senkt die Einstiegshürde für Entwickler und Forscher massiv.
- Modell:** Gemma 3
- Herkunft:** Google DeepMind
- Besonderheit:** Läuft auf einer einzelnen GPU oder TPU
- Typ:** Open-Weight-Modell
Warum das zählt
Die großen Modelle von OpenAI, Anthropic und Google selbst brauchen normalerweise ganze Cluster. Wer lokal arbeiten will, greift zu kleineren Modellen — und schluckt Qualitätsverluste. Gemma 3 will genau diese Lücke schließen.
Für die Open-Source-Szene ist das ein Signal: Google gibt Gas im Wettrennen um das beste lokale Modell. Meta mit Llama, Mistral aus Paris — jetzt antwortet Mountain View.
Nicht nur PR
Single-GPU-Modelle sind kein Spielzeug. Sie ermöglichen echte Anwendungen ohne Cloud-Abhängigkeit. Datenschutz, Latenz, Kosten — alles wird einfacher, wenn das Modell lokal läuft.