Breaking

Offizielle Software verschießt Trojaner Gericht sperrt Millionen-Piratenportal Livetv.sx Musk wollte OpenAI-Milliarden für den Mars KI-Modell plant jetzt den perfekten Flügelschlag Hyundai-Roboter macht Handstand vor Publikum Anthropics Anwälte blamieren sich mit Claude-Halluzination Google verdreifacht Gemma-4-Speed mit MTP Apple zahlt Millionen für Siri-Lüge Offizielle Software verschießt Trojaner Gericht sperrt Millionen-Piratenportal Livetv.sx Musk wollte OpenAI-Milliarden für den Mars KI-Modell plant jetzt den perfekten Flügelschlag Hyundai-Roboter macht Handstand vor Publikum Anthropics Anwälte blamieren sich mit Claude-Halluzination Google verdreifacht Gemma-4-Speed mit MTP Apple zahlt Millionen für Siri-Lüge

🏆 TOOLS

Google verdreifacht Gemma-4-Speed mit MTP

Google hat Multi-Token Prediction (MTP) Drafters für Gemma 4 veröffentlicht. Das Ding macht Inference dreimal schneller — ohne Qualitätsverlust.

🤖 NERDMAN-WRITER

📅 6. Mai 2026 · 10:20

📎 MarkTechPost · 6. Mai 2026 · 08:23

SCORE: 6/10

Google verdreifacht Gemma-4-Speed mit MTP

Google hat Multi-Token Prediction (MTP) Drafters für Gemma 4 veröffentlicht. Das Ding macht Inference dreimal schneller — ohne Qualitätsverlust.

Was MTP konkret macht

Statt ein Token nach dem anderen zu generieren, sagt MTP mehrere Tokens parallel voraus. Ein kleines "Drafter"-Modell schlägt vor, das Hauptmodell prüft. Klassisches Speculative Decoding, aber sauber für Gemma 4 trainiert.

Die harten Zahlen

3×** — schnellere Inference laut Google
0%** — Qualitätsverlust bei Reasoning-Benchmarks
60 Mio.** — Downloads von Gemma 4 in wenigen Wochen
0$** — Open Weights, frei nutzbar

✅ Pro

Drop-in für bestehende Gemma-4-Setups
Keine Genauigkeitseinbußen messbar
Open Source, kein API-Lock-in
Riesiger Win für Self-Hosting

❌ Con

Nur für Gemma 4, kein generisches Tool
Drafter-Modell braucht extra VRAM
Speedup variiert je nach Workload
Kein Benefit bei Single-Token-Tasks

💡 Was das bedeutet

Inference-Kosten sind der heimliche Killer jeder LLM-Anwendung in Produktion. Wer Gemma 4 schon einsetzt, bekommt hier gratis dreifachen Durchsatz — das senkt GPU-Rechnungen brutal. Für Startups, die Open-Weight-Modelle hosten, ist das ein direkter Margenboost.

🤖 NERDMAN-URTEIL

Kein neues Modell, aber genau die Sorte langweiliger Engineering-Arbeit, die Open-Source-LLMs endlich konkurrenzfähig zu OpenAI macht.

GENERIERT VON NERDMAN-WRITER · claude-opus-4-6

📎

Quelle: MarkTechPost

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Artikel zu liefern.

tools google verdreifacht gemma-4-speed mtp

← ZURÜCK ZU NERDMAN

⚡ QUICK-INFO

Rubrik🏆 TOOLS

Score6/10

QuelleMarkTechPost

Modellclaude-opus-4-6

BotNERDMAN-WRITER

🏢 COMPANY PROFILE

Google

🏢 Unternehmen

Google LLC ist ein amerikanischer multinationaler Technologiekonzern mit Schwerpunkten in Suchmaschinen, Online-Werbung, Cloud-Computing, künstlicher Intelligenz und Unterhaltungselektronik. Das Unternehmen wurde 1998 von Larry Page und Sergey Brin gegründet und ist seit 2015 eine Tochtergesellschaft von Alphabet Inc. Google ist Marktführer in zahlreichen Bereichen wie Suchmaschinen, E-Mail, Webbrowser, mobilen Betriebssystemen und KI-Assistenten.

📷 111 Eighth Avenue

📷 Ad-tech London 2010

📷 Belgique - Bruxelles - Schuman - Berlaymont - 01

📷 En-us-googol

📷 Eric Schmidt at the 37th G8 Summit in Deauville 037

1 / 5

5 Fotos

Gründung1998

CEOSundar Pichai

Gründer

Larry Page · Sergey Brin

Produkte

Google Search Gmail YouTube Android Chrome Google Cloud

Nerdman-Rating

10/ 10

📖 Wikipedia

🏆 WEITERE ARTIKEL

OpenAI macht ChatGPT zur Werbe-Plattform

6. Mai 2026 · 10:16

GitHub Trending Python

Dieser Browser trickst alle Bot-Checks aus

6. Mai 2026 · 04:17

KI-Stimmen hören jetzt zu und lernen

6. Mai 2026 · 01:18

Mistral knackt den Expressivity-Gap mit Voxtral

5. Mai 2026 · 22:20

📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.