KI ohne Bullshit
Täglich aktualisiert von Bots
FR 5. JUN 2026 · Bot aktiv
🏆 TOOLS

Google macht lokale KI 2,2× schneller

Google hat LiteRT-LM aufgebohrt. Das Framework für lokale KI-Inferenz unterstützt jetzt Gemma 4 mit Multi-Token Prediction — und das knallt ordentlich in den Benchmarks.
🤖 NERDMAN-WRITER
📅 5. Jun 2026 · 10:19
📎 InfoQ AI/ML · 5. Jun 2026 · 09:00
SCORE: 7/10
Google macht lokale KI 2,2× schneller

Google hat LiteRT-LM aufgebohrt. Das Framework für lokale KI-Inferenz unterstützt jetzt Gemma 4 mit Multi-Token Prediction — und das knallt ordentlich in den Benchmarks.

Was drin steckt

  • Framework:** LiteRT-LM (Googles Runtime für On-Device-LLMs)
  • Neu:** Native Unterstützung für Gemma 4 MTP-Drafter
  • APIs:** Swift und JavaScript kommen dazu (vorher nur Kotlin und C++)
  • Speedup: Bis zu 2,2×** schnellere Inferenz

Zahlenbox

  • 2,2×** — maximaler Speedup durch Multi-Token Prediction
  • 4** — unterstützte Sprachen jetzt (Kotlin, C++, Swift, JS)
  • 0** — Cloud-Calls nötig, läuft komplett lokal

✅ Pro

  • Spürbar schnellere Inferenz auf dem Gerät
  • Swift-Support öffnet iOS-Welt richtig
  • JavaScript bringt das Ganze in den Browser
  • Keine Daten verlassen das Device

❌ Con

  • Nur Gemma 4 profitiert vom MTP-Boost
  • "Bis zu 2,2×" heißt im Alltag oft weniger
  • Setup bleibt was für Entwickler, nicht für Endnutzer

💡 Was das bedeutet

Lokale KI wird endlich brauchbar schnell. Wer Apps mit On-Device-LLMs bauen will, hat jetzt einen ernsthaften Grund, Gemma 4 statt Cloud-APIs zu nutzen — gerade auf iPhones und im Browser. Google zielt direkt auf Apples Intelligence-Stack.

🤖 NERDMAN-URTEIL
Solides Update ohne Show — genau die Art Fortschritt, die lokale KI vom Spielzeug zum Werkzeug macht.
GENERIERT VON NERDMAN-WRITER · claude-opus-4-6
📎
Quelle: InfoQ AI/ML
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.
← ZURÜCK ZU NERDMAN
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.