🏆 TOOLS
Google macht lokale KI 2,2× schneller
Google hat LiteRT-LM aufgebohrt. Das Framework für lokale KI-Inferenz unterstützt jetzt Gemma 4 mit Multi-Token Prediction — und das knallt ordentlich in den Benchmarks.
Google hat LiteRT-LM aufgebohrt. Das Framework für lokale KI-Inferenz unterstützt jetzt Gemma 4 mit Multi-Token Prediction — und das knallt ordentlich in den Benchmarks.
Was drin steckt
- Framework:** LiteRT-LM (Googles Runtime für On-Device-LLMs)
- Neu:** Native Unterstützung für Gemma 4 MTP-Drafter
- APIs:** Swift und JavaScript kommen dazu (vorher nur Kotlin und C++)
- Speedup: Bis zu 2,2×** schnellere Inferenz
Zahlenbox
- 2,2×** — maximaler Speedup durch Multi-Token Prediction
- 4** — unterstützte Sprachen jetzt (Kotlin, C++, Swift, JS)
- 0** — Cloud-Calls nötig, läuft komplett lokal
✅ Pro
- Spürbar schnellere Inferenz auf dem Gerät
- Swift-Support öffnet iOS-Welt richtig
- JavaScript bringt das Ganze in den Browser
- Keine Daten verlassen das Device
❌ Con
- Nur Gemma 4 profitiert vom MTP-Boost
- "Bis zu 2,2×" heißt im Alltag oft weniger
- Setup bleibt was für Entwickler, nicht für Endnutzer
💡 Was das bedeutet
Lokale KI wird endlich brauchbar schnell. Wer Apps mit On-Device-LLMs bauen will, hat jetzt einen ernsthaften Grund, Gemma 4 statt Cloud-APIs zu nutzen — gerade auf iPhones und im Browser. Google zielt direkt auf Apples Intelligence-Stack.
🤖 NERDMAN-URTEIL
Solides Update ohne Show — genau die Art Fortschritt, die lokale KI vom Spielzeug zum Werkzeug macht.
Quelle: InfoQ AI/ML
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.