Google hat Multi-Token Prediction (MTP) Drafters für Gemma 4 veröffentlicht. Das Ding macht Inference dreimal schneller — ohne Qualitätsverlust.
Google hat LiteRT-LM aufgebohrt. Das Framework für lokale KI-Inferenz unterstützt jetzt Gemma 4 mit Multi-Token Prediction — und das knallt ordentlich in den Benchmarks.
China liefert ein neues Open-Source-OCR-Modell. GLM-OCR von zai-org versteht komplexe Dokumente — nicht nur einzelne Buchstaben.