OpenAI hat eine Methode vorgestellt, die neuronale Netze brutal ausdünnt — ohne dass die Leistung einbricht. Das Zauberwort: L₀-Regularisierung.
Ein neues Paper aus der Forschung zeigt, wie man multimodale Foundation Models schneller und schlanker machen will. Kein Produkt, kein Demo — aber die Idee hat es in sich.
Cloudflare hat einen eigenen MCP-Server gelauncht — und der hat ein klares Ziel: Token sparen. Der neue "Code Mode" lässt AI-Agents mit über 2.500 API-Endpunkten arbeiten, ohne ...
Kleinere Modelle trainieren, ohne auf Power zu verzichten. MIT-Forscher haben einen Weg gefunden, der die Branche umkrempeln könnte.
Forscher haben ein Problem mit Mixture-of-Experts-Modellen: Jeder Experte braucht seinen eigenen Adapter. Mehr Experten, mehr Parameter, mehr Kosten. LiME soll das ändern.
Heise ballert eine Modell-Schau raus: China liefert Reasoning, Liquid schrumpft Modelle auf Mini-Format, Microsoft baut sich eine neue Welt. Alles parallel, alles diese Woche.
Google DeepMind hat Gemma 4 12B vorgestellt. Das Modell ist multimodal — und kommt komplett ohne separaten Encoder.
Ein Entwickler aus Pakistan hat ein Mini-Tool gebaut, das Behörden-Notices entschlüsselt. Kein Milliarden-Funding, kein Hype — nur ein echtes lokales Problem.
Simon Willison veröffentlicht micropython-wasm 0.1a2 — ein winziges Tool, das Python sicher im Browser ausführt. Neu dabei: ein CLI und eine Live-Demo zum Selbsttesten.
Microsoft Research hat Fara1.5 veröffentlicht — eine Familie von Browser-Agenten, die OpenAIs Operator alt aussehen lässt.
Forscher haben ein Mixture-of-Experts-Modell so trainiert, dass es drei Viertel seiner Experten verliert — und trotzdem fast volle Leistung bringt. Das Ding heißt EMO. Und es ...
Simon Willison hat sein eigenes Mini-Tool für iNaturalist auf Version 0.1 gehoben. Klingt unspektakulär — ist es auch. Aber genau das ist der Punkt.
Meta macht Rekordgewinne — und schmeißt trotzdem tausende Mitarbeiter raus. Nächste Woche fliegt jeder zehnte Meta-Angestellte. Wired hat mit über einem Dutzend aktuellen und ...
Poolside AI hat zwei neue Coding-Modelle releast — Laguna M.1 und XS.2. Beide setzen direkt zum Angriff auf die etablierten Agent-Modelle an.
DeepSeek liefert endlich ab. Nach Monaten der Spekulation steht DSV4 — das erste große Modell-Update seit DeepSeek-R1 im Januar.
Meta schmeißt rund 10 Prozent der Belegschaft raus. Gleichzeitig pumpt der Konzern Milliarden in KI-Talente. Willkommen in Zuckerbergs neuer Prioritätenliste.
Meta streicht 10% der Belegschaft. Rund 8.000 Mitarbeiter müssen gehen — damit der Konzern seine KI-Ausgaben stemmen kann.
Tencent hat HY3 vorgestellt — das erste große KI-Modell unter der Führung von Yao Shunyu, der von OpenAI zum chinesischen Tech-Riesen wechselte.
Xiaomi hat zwei neue KI-Modelle veröffentlicht: MiMo-V2.5-Pro und MiMo-V2.5. Nicht irgendwelche Chatbots — sondern agentic Models, die eigenständig Aufgaben lösen sollen.
Alibabas KI-Labor Qwen hat ein neues Open-Weight-Modell rausgehauen — und die Behauptung ist dreist: Ein 27-Milliarden-Parameter-Modell soll besser coden als der eigene Vorgänger ...