OpenAI hat eine Methode vorgestellt, die neuronale Netze brutal ausdünnt — ohne dass die Leistung einbricht. Das Zauberwort: L₀-Regularisierung.
Cloudflare hat einen eigenen MCP-Server gelauncht — und der hat ein klares Ziel: Token sparen. Der neue "Code Mode" lässt AI-Agents mit über 2.500 API-Endpunkten arbeiten, ohne ...
Kleinere Modelle trainieren, ohne auf Power zu verzichten. MIT-Forscher haben einen Weg gefunden, der die Branche umkrempeln könnte.
Forscher haben ein Problem mit Mixture-of-Experts-Modellen: Jeder Experte braucht seinen eigenen Adapter. Mehr Experten, mehr Parameter, mehr Kosten. LiME soll das ändern.
OpenAI stellt ein Open-Source-SDK für Multi-Agent-Workflows auf GitHub. Das Teil trendet — und unterstützt nicht nur eigene Modelle.
Nur noch 1.400 Weißkopflanguren leben in freier Wildbahn. Jetzt soll künstliche Intelligenz die Primaten vor dem Aussterben retten.
Die KI-Industrie hat ein Hardwareproblem. Die Nachfrage nach Rechenleistung für KI-Agenten wächst schneller als das Angebot — und jetzt knallt es überall gleichzeitig.
Die Tech-Branche hat im ersten Quartal 2026 fast 80.000 Stellen gestrichen. Der Haupttreiber: Künstliche Intelligenz ersetzt schneller als erwartet.
Google DeepMind droppt Gemma 4 — und das Ding liefert. Das 31B-Modell hängt Konkurrenten ab, die teilweise über eine Billion Parameter mitschleppen.
Google DeepMind hat Gemma 4 veröffentlicht. Vier Vision-fähige Reasoning-LLMs, alle unter Apache 2.0 — also wirklich offen, nicht "offen mit Sternchen".
Microsoft droppt Harrier-OSS-v1 — eine Familie von drei multilingualen Embedding-Modellen, die auf dem Multilingual MTEB v2 Benchmark den Thron übernehmen.
Die Franzosen drehen auf. Mistral hat mit Voxtral TTS ein Open-Weight Text-to-Speech-Modell gelauncht — und nebenbei noch Forge, Leanstral und einen Ausblick auf Mistral 4 ...
Europas teuerster KI-Laden liefert wieder. Mistral hat Voxtral TTS gelauncht — ein Text-to-Speech-Modell, das laut Benchmarks mit den Besten mithalten kann. Und ja, es ist ...
OpenAI zieht den Stecker bei seiner Video-KI Sora. Die Entscheidung kam selbst für Insider überraschend — und hat mehrere Gründe.
Ein Dienstagmorgen wie jeder andere bei OpenAI. Am Abend war nichts mehr wie vorher.
Ein Meeting-Notiz-Tool ist jetzt 1,5 Milliarden Dollar wert. Granola hat eine fette Series-B-Runde abgeschlossen und seinen Wert versechsfacht.
40 Millionen Kollisionen pro Sekunde. So viel Daten spuckt der Large Hadron Collider aus. Kein Rechenzentrum der Welt kann das speichern. CERNs Lösung: Die KI kommt nicht nach der ...
Google DeepMind macht ernst. Gemini 2.0 Flash-Lite ist ab sofort kein Experiment mehr, sondern steht Entwicklern offiziell für den Produktionseinsatz zur Verfügung.
Nach fast 7 Jahren Schweigen macht OpenAI die Tür wieder auf. Mit gpt-oss-120b und gpt-oss-20b veröffentlicht der ChatGPT-Konzern seine ersten Open-Weight-Modelle seit GPT-2 im ...
Google feuert das nächste Modell in den Markt. Gemini 3.1 Flash-Lite soll das schnellste und günstigste Modell der gesamten Gemini-3-Serie sein.