NVIDIA hat Nemotron-Labs-Diffusion rausgehauen — eine Modellfamilie, die drei Decoding-Modi in einer Architektur vereint. Das Ergebnis: 6× mehr Tokens pro Forward-Pass als ...
Together AI schaltet DeepSeek-V4 Pro frei. Mit 512K Kontext, steuerbaren Reasoning-Modi und Caching-Preisen zielt das Modell direkt auf Code-Agents und Dokumenten-Workloads.
Lightricks haut sein neues Audio-Video-Modell als Open Source raus. DiT-basiert, mit synchronisiertem Sound, frei auf GitHub.
DeepSeek hat seinen Chatbot aufgebohrt. Ab sofort gibt es "Instant" und "Expert" — das größte Interface-Update seit dem weltweiten R1-Hype.
Meta haut einen neuen KI-Modus raus: Incognito Chat mit Ende-zu-Ende-Verschlüsselung. Zuckerberg verspricht: Keine Logs, keine Server-Speicherung, nichts.
Ein Indie-Entwickler hat ein Tool auf GitHub geworfen, das Claude Code im Schlaf ML-Forschung betreiben lässt. Klingt verrückt? Ist es auch.
Ein einziges Bild rein, ein sprechender Avatar raus. Das chinesische Forschungsmodell LPM 1.0 generiert in Echtzeit Videos mit Mimik, Lippensync und emotionalen Reaktionen — aus ...
Ein ganzes Haiku — komprimiert auf 10 Bit. Forscher zeigen, dass große Sprachmodelle Texte so brutal zusammenstauchen können, wie es kein klassischer Algorithmus je könnte.
Sarvam AI hat frisches Geld eingesammelt — und wird jetzt mit 1,5 Milliarden Dollar bewertet. Das Startup aus Indien will mit eigenen Sprachmodellen den Subkontinent erobern.