Google DeepMind knallt Gemma 4 auf den Tisch — und die Open-Source-Welt horcht auf. Das 31B-Modell hält mit Riesen wie Kimi K2.5 (744B Parameter) und GLM-5 (1 Billion Parameter) ...
Ein Modell mit einer Billion Parametern auf einem Rechner mit 96 GB RAM. Kein Rechenzentrum, kein Cloud-Abo. Einfach SSD und Geduld.
DeepSeek liefert endlich ab. Nach Monaten der Spekulation steht DSV4 — das erste große Modell-Update seit DeepSeek-R1 im Januar.
Google DeepMind droppt Gemma 4 — und das Ding liefert. Das 31B-Modell hängt Konkurrenten ab, die teilweise über eine Billion Parameter mitschleppen.
Moonshot AI hat Kimi K2 veröffentlicht — ein Open-Source-Modell mit einer Billion Parametern. Spezialisiert auf agentic Reasoning und Code. Together AI hostet es ab sofort ...
Wissenschaftler haben eine neue Methode entwickelt, um die Blackbox großer Sprachmodelle zu öffnen. Sie nennen es "Parameter-Decomposition".
Alibaba hat mit Qwen3.6-27B ein Open-Weight-Modell veröffentlicht, das bei Agentic-Coding-Benchmarks Modelle mit 397 Milliarden Parametern hinter sich lässt. Dichtes Modell, ...
Nur 3 Milliarden aktive Parameter — und trotzdem auf Augenhöhe mit Modellen, die zehnmal so groß sind. Das Qwen-Team hat Qwen3.6-35B-A3B veröffentlicht, ein Open-Weight ...
Z.ai knallt GLM-5.1 auf Hugging Face. 754 Milliarden Parameter, 1,51 Terabyte schwer, MIT-Lizenz. Einfach so. Open Weight. Zum Mitnehmen.
H Company stellt Holo3 vor — ein Open-Weight-Modell für Computer Use, das mit nur 10 Milliarden aktiven Parametern die dicken Proprietary-Modelle auf dem OSWorld-Benchmark ...
Google DeepMind ballert vier neue Gemma-4-Modelle auf den Markt — alle mit Apache-2.0-Lizenz, alle mit Vision-Fähigkeiten, alle mit Reasoning. Das ist kein kleines Update, das ist ...
Microsoft schmeißt drei neue Multilingual-Embedding-Modelle auf den Markt. Harrier-OSS-v1 heißt die Familie — und sie räumt den wichtigsten Benchmark ab.
Ein winziges Gemma-Modell mit nur 2 Milliarden Parametern erkennt Misalignment in fremden KI-Antworten. Es wurde nur auf Code trainiert — und urteilt trotzdem über allgemeine ...
Die KI-Branche hat ein Stromfresser-Problem. Metas Llama 4 kommt mit 2 Billionen Parametern — und der Energiebedarf wächst mit jedem neuen Modell weiter.
China liefert. DeepSeek hat sein neues Flaggschiff-Modell V3 als Open-Source auf GitHub veröffentlicht — und die Architektur hat es in sich.
Alibaba hat ein neues Open-Source-Modell rausgehauen. Qwen3.6-27B schlägt mit nur 27 Milliarden Parametern seinen eigenen Vorgänger — der 15-mal größer ist.
DeepSeek liefert. Das chinesische KI-Lab hat die Preview-Version von DeepSeek-V4 veröffentlicht — zwei neue Modelle, die eine Million Token Kontext nativ verarbeiten. Nicht als ...
Das chinesische KI-Lab DeepSeek feuert die nächste Breitseite auf die US-Konkurrenz. Neue Architektur, neues Modell, größeres Kontextfenster — und das Ganze zum Bruchteil der ...
Alibabas KI-Labor Qwen hat ein neues Open-Weight-Modell rausgehauen — und die Behauptung ist dreist: Ein 27-Milliarden-Parameter-Modell soll besser coden als der eigene Vorgänger ...
Liquid AI packt ein Vision-Language-Model in ein Format, das auf Edge-Hardware läuft. Das neue LFM2.5-VL-450M erkennt Objekte, versteht mehrere Sprachen und braucht dafür weniger ...