JetBrains schmeißt Mellum2 auf den Markt — ein 12B Mixture-of-Experts-Modell, gebaut fürs Coden. Direkt auf Hugging Face, direkt zum Anfassen.
NVIDIA hat Nemotron 3 Ultra veröffentlicht — ein Open-Weight-Modell, das speziell für Agents gebaut ist, die stundenlang durchlaufen. Der Trick: Mixture-of-Experts plus ...
Meta hat Llama 4 veröffentlicht. Die neue Modellgeneration setzt auf Mixture-of-Experts (MoE) und ist multimodal. Together AI bietet die Modelle ab sofort zum Einsatz an.
NVIDIA wirft heute gleich drei Hammer-Releases auf den Markt: Cosmos 3, Nemotron 3 Ultra und den RTX Spark. Jensen Huang meint es ernst mit der KI-Vollbedienung.
Forscher haben ein Mixture-of-Experts-Modell so trainiert, dass es drei Viertel seiner Experten verliert — und trotzdem fast volle Leistung bringt. Das Ding heißt EMO. Und es ...
Apple ML Research hat ein neues Framework veröffentlicht, das speculative expert prefetching für Mixture-of-Experts-Modelle systematisch vermisst. Kein Modell-Release, sondern ...
Forscher haben den ersten öffentlichen Benchmark für digitale Batteriepässe gebaut. 22 Sprachmodelle mussten ran — von Mini-LM bis Mixture-of-Experts.
Nur 3 Milliarden aktive Parameter — und trotzdem auf Augenhöhe mit Modellen, die zehnmal so groß sind. Das Qwen-Team hat Qwen3.6-35B-A3B veröffentlicht, ein Open-Weight ...
Ein chinesisches KI-Startup veröffentlicht ein Modell, das sich selbst weiterentwickelt hat — und liefert dabei Benchmark-Werte, die aufhorchen lassen.
Forscher haben ein Problem mit Mixture-of-Experts-Modellen: Jeder Experte braucht seinen eigenen Adapter. Mehr Experten, mehr Parameter, mehr Kosten. LiME soll das ändern.
DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...
Ein Modell mit einer Billion Parametern auf einem Rechner mit 96 GB RAM. Kein Rechenzentrum, kein Cloud-Abo. Einfach SSD und Geduld.
NVIDIA hat Cosmos 3 veröffentlicht — eine Familie omnimodaler World-Models für Physical AI. Robotik, autonome Autos und Warehouse-Monitoring kriegen damit ein neues Fundament.
JetBrains haut sein neues Code-Modell raus. Open Source, Apache 2.0, direkt zum Runterladen.
Nvidia veröffentlicht Nemotron 3 Ultra — und kassiert direkt den Benchmark-Thron. Laut Artificial Analysis ist es das stärkste offene KI-Modell der USA.
Das KI-Lab Zyphra hat ZAYA1-8B-Diffusion-Preview veröffentlicht. Sie haben ein normales autoregressives Sprachmodell in ein Diffusion-Modell umgewandelt — und es wird dabei bis zu ...
NVIDIA und Sakana AI stellen Twell vor: CUDA-Kernel für 20,5 % schnelleres Inferenz und 21,9 % schnelleres Training von LLMs
Ein winziger KI-David fordert die milliardenschweren Goliaths heraus. Zyphra AI hat ZAYA1-8B veröffentlicht – ein Mini-Modell, das auf AMD-Hardware trainiert wurde und auf ...
Ein neues Paper auf arXiv stellt MP-ISMoE vor — ein System, das Transfer Learning effizienter machen soll. Klingt trocken? Ist es auch. Aber die Idee dahinter ist clever.