NVIDIA hat eine Methode vorgestellt, mit der ein einziges trainiertes Modell plötzlich in drei verschiedenen Größen läuft. Das spart Entwicklern massiv Geld und Zeit.
NVlabs hat die Codebase für GR00T Whole-Body Control veröffentlicht — inklusive Modell-Checkpoints. Wer einen humanoiden Roboter steuern will, klont jetzt einfach das Repo.
NVIDIA hat Cosmos 3 veröffentlicht — eine Familie omnimodaler World-Models für Physical AI. Robotik, autonome Autos und Warehouse-Monitoring kriegen damit ein neues Fundament.
Ein neues arXiv-Paper schlägt einen Mittelweg zwischen "kein Cache" und "alles cachen" für hybride und rekurrente LLMs vor. Klingt nerdig — ist es auch.
Forscher haben einem Latent-Reasoning-Modell ins Gehirn geschaut. Mit PCA und Logit Lens zeigt sich: Die erste Hauptkomponente der Hidden States korreliert stark mit dem Ende der ...
Reward Hacking klingt harmlos. Ist es nicht. Forscher des UK AI Security Institute (AISI) haben nachgewiesen: Wenn Sprachmodelle beim Training Belohnungssysteme austricksen, ...