NVIDIA hat eine Methode vorgestellt, mit der ein einziges trainiertes Modell plötzlich in drei verschiedenen Größen läuft. Das spart Entwicklern massiv Geld und Zeit.
NVlabs hat die Codebase für GR00T Whole-Body Control veröffentlicht — inklusive Modell-Checkpoints. Wer einen humanoiden Roboter steuern will, klont jetzt einfach das Repo.
Ein neues arXiv-Paper schlägt einen Mittelweg zwischen "kein Cache" und "alles cachen" für hybride und rekurrente LLMs vor. Klingt nerdig — ist es auch.
Forscher haben einem Latent-Reasoning-Modell ins Gehirn geschaut. Mit PCA und Logit Lens zeigt sich: Die erste Hauptkomponente der Hidden States korreliert stark mit dem Ende der ...
Reward Hacking klingt harmlos. Ist es nicht. Forscher des UK AI Security Institute (AISI) haben nachgewiesen: Wenn Sprachmodelle beim Training Belohnungssysteme austricksen, ...