Chris Manning gehört zu den einflussreichsten KI-Forschern der Welt. Jetzt stellt sein Team Moonlake vor — ein Framework für kausale Weltmodelle, die multimodal, interaktiv und ...
Auf der GTC Taipei haut Nvidia gleich drei Releases raus: Weltmodell, Fahrmodell, Humanoid. Alles "offen" — aber bitte nur auf Nvidia-Chips.
Microsoft Research und mehrere Universitäten haben mit Mirage ein Video-Weltmodell vorgestellt, das sich Szenen merkt — und zwar ohne die übliche Speicher-Schlacht.
Nvidia legt nach: Mit Nemotron 3 Ultra und Cosmos 3 packt Jensen Huang gleich zwei neue KI-Modelle auf den Tisch.
Forscher haben ein Transformer-Modell gebaut, das nicht Texte oder Bilder generiert — sondern Zeitreihen. Klingt trocken, ist aber genau der Stoff, aus dem echte Weltmodelle ...
Pin auf die Karte setzen, reinlaufen, Welt erkunden. Google Deepmind koppelt sein Weltmodell Genie 3 an Street View — und macht reale Orte zu KI-generierten Spielwiesen.
Ein neuer Benchmark stellt Sora, Veo und Co. eine miese Note aus. WorldReasonBench testet nicht Pixel, sondern ob die Modelle Physik kapieren. Spoiler: tun sie nicht.
Google DeepMind erweitert Project Genie. Neue Funktion: Welten aus Street-View-Bildern generieren.
Forscher aus mehreren Disziplinen haben genug vom reinen Textgehirn. Ein neuer Review in Nature Machine Intelligence fragt: Was braucht eine KI, um nicht nur zu denken — sondern ...
Meta-Chef-Yann LeCun hat den Riesen abgeschüttelt und sein eigenes Ding gestartet. Mit einer radikalen These.
Berkeley hat einen neuen Planungsalgorithmus für World Models vorgestellt. GRASP löst das Problem, das bisher jeden Gradienten-Planer bei längeren Horizonten zerstört hat: ...
Forscher haben die Art gekillt, wie KI-Roboter ihre Welt verstehen. Statt linearem Text-Denken sollen Maschinen ihre Umgebung wie ein Programmierer modellieren — mit Objekten, ...
Südkoreas Tech-Riese Naver hat eine Video-KI gebaut, die echte Städte nachbilden kann. Die Grundlage: über eine Million eigener Street-View-Aufnahmen aus Seoul.
Südkoreas Tech-Riese Naver hat eine Video-KI gebaut, die nicht auf synthetischen Daten trainiert wurde — sondern auf über einer Million echter Street-View-Aufnahmen aus Seoul.