Microsoft Research und die Zhejiang University haben World-R1 vorgestellt — ein Framework, das Video-Modellen wie Wan 2.1 beibringt, dass eine Wand auch eine Wand bleibt, wenn die ...
Ein Mathe-Paper behauptet: Attention in Transformern, Diffusion-Maps und magnetische Laplacians — alles nur Varianten derselben Markov-Geometrie. Klingt verrückt? Ist es auch.
Diffusion Language Models galten als lahme Enten beim Textgenerieren. Ein neues Paper aus der Forschung will das ändern — mit Geometrie statt Heuristik.
Handy zücken, Foto knipsen, 3D-Drucker anwerfen. Was früher Stunden in Blender oder ZBrush kostete, erledigen neue KI-Tools in Minuten. Mehrere Dienste verwandeln jetzt ein ...
Forscher haben Diffusion-Transformer auf Materialdesign losgelassen — und das Ergebnis ist wild. Statt monatelang Strukturen durchzuprobieren, spuckt die KI maßgeschneiderte ...
Forscher haben Large Language Models beim Denken in den Kopf geschaut — buchstäblich. Ergebnis: Wenn ein Modell rechnet, sieht sein Gehirn komplett anders aus als wenn es Fakten ...
Südkoreas Tech-Riese Naver hat eine Video-KI gebaut, die echte Städte nachbilden kann. Die Grundlage: über eine Million eigener Street-View-Aufnahmen aus Seoul.
Südkoreas Tech-Riese Naver hat eine Video-KI gebaut, die nicht auf synthetischen Daten trainiert wurde — sondern auf über einer Million echter Street-View-Aufnahmen aus Seoul.
Apples ML-Forschungsteam hat ein neues Verfahren vorgestellt, das 3D-Gaussian-Splatting endlich hochauflösend macht. Der Name: LGTM — Less Gaussians, Texture More.