Das KI-Lab Zyphra hat ZAYA1-8B-Diffusion-Preview veröffentlicht. Sie haben ein normales autoregressives Sprachmodell in ein Diffusion-Modell umgewandelt — und es wird dabei bis zu ...
Apple ML Research bringt iTARFlow — eine neue Variante von Normalizing Flows. Das Ziel ist klar: Diffusion-Modellen den Bilderzeugungs-Thron streitig machen.
Diffusion Language Models galten als lahme Enten beim Textgenerieren. Ein neues Paper aus der Forschung will das ändern — mit Geometrie statt Heuristik.
Ein neues Paper auf arXiv will Masked Diffusion Models das ständige Vergessen abgewöhnen. Die Methode heißt "Relay" — und klingt nach mehr Effizienz beim Generieren.
Google hat sein experimentelles Diffusion-Modell zurückgeholt – diesmal als Open-Weight-Release. Simon Willison hat es ausprobiert, NVIDIA hostet es kostenlos.
Langsame KI-Bilder nerven. Forscher haben jetzt einen Trick gefunden, der Diffusion-Modelle parallelisiert — ohne sie neu trainieren zu müssen.
Masked Diffusion Language Models generieren Text nicht Wort für Wort, sondern demaskieren ganze Sequenzen parallel. Problem: Die logisch wichtigsten Wörter kommen dabei zuletzt — ...
Diffusion-Modelle für Text sind das neue heiße Eisen. Aber sie können gefährlichen Müll produzieren. Jetzt gibt es einen neuen Ansatz, sie sicher zu machen.
Diffusion Language Models (DLMs) bekommen ein Problem gelöst, das bisher kaum jemand verstanden hat: Standard-Finetuning macht sie schlechter statt besser. Ein neues Paper zeigt ...
Google DeepMind hat DiffusionGemma veröffentlicht — ein Open-Model, das Text nicht Wort für Wort, sondern in ganzen Blöcken parallel generiert. NVIDIA liefert die passende ...
Forscher haben ein Problem gelöst, das Masked Diffusion Language Models (MDLMs) bisher ausgebremst hat: Jeder Generierungsschritt brauchte das volle, fette Transformer-Modell. Das ...
Google DeepMind hat DiffusionGemma vorgestellt — ein Sprachmodell, das nicht mehr Wort für Wort generiert, sondern Text wie ein Bild "entrauscht". Ergebnis: vierfache ...
Die Ära des Standard-LLM wackelt. Sebastian Raschka, einer der respektiertesten ML-Forscher überhaupt, hat die wichtigsten Alternativen zum klassischen Transformer-Decoder ...
Ein kleines Lab namens z-lab hat ein Tool gebaut, das große Sprachmodelle beim Antworten massiv beschleunigt. Die Methode: Block Diffusion trifft auf Speculative Decoding.
Chinesische Forscher bauen ein Text-to-Speech-System, das komplett ohne diskrete Token arbeitet. Stattdessen: durchgehende Diffusion, End-to-End, direkt von Text zu Sprache.
Ein neues Framework namens DiffuJudge-AV will LLM-Judges für autonome Fahrvideos zuverlässiger machen. Der Trick: Diffusion-Logik wird auf Bewertungs-Pipelines übertragen.
Apple ML Research zeigt STARFlow-V — einen Video-Generator, der komplett auf Normalizing Flows setzt. Kein Diffusion, kein Hype. Stattdessen Mathe.
Google DeepMind hat DiffusionGemma veröffentlicht — ein experimentelles Open-Source-Textmodell. Nvidia hat es jetzt für seine Hardware optimiert.
Französische und spanische Behörden haben einen Online-Marktplatz für gefälschte Ausweise hochgenommen. Kunden: Schleuserbanden in der EU.
Reform-Vize Richard Tice teilte ein Bild einer angeblichen Wahlkampfveranstaltung. Dumm nur: Das Internet hat genauer hingeschaut — und fünf klare KI-Merkmale gefunden.