Ein Modell, das Bilder erzeugt UND versteht — Google DeepMind hat mit Vision Banana die Mauer zwischen generativen und diskriminativen Vision-Modellen eingerissen.
ChatGPT bekommt ein neues Bildmodell. "Images 2.0" soll detailliertere Bilder liefern und endlich Text richtig rendern können.
Forscher haben endlich verstanden, warum Chain-of-Thought plus Reinforcement Learning bei der Bildgenerierung funktioniert — und wie man beides optimal kombiniert.
Reve und Ideogram droppen beide neue Versionen. Beide brüllen "endlich Layouts!" — und beide werden in den Arena-Rankings vom Platzhirsch verprügelt.
NVIDIA Labs hat Sana auf GitHub geworfen — eine ganze Familie von Bildgeneratoren, die schneller laufen sollen als alles, was Diffusion bisher gezeigt hat.
Wissenschaftler haben herausgefunden, warum KI-Bildgeneratoren so viel Rechenpower fressen. Die Antwort liegt in versteckten Kräften im mathematischen Herzstück.
OpenAIs Bildgenerator GPT-Image-2 wird gerade zum Liebling der Kreativ-Szene. Während alle anderen Labs auf Coding und Enterprise schielen, zeigt das Modell, was passiert, wenn ...
OpenAI rollt „ChatGPT Images 2.0" aus. Das neue Bildmodell kann planen, im Web recherchieren und zusammenhängende Bildserien erstellen.
Elon Musk hat keinen Bock auf französische Justiz. In einem Verfahren wegen sexuell expliziter Bilder, die sein KI-Tool Grok generiert hat, verweigert er laut AFP die Kooperation ...
Google verknüpft seinen Bildgenerator jetzt direkt mit Google Photos. Wer zustimmt, lässt Gemini die komplette Foto-Bibliothek durchforsten — inklusive aller Labels, Gesichter und ...
Heise zeigt diese Woche KI-generierte Bilder. Das Thema: runde Formen. Kreise, Bögen, Rundungen. Das war's.
Black Forest Labs liefert FLUX.2 — und Together AI hostet es ab sofort. Das Ding kann was, das die meisten Bildgeneratoren nicht können: mehrere Referenzbilder gleichzeitig ...
OpenAI schaltet seinen Bildgenerator DALL·E 3 für ChatGPT Plus und Enterprise frei. Keine separate App mehr, keine Warteliste — einfach im Chat Bilder erzeugen.
Ein Forscher hat KI losgelassen, um sich jedes menschliche Gen als Person vorzustellen. Das Ergebnis: 19.023 generierte Porträts, die beim Auswendiglernen helfen sollen.
San Francisco rüstet seine Bucht mit KI auf — um Wale vor Schiffsschrauben zu retten. Das System heißt WhaleSpotter und scannt das Wasser rund um die Uhr.
UK-Schulen werden mit KI-generierten Missbrauchsbildern erpresst. Das Rohmaterial: Kinderfotos von Schul-Websites.
Alibabas neues Bildmodell Qwen-Image-2.0 presst Bilder doppelt so klein und erzeugt sie mit nur einem Zehntel der Arbeit. Der Trick: ein komplett umgebauter Transformer und eine ...
Heise hat die "Bilder der Woche 18" veröffentlicht. Gelbe Fassaden, Lichtspuren, Flügel — alles KI-generiert, alles hübsch anzuschauen.
Diffusion Models können Bilder erzeugen, die sie nie gesehen haben. Aber wie genau schaffen sie das? Apple hat nachgeschaut — und die Antwort ist ernüchternd komplex.
Apple Research stellt LaDiR vor — einen neuen Reasoning-Ansatz, der das größte Problem heutiger Sprachmodelle angreift: Einmal geschriebene Tokens können nicht mehr korrigiert ...