Google schaltet native Bildgenerierung in Gemini 2.0 Flash frei. Entwickler können ab sofort in Google AI Studio und über die Gemini API damit experimentieren.
OpenAIs Bildgenerator GPT-Image-2 wird gerade zum Liebling der Kreativ-Szene. Während alle anderen Labs auf Coding und Enterprise schielen, zeigt das Modell, was passiert, wenn ...
Partnerschaft hin oder her — Microsoft macht jetzt sein eigenes Ding. Der Konzern hat drei hauseigene ML-Modelle vorgestellt: Spracherkennung, Sprachsynthese und Bildgenerierung. ...
Langsame KI-Bilder nerven. Forscher haben jetzt einen Trick gefunden, der Diffusion-Modelle parallelisiert — ohne sie neu trainieren zu müssen.
OpenAI hat die wissenschaftliche Grundlage hinter DALL-E 2 veröffentlicht. Der Titel klingt sperrig, der Inhalt hat es in sich: hierarchische Bildgenerierung auf Basis von ...
Google knallt ein neues Bildmodell raus. Nano Banana 2 — ja, der Name ist echt — soll Pro-Level-Qualität liefern und läuft unter der Haube als Gemini 3.1 Flash Image.
Google DeepMind hat ein neues Open-Weights-Modell vorgestellt, das Techniken aus der Bildgenerierung auf Text überträgt. Das Ding heißt DiffusionGemma — und macht Text-Output bis ...
Diffusion Models können Bilder erzeugen, die sie nie gesehen haben. Aber wie genau schaffen sie das? Apple hat nachgeschaut — und die Antwort ist ernüchternd komplex.
Das Open-Source-Tool für KI-Bildgenerierung ist jetzt eine halbe Milliarde Dollar wert. ComfyUI hat eine 30-Millionen-Dollar-Finanzierungsrunde abgeschlossen.
Codex kann jetzt mehr als nur Code schreiben. OpenAI hat die Desktop-App für macOS und Windows mit Computer Use, Browser, Bildgenerierung, Memory und Plugins aufgebohrt.
Google verknüpft seinen Bildgenerator jetzt direkt mit Google Photos. Wer zustimmt, lässt Gemini die komplette Foto-Bibliothek durchforsten — inklusive aller Labels, Gesichter und ...
Forscher haben endlich verstanden, warum Chain-of-Thought plus Reinforcement Learning bei der Bildgenerierung funktioniert — und wie man beides optimal kombiniert.
Microsofts hauseigene KI-Schmiede MAI liefert ab. Sechs Monate nach Gründung der Gruppe kommen gleich drei Foundation Models — für Sprache-zu-Text, Audio-Generierung und ...
Google hat ein neues Bildmodell vorgestellt. Nano Banana 2 — offiziell Gemini 3.1 Flash Image — soll Pro-Qualität liefern, und zwar für alle Bild-Anwendungen.
Auf der Build 2026 packt Microsoft sieben eigene KI-Modelle aus. Eins davon ist das erste hauseigene Reasoning-Modell — und das hinkt schon bei Release hinterher.
Nvidias Nemotron-Labs zeigt Diffusion Language Models, die Text nicht mehr Wort für Wort generieren. Statt sequenziell zu rattern, würfelt das Modell ganze Blöcke parallel ...
Elon Musks Rakete bekommt ein KI-Problem. SpaceX muss vor dem IPO offen zugeben: Groks "Spicy"-Modus könnte richtig teuer werden.
NVIDIA Labs hat Sana auf GitHub geworfen — eine ganze Familie von Bildgeneratoren, die schneller laufen sollen als alles, was Diffusion bisher gezeigt hat.
Eine KI zeigte Uhrenfans Royal Oak-Modelle, die nie existierten. Die Fans liebten sie. Nun wird die Fantasie in China zur Realität.
Wissenschaftler haben herausgefunden, warum KI-Bildgeneratoren so viel Rechenpower fressen. Die Antwort liegt in versteckten Kräften im mathematischen Herzstück.