Diffusion-Modelle für Text sind das neue heiße Eisen. Aber sie können gefährlichen Müll produzieren. Jetzt gibt es einen neuen Ansatz, sie sicher zu machen.
OpenAI bringt ein Tool raus, das erkennen soll, ob ein Text von einer KI geschrieben wurde. Ausgerechnet die Firma, die das Problem erst geschaffen hat, will jetzt die Lösung ...
OpenAI hat sein Bildmodell aufgebohrt. Images 2.0 soll endlich Text auf Bildern korrekt darstellen — der eine Punkt, an dem bisher jeder KI-Generator kläglich scheiterte.
ChatGPT hat ein neues Bildmodell. Images 2.0 kann plötzlich das, woran KI-Generatoren seit Jahren scheitern: lesbaren Text in Bilder schreiben.
Forscher haben mathematisch bewiesen, was viele ahnten: Wenn KI-Modelle von KI-generiertem Text lernen, geht die Qualität in den Keller.
Ein ganzes Haiku — komprimiert auf 10 Bit. Forscher zeigen, dass große Sprachmodelle Texte so brutal zusammenstauchen können, wie es kein klassischer Algorithmus je könnte.
Alibaba hat nachgelegt. Das Qwen-Team veröffentlicht Qwen3.5-Omni — ein Modell, das Text, Bild, Audio und Video nativ verarbeitet. Kein Zusammenkleben einzelner Module mehr, ...
Cohere kennt man für Text-Modelle und Embeddings. Jetzt steigt das Unternehmen mit "Cohere Transcribe" in den Markt für automatische Spracherkennung ein.
OpenAI hat neue Versionen von GPT-3 und Codex veröffentlicht. Die Modelle können erstmals bestehenden Text bearbeiten und ergänzen — nicht nur am Ende weiterschreiben.
Apple-Forscher haben ein neues Rezept für bessere Bild-KI. Sie füttern ihr System mit Text, um die Unsicherheit beim Lernen zu killen.
Der Papst postet auf Social Media über die Gefahren Künstlicher Intelligenz. Dumm nur: Ein Erkennungstool behauptet, die Texte seien selbst KI-generiert.
ChatGPT bekommt ein neues Bildmodell. "Images 2.0" soll detailliertere Bilder liefern und endlich Text richtig rendern können.
Forscher wollen Faktenchecks endlich ins Bilderzeitalter bringen. Ihr neuer Ansatz extrahiert überprüfbare Behauptungen nicht nur aus Text — sondern auch aus Memes, Screenshots ...
Ein neues Tool verspricht: Text rein, Gen-Z-Sprache raus. "Turn It Gen Z" verwandelt jeden noch so trockenen Satz in Jugendsprache — auf Knopfdruck.
Ein Entwickler hat ein Sprachmodell gebaut, das ausschließlich auf Texten vor 1900 trainiert wurde. Kein Internet, kein Reddit, keine modernen Daten — nur 28.000 Bücher aus der ...
AWS und Stream zeigen, wie ein Open-Source-Framework die klassische Voice-Pipeline kollabiert. Statt STT → LLM → TTS gibt's jetzt Speech-to-Speech direkt aus Bedrock.
Simon Willison hat ein Tool gebaut, das aus einer simplen URL eine Präsentationsslide zaubert. Kein PowerPoint, kein Canva — nur ein Link.
Forscher haben eine KI trainiert, Verkehrsunfälle aus öffentlichen Texten zu rekonstruieren. Das könnte Versicherungen und Ermittlern helfen.
Wer mit ChatGPT seine Mails schreibt, gilt als faul. Eine neue Browser-Erweiterung löst das Problem — indem sie Tippfehler einbaut.
Ein Startup verspricht: Mit seiner Plattform kann jeder KI-Spiele basteln. Ohne Code.