OpenAI dreht beim Voice-Game auf. Drei neue Audio-Modelle sollen Live-Gespräche auf GPT-5-Niveau bringen.
Eine neue Notebook-Sammlung schmeißt fünf Audio-Modelle in einen Colab-Topf. Trainieren ohne Server-Park.
OpenAI bringt gleich drei neue Realtime-Modelle und schaltet die Realtime-API auf produktiv. Schluss mit Beta-Ausreden für Entwickler.
Google hat sein neues Audio-Modell gestartet. Gemini 3.1 Flash TTS soll KI-Stimmen ausdrucksstärker machen — und ist ab sofort in Google-Produkten verfügbar.
Google hat ein neues Audio-Modell vorgestellt: Gemini 3.1 Flash Live. Echtzeit-Konversation mit einer KI, die nicht mehr nach KI klingt.
OpenAI hat drei neue Audio-Modelle in die API geworfen. Jetzt kann jeder Entwickler Echtzeit-KI-Gespräche in seine Apps bauen.
Google hat Gemini 3.5 Live Translate vorgestellt. Das Modell übersetzt gesprochene Sprache simultan in über 70 Sprachen — ohne Wartezeit, ohne Satzpause.
Stability AI hat die Open Weights von Stable Audio 3 veröffentlicht — samt Research Paper. Latent Diffusion für Stereo-Sound in Studioqualität, drei Modellgrößen, frei zum ...
Chinas KI-Startup MiniMax hat sein neues Flaggschiff-Modell M3 vorgestellt. Der Fokus: Coding-Agenten und lange Workflows.