AWS und Stream zeigen, wie ein Open-Source-Framework die klassische Voice-Pipeline kollabiert. Statt STT → LLM → TTS gibt's jetzt Speech-to-Speech direkt aus Bedrock.
Elon Musks xAI hat eine neue API live geschaltet: "Custom Voices". Entwickler können damit ihre eigene Stimme klonen — in unter 120 Sekunden.
OpenAI bringt gleich drei neue Realtime-Modelle und schaltet die Realtime-API auf produktiv. Schluss mit Beta-Ausreden für Entwickler.
SAP greift zu. Der Konzern investiert in das Berliner Workflow-Automation-Startup n8n — und macht es damit zu einem der wertvollsten KI-Startups Deutschlands.
OpenAI hat gerade drei neue Echtzeit-Voice-Modelle rausgehauen. Die alten waren lahme Ente, die neuen sind Turbo.
xAI hat ein neues Sprachmodell veröffentlicht: grok-voice-think-fast-1.0. Es führt den τ-voice Bench mit 67,3% an — und lässt damit Gemini, GPT Realtime und alle anderen hinter ...
OpenAI hat drei neue Audio-Modelle in die API geworfen. Jetzt kann jeder Entwickler Echtzeit-KI-Gespräche in seine Apps bauen.
Mistral schickt ein neues TTS-Modell ins Rennen — und zielt direkt auf ElevenLabs. Voxtral klont Stimmen mehrsprachig und verspricht echte Emotion statt Roboter-Vortrag.