Suche: Voice-Agents

AGENTS

Voice-Agents in einer Codebasis statt fünf

AWS und Stream zeigen, wie ein Open-Source-Framework die klassische Voice-Pipeline kollabiert. Statt STT → LLM → TTS gibt's jetzt Speech-to-Speech direkt aus Bedrock.

AWS AI Blog · 2026-05-14 19:40:30.753720+00:00 · Score 6/10

TOOLS

xAI klont deine Stimme in zwei Minuten

Elon Musks xAI hat eine neue API live geschaltet: "Custom Voices". Entwickler können damit ihre eigene Stimme klonen — in unter 120 Sekunden.

The Decoder · 2026-05-02 13:18:36.339265+00:00 · Score 6/10

HOT

OpenAI feuert drei Audio-Modelle raus

OpenAI bringt gleich drei neue Realtime-Modelle und schaltet die Realtime-API auf produktiv. Schluss mit Beta-Ausreden für Entwickler.

MarkTechPost · 2026-05-09 01:20:19.984534+00:00 · Score 8/10

EXPERIMENTAL

CrankGPT: KI per Handkurbel statt Datacenter

Ein Bastler baut eine KI-Box, die ohne Strom aus der Steckdose läuft. Power kommt direkt aus dem Handgelenk.

The Register AI · 2026-06-11 19:20:04.127484+00:00 · Score 5/10

GELD

SAP pumpt Millionen in n8n

SAP greift zu. Der Konzern investiert in das Berliner Workflow-Automation-Startup n8n — und macht es damit zu einem der wertvollsten KI-Startups Deutschlands.

Heise KI · 2026-05-13 22:19:25.151355+00:00 · Score 6/10

HOT

OpenAI schlägt zurück: Neue Voice-Modelle crashen Benchmarks

OpenAI hat gerade drei neue Echtzeit-Voice-Modelle rausgehauen. Die alten waren lahme Ente, die neuen sind Turbo.

Latent Space · 2026-05-08 10:22:14.697191+00:00 · Score 7/10

HOT

Groks Voice-Modell schlägt GPT und Gemini

xAI hat ein neues Sprachmodell veröffentlicht: grok-voice-think-fast-1.0. Es führt den τ-voice Bench mit 67,3% an — und lässt damit Gemini, GPT Realtime und alle anderen hinter ...

MarkTechPost · 2026-04-26 01:15:29.255448+00:00 · Score 8/10

EXPERIMENTAL

KI hört dir permanent zu — alle 0,4 Sekunden

Ein neues Sprachmodell namens "Audio-Interaction" macht Schluss mit der lästigen Push-to-Talk-Logik. Es lauscht dauerhaft und entscheidet selbst, wann es den Mund aufmacht.

The Decoder · 2026-06-06 13:20:38.616227+00:00 · Score 5/10

HOT

OpenAI bringt KI-Sprechstunde für alle

OpenAI hat drei neue Audio-Modelle in die API geworfen. Jetzt kann jeder Entwickler Echtzeit-KI-Gespräche in seine Apps bauen.

Heise KI · 2026-05-09 01:22:19.615316+00:00 · Score 6/10