Suche: Audio-Modelle

HOT

OpenAI bringt drei neue Sprach-Modelle

OpenAI dreht beim Voice-Game auf. Drei neue Audio-Modelle sollen Live-Gespräche auf GPT-5-Niveau bringen.

The Decoder · 2026-05-07 19:18:17.168377+00:00 · Score 9/10

EXPERIMENTAL

Audio-KI für alle: Smol-Audio macht Fine-Tuning easy

Eine neue Notebook-Sammlung schmeißt fünf Audio-Modelle in einen Colab-Topf. Trainieren ohne Server-Park.

MarkTechPost · 2026-04-30 04:24:51.688687+00:00 · Score 2/10

HOT

OpenAI feuert drei Audio-Modelle raus

OpenAI bringt gleich drei neue Realtime-Modelle und schaltet die Realtime-API auf produktiv. Schluss mit Beta-Ausreden für Entwickler.

MarkTechPost · 2026-05-09 01:20:19.984534+00:00 · Score 8/10

HOT

Google bringt Gemini 3.1 Flash TTS

Google hat sein neues Audio-Modell gestartet. Gemini 3.1 Flash TTS soll KI-Stimmen ausdrucksstärker machen — und ist ab sofort in Google-Produkten verfügbar.

Google DeepMind + Google AI Blog · 2026-04-16 13:19:53.156140+00:00 · Score 8/10

HOT

Google macht KI-Stimmen ununterscheidbar von Menschen

Google hat ein neues Audio-Modell vorgestellt: Gemini 3.1 Flash Live. Echtzeit-Konversation mit einer KI, die nicht mehr nach KI klingt.

Ars Technica AI · 2026-03-26 20:18:56.951829+00:00 · Score 7/10

HOT

OpenAI bringt KI-Sprechstunde für alle

OpenAI hat drei neue Audio-Modelle in die API geworfen. Jetzt kann jeder Entwickler Echtzeit-KI-Gespräche in seine Apps bauen.

Heise KI · 2026-05-09 01:22:19.615316+00:00 · Score 6/10

HOT

Google killt den Dolmetscher in Echtzeit

Google hat Gemini 3.5 Live Translate vorgestellt. Das Modell übersetzt gesprochene Sprache simultan in über 70 Sprachen — ohne Wartezeit, ohne Satzpause.

The Decoder · 2026-06-09 19:19:49.889293+00:00 · Score 8/10

TOOLS

Stability AI knallt Stable Audio 3 raus

Stability AI hat die Open Weights von Stable Audio 3 veröffentlicht — samt Research Paper. Latent Diffusion für Stereo-Sound in Studioqualität, drei Modellgrößen, frei zum ...

MarkTechPost · 2026-05-27 01:18:51.744307+00:00 · Score 6/10

AGENTS

MiniMax M3 schluckt 1 Million Token

Chinas KI-Startup MiniMax hat sein neues Flaggschiff-Modell M3 vorgestellt. Der Fokus: Coding-Agenten und lange Workflows.

SCMP Tech · 2026-06-01 07:19:52.090779+00:00 · Score 6/10

SUCHE