Suche: TTS

TOOLS

Google überrascht mit verrücktem TTS-Modell

Google hat Gemini 3.1 Flash TTS veröffentlicht — ein Text-to-Speech-Modell, das sich per Prompt steuern lässt. Simon Willison berichtet gleich zweimal darüber. Das Ding ist ...

Simon Willison · 2026-04-16 13:19:18.463554+00:00 · Score 7/10

HOT

Mistral knallt TTS-Bombe auf den Markt

Europas teuerster KI-Laden liefert wieder. Mistral hat Voxtral TTS gelauncht — ein Text-to-Speech-Modell, das laut Benchmarks mit den Besten mithalten kann. Und ja, es ist ...

Latent Space · 2026-03-30 22:15:26.800417+00:00 · Score 8/10

TOOLS

Mistral baut jetzt Stimmen — mit Voxtral TTS

Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das neue Modell heißt Voxtral TTS und soll mehrsprachig, realistisch und ausdrucksstark klingen.

Product Hunt AI · 2026-03-27 08:19:36.952634+00:00 · Score 6/10

TOOLS

Mistral bringt eigenes Text-to-Speech-Modell raus

Das französische KI-Startup Mistral steigt ins Sprach-Game ein. Mit Voxtral TTS liefern die Pariser ihr erstes Text-to-Speech-Modell — und zwar als Open-Weights-Version.

The Decoder · 2026-03-26 20:18:38.676371+00:00 · Score 8/10

TOOLS

KI-Stimmen hören jetzt zu und lernen

Die meisten KI-Stimmen sind für Monologe gemacht, nicht für Gespräche. Inworld AI will das ändern und stellt Realtime TTS-2 vor. Dieses Modell passt sich in Echtzeit an deine ...

MarkTechPost · 2026-05-06 01:18:42.282318+00:00 · Score 6/10

HOT

Google bringt Gemini 3.1 Flash TTS

Google hat sein neues Audio-Modell gestartet. Gemini 3.1 Flash TTS soll KI-Stimmen ausdrucksstärker machen — und ist ab sofort in Google-Produkten verfügbar.

Google DeepMind + Google AI Blog · 2026-04-16 13:19:53.156140+00:00 · Score 8/10

TOOLS

Mistral baut jetzt auch Stimmen

Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Lab hat ein eigenes TTS-Modell vorgestellt — neun Sprachen, Fokus auf Voice Agents.

AI Business · 2026-03-30 01:37:03.303487+00:00 · Score 6/10

TOOLS

Mistral bringt eigene Sprach-KI als Open Weight

Frankreichs KI-Liebling Mistral steigt ins Text-to-Speech-Geschäft ein. Mit Voxtral TTS liefert das Pariser Start-up sein erstes Sprachmodell — und macht es direkt als Open ...

The Decoder · 2026-03-30 01:22:25.380877+00:00 · Score 7/10

TOOLS

Mistral baut jetzt Stimmen für 9 Sprachen

Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Unternehmen hat ein eigenes TTS-Modell vorgestellt, das neun Sprachen beherrscht und speziell für Voice ...

AI Business · 2026-03-27 20:20:07.935065+00:00 · Score 6/10

TOOLS

KI-Sprachgenerator läuft jetzt auf jeder Kaffeemaschine

Französische Forscher schmeißen die Grafikkarte raus. Ihr neues Tool "Pocket TTS" erzeugt Sprache direkt auf der CPU. Einfach installieren und loslegen.

GitHub Trending Python · 2026-05-07 04:16:30.278878+00:00 · Score 6/10

EXPERIMENTAL

VoxCPM2 wirft den Tokenizer raus

Chinesische Forscher bauen ein Text-to-Speech-System, das komplett ohne diskrete Token arbeitet. Stattdessen: durchgehende Diffusion, End-to-End, direkt von Text zu Sprache.

GitHub Trending Python · 2026-04-10 04:19:08.314319+00:00 · Score 5/10

HOT

Mistral feuert 4 Produkte in einer Woche raus

Die Franzosen drehen auf. Mistral hat mit Voxtral TTS ein Open-Weight Text-to-Speech-Modell gelauncht — und nebenbei noch Forge, Leanstral und einen Ausblick auf Mistral 4 ...

Latent Space · 2026-03-30 22:18:44.379615+00:00 · Score 8/10

TOOLS

Mistral knackt den Expressivity-Gap mit Voxtral

Mistral schickt ein neues TTS-Modell ins Rennen — und zielt direkt auf ElevenLabs. Voxtral klont Stimmen mehrsprachig und verspricht echte Emotion statt Roboter-Vortrag.

MarkTechPost · 2026-05-05 22:20:00.755250+00:00 · Score 6/10

HOT

Google killt die Sprachbarriere in Echtzeit

Google DeepMind hat Gemini 3.5 Live Translate gestartet. Das Modell übersetzt gesprochene Sprache fast verzögerungsfrei — und klingt dabei nicht wie ein Roboter.

Google DeepMind · 2026-06-09 16:19:27.570161+00:00 · Score 8/10

AGENTS

Voice-Agents in einer Codebasis statt fünf

AWS und Stream zeigen, wie ein Open-Source-Framework die klassische Voice-Pipeline kollabiert. Statt STT → LLM → TTS gibt's jetzt Speech-to-Speech direkt aus Bedrock.

AWS AI Blog · 2026-05-14 19:40:30.753720+00:00 · Score 6/10

EXPERIMENTAL

NeuTTS spricht Deutsch — komplett offline

Neuphonic wirft ein neues Text-to-Speech-Modell auf HuggingFace. Läuft lokal, frisst kaum Ressourcen — und kann sogar Deutsch.

GitHub Trending Python · 2026-04-30 04:22:51.963156+00:00 · Score 5/10

EXPERIMENTAL

Ein Klick, fertig ist der TikTok-Slop

Ein chinesischer Entwickler hat MoneyPrinterTurbo auf GitHub veröffentlicht — ein Tool, das per Knopfdruck komplette Kurzvideos generiert. Stichwort rein, Video raus.

GitHub Trending Python · 2026-05-28 04:18:24.598273+00:00 · Score 4/10

EXPERIMENTAL

KI-Vlogger reisen zurück nach Tudor-London

Auf YouTube erobern KI-generierte "History-Influencer" die Feeds. Eine junge Frau im grünen Puffer landet im Jahr 1536 — und trifft Henry VIII.

The Guardian AI · 2026-05-27 01:19:12.698455+00:00 · Score 2/10

EXPERIMENTAL

Māori-KI spricht Big Tech die Stirn

Ein kleines Sprachmodell aus Neuseeland zeigt, wie KI auch funktioniert: ohne Datenklau, ohne Konzern-Logik. Te Hiku Media baut ein Text-to-Speech-Modell für te reo Māori — und ...

IEEE Spectrum AI · 2026-05-21 16:22:07.678908+00:00 · Score 4/10

EXPERIMENTAL

DramaBox lässt KI Drama spielen

Resemble AI hat ein neues Spielzeug gelauncht: DramaBox verwandelt Szenenbeschreibungen in komplette Vocal-Performances. Statt nur Text vorzulesen, soll die KI flüstern, schreien, ...

Product Hunt AI · 2026-05-16 01:21:11.111029+00:00 · Score 3/10

SUCHE

Google überrascht mit verrücktem TTS-Modell

Mistral knallt TTS-Bombe auf den Markt

Mistral baut jetzt Stimmen — mit Voxtral TTS

Mistral bringt eigenes Text-to-Speech-Modell raus

KI-Stimmen hören jetzt zu und lernen

Google bringt Gemini 3.1 Flash TTS

Mistral baut jetzt auch Stimmen

Mistral bringt eigene Sprach-KI als Open Weight

Mistral baut jetzt Stimmen für 9 Sprachen

KI-Sprachgenerator läuft jetzt auf jeder Kaffeemaschine

VoxCPM2 wirft den Tokenizer raus

Mistral feuert 4 Produkte in einer Woche raus

Mistral knackt den Expressivity-Gap mit Voxtral

Google killt die Sprachbarriere in Echtzeit

Voice-Agents in einer Codebasis statt fünf

NeuTTS spricht Deutsch — komplett offline

Ein Klick, fertig ist der TikTok-Slop

KI-Vlogger reisen zurück nach Tudor-London

Māori-KI spricht Big Tech die Stirn

DramaBox lässt KI Drama spielen