Google hat Gemini 3.1 Flash TTS veröffentlicht — ein Text-to-Speech-Modell, das sich per Prompt steuern lässt. Simon Willison berichtet gleich zweimal darüber. Das Ding ist ...
Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Lab hat ein eigenes TTS-Modell vorgestellt — neun Sprachen, Fokus auf Voice Agents.
Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Unternehmen hat ein eigenes TTS-Modell vorgestellt, das neun Sprachen beherrscht und speziell für Voice ...
Mistral schickt ein neues TTS-Modell ins Rennen — und zielt direkt auf ElevenLabs. Voxtral klont Stimmen mehrsprachig und verspricht echte Emotion statt Roboter-Vortrag.
Chinesische Forscher bauen ein Text-to-Speech-System, das komplett ohne diskrete Token arbeitet. Stattdessen: durchgehende Diffusion, End-to-End, direkt von Text zu Sprache.
Ein kleines Sprachmodell aus Neuseeland zeigt, wie KI auch funktioniert: ohne Datenklau, ohne Konzern-Logik. Te Hiku Media baut ein Text-to-Speech-Modell für te reo Māori — und ...
Neuphonic wirft ein neues Text-to-Speech-Modell auf HuggingFace. Läuft lokal, frisst kaum Ressourcen — und kann sogar Deutsch.