Wer glaubt, GPT-5 und Claude Opus hätten eine feste Meinung, irrt. Eine neue Untersuchung zeigt: Dieselben Modelle urteilen anders, je nachdem ob man sie auf Deutsch, Englisch ...
Alibabas Qwen-Team hat ein neues Echtzeit-Übersetzungsmodell rausgehauen. Qwen3.5-LiveTranslate-Flash übersetzt Sprache in 60 Sprachen — bevor der Satz zu Ende ist.
Vision-Language-Modelle liefern Top-Scores auf Englisch. Aber fragt man sie auf Hindi oder Tamil, wird's peinlich.
Ein kleines Sprachmodell aus Neuseeland zeigt, wie KI auch funktioniert: ohne Datenklau, ohne Konzern-Logik. Te Hiku Media baut ein Text-to-Speech-Modell für te reo Māori — und ...
Ein Pivotal-Mentee-Bewerber will Transformer auf einer Mini-Sprache trainieren, um endlich zu verstehen, was im Inneren passiert. Klingt nerdig — ist es auch.
Tencent hat ein Mini-KI-Modell als Open-Weight veröffentlicht, das 33 Sprachen offline übersetzt. Direkt auf dem Smartphone. Ohne Cloud, ohne Datenleck.
Ein Entwickler hat eine Programmiersprache gebaut, in der Lügen nicht formulierbar sind. Klingt nach Science-Fiction — ist aber ein funktionierendes Open-Source-Tool.
Ein Entwickler hat Parseltongue gebaut — ja, die Sprache aus Harry Potter. Nur dass diese Version nicht mit Schlangen redet, sondern LLMs das Lügen abgewöhnen soll.
Redmond hat ein neues Sprache-zu-Text-Modell vorgestellt. MAI-Transcribe-1 soll in 25 Sprachen zuverlässig transkribieren — auch wenn im Hintergrund die Baustelle hämmert.
Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Unternehmen hat ein eigenes TTS-Modell vorgestellt, das neun Sprachen beherrscht und speziell für Voice ...
Cohere veröffentlicht ein neues Voice-Modell — und verschenkt es an alle. Der Fokus: Transkription, nicht Chatbot-Gelaber.
OpenAI dreht beim Voice-Game auf. Drei neue Audio-Modelle sollen Live-Gespräche auf GPT-5-Niveau bringen.
Forscher haben Diffusion-Transformer auf Materialdesign losgelassen — und das Ergebnis ist wild. Statt monatelang Strukturen durchzuprobieren, spuckt die KI maßgeschneiderte ...
Audio war immer das Stiefkind der multimodalen KI. Bilder verstehen? Kein Problem. Aber Sprache, Musik und Umgebungsgeräusche gleichzeitig verarbeiten? Daran scheitern die meisten ...
Emotionen aus Sprache lesen — das können Maschinen längst. Aber bisher fast nur auf Englisch, Deutsch oder Chinesisch. Ein Forscherteam hat jetzt ein System gebaut, das auch ...
Chinesische Forscher bauen ein Text-to-Speech-System, das komplett ohne diskrete Token arbeitet. Stattdessen: durchgehende Diffusion, End-to-End, direkt von Text zu Sprache.
Cohere droppt ein Open-Source-Modell nur für Transkription. Und das Ding läuft auf normalen Grafikkarten.
Frankreichs KI-Liebling Mistral steigt ins Text-to-Speech-Geschäft ein. Mit Voxtral TTS liefert das Pariser Start-up sein erstes Sprachmodell — und macht es direkt als Open ...
Vercel Labs hat Zero veröffentlicht — eine systemnahe Programmiersprache, die nicht für Menschen gemacht ist. Sondern für KI-Agenten, die Code lesen, reparieren und ausliefern ...
Together AI hat ein Open-Source-Tool gedroppt, das Videos automatisch in andere Sprachen übersetzt. Komplett — inklusive Stimme.