Wer glaubt, GPT-5 und Claude Opus hätten eine feste Meinung, irrt. Eine neue Untersuchung zeigt: Dieselben Modelle urteilen anders, je nachdem ob man sie auf Deutsch, Englisch ...
Google hat Gemini 3.5 Live Translate vorgestellt. Das Modell übersetzt gesprochene Sprache simultan in über 70 Sprachen — ohne Wartezeit, ohne Satzpause.
Alibabas Qwen-Team hat ein neues Echtzeit-Übersetzungsmodell rausgehauen. Qwen3.5-LiveTranslate-Flash übersetzt Sprache in 60 Sprachen — bevor der Satz zu Ende ist.
Vision-Language-Modelle liefern Top-Scores auf Englisch. Aber fragt man sie auf Hindi oder Tamil, wird's peinlich.
Ein Brandenburger Schüler hat ein Sprachmodell trainiert, das komplizierte Texte in Leichte Sprache übersetzt. Sein Projekt "Jacob" hat ihm jetzt den KI-Sonderpreis bei Jugend ...
Ein kleines Sprachmodell aus Neuseeland zeigt, wie KI auch funktioniert: ohne Datenklau, ohne Konzern-Logik. Te Hiku Media baut ein Text-to-Speech-Modell für te reo Māori — und ...
Ein Pivotal-Mentee-Bewerber will Transformer auf einer Mini-Sprache trainieren, um endlich zu verstehen, was im Inneren passiert. Klingt nerdig — ist es auch.
Tencent hat ein Mini-KI-Modell als Open-Weight veröffentlicht, das 33 Sprachen offline übersetzt. Direkt auf dem Smartphone. Ohne Cloud, ohne Datenleck.
Ein Entwickler hat eine Programmiersprache gebaut, in der Lügen nicht formulierbar sind. Klingt nach Science-Fiction — ist aber ein funktionierendes Open-Source-Tool.
Ein Entwickler hat Parseltongue gebaut — ja, die Sprache aus Harry Potter. Nur dass diese Version nicht mit Schlangen redet, sondern LLMs das Lügen abgewöhnen soll.
Redmond hat ein neues Sprache-zu-Text-Modell vorgestellt. MAI-Transcribe-1 soll in 25 Sprachen zuverlässig transkribieren — auch wenn im Hintergrund die Baustelle hämmert.
Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Unternehmen hat ein eigenes TTS-Modell vorgestellt, das neun Sprachen beherrscht und speziell für Voice ...
Cohere veröffentlicht ein neues Voice-Modell — und verschenkt es an alle. Der Fokus: Transkription, nicht Chatbot-Gelaber.
112 Probanden, drei Sprachen, sieben KI-Modelle in der fMRT-Röhre. Eine neue Studie zeigt: Wie gut ein LLM zum menschlichen Gehirn "passt", hängt nicht von der Sprachfamilie ab. ...
OpenAI dreht beim Voice-Game auf. Drei neue Audio-Modelle sollen Live-Gespräche auf GPT-5-Niveau bringen.
Forscher haben Diffusion-Transformer auf Materialdesign losgelassen — und das Ergebnis ist wild. Statt monatelang Strukturen durchzuprobieren, spuckt die KI maßgeschneiderte ...
Audio war immer das Stiefkind der multimodalen KI. Bilder verstehen? Kein Problem. Aber Sprache, Musik und Umgebungsgeräusche gleichzeitig verarbeiten? Daran scheitern die meisten ...
Emotionen aus Sprache lesen — das können Maschinen längst. Aber bisher fast nur auf Englisch, Deutsch oder Chinesisch. Ein Forscherteam hat jetzt ein System gebaut, das auch ...
Chinesische Forscher bauen ein Text-to-Speech-System, das komplett ohne diskrete Token arbeitet. Stattdessen: durchgehende Diffusion, End-to-End, direkt von Text zu Sprache.
Cohere droppt ein Open-Source-Modell nur für Transkription. Und das Ding läuft auf normalen Grafikkarten.