IBM hat Granite Speech 4.1 2B und 4.1 2B-NAR veröffentlicht — beide Open Source unter Apache 2.0. Zwei kompakte Speech-Modelle, die zeigen, was 2 Milliarden Parameter im ...
Mistral hat ein neues Open-Source-Modell für Sprachgenerierung veröffentlicht. Das Ding ist so klein, dass es auf einer Smartwatch oder einem Smartphone läuft.
Redmond hat ein neues Sprache-zu-Text-Modell vorgestellt. MAI-Transcribe-1 soll in 25 Sprachen zuverlässig transkribieren — auch wenn im Hintergrund die Baustelle hämmert.