Google hat Gemini 3.1 Flash Live vorgestellt. Das neue Modell soll bei Sprachdialogen natürlicher klingen als der Vorgänger — und dabei schneller reagieren.
Google feuert das nächste Modell raus. Gemini 3.1 Flash Live ist ab sofort in Google-Produkten verfügbar — und zielt direkt auf natürlichere Audio-KI.
Google DeepMind feuert das nächste Update raus. Gemini 3.1 Flash Live soll Audio-Interaktionen flüssiger, natürlicher und präziser machen — weniger Latenz, mehr Genauigkeit.
Quadratische Rechenkosten waren bisher der Flaschenhals für Attention-Mechanismen bei 3D-Daten. Ein neues Paper in Nature Machine Intelligence macht damit Schluss.
Ein humanoider Roboter aus Polen hat einen neuen Job: Wildschweine verscheuchen. Sein Name ist Edek, und er ist nebenbei noch Influencer.
Die kirgisische Krypto-Börse Grinex ist 13,7 Millionen Dollar los. Statt Fehler einzugestehen, zeigt die Firma mit dem Finger auf „westliche Geheimdienste".
Ein GitHub-Projekt will Robotik so einfach machen wie Webentwicklung. dimensionalOS liefert ein Open-Source-Betriebssystem, mit dem Entwickler Humanoide, Drohnen und Laufroboter ...
Die Uni Hongkong hat ein neues Open-Source-Framework auf GitHub gedroppt. AutoAgent verspricht: LLM-Agenten erstellen nur durch natürliche Sprache — kein Python, kein YAML, kein ...
Forscher haben einen LLM-Pipeline gebaut, die aus hunderttausenden Abstracts automatisch Konzeptgraphen erstellt — und damit vorhersagt, welche Themen-Kombis als nächstes in der ...
Google hat ein neues Audio-Modell vorgestellt: Gemini 3.1 Flash Live. Echtzeit-Konversation mit einer KI, die nicht mehr nach KI klingt.
Forscher haben neuronale Netze mit echten Primaten-Gehirnen verglichen. Das Ergebnis ist ernüchternd — für die KI.
Together AI bringt den schnellsten Sprach-KI-Stack auf den Markt. Unter einer Sekunde Latenz — vom gesprochenen Wort bis zur gesprochenen Antwort.
NVIDIA stellt GR00T N1.7 auf Hugging Face — ein Open-Weight-Modell, das Humanoide Roboter sehen, verstehen und handeln lässt. Kein Closed-Source-Geheimnis, sondern frei verfügbar.
Canva hat seinen AI Assistant aufgebohrt. Das Ding baut ab sofort komplette Designs per Textbefehl — und ruft dafür selbstständig Tools auf.
Snap Inc. schmeißt 16 Prozent der Belegschaft raus. Begründung laut internem Memo: "rasante Fortschritte in der künstlichen Intelligenz".
Adobe bringt den Firefly AI Assistant. Statt Photoshop-Menüs zu wälzen, tippst du einfach rein, was du willst — und die KI macht den Rest.
Audio war immer das Stiefkind der multimodalen KI. Bilder verstehen? Kein Problem. Aber Sprache, Musik und Umgebungsgeräusche gleichzeitig verarbeiten? Daran scheitern die meisten ...
Amazon will, dass Unternehmen ihre KI-Agenten nicht mehr selbst betreiben. Die Lösung: Bedrock AgentCore — ein Managed Service, der Agenten jedes Frameworks in der AWS-Cloud ...
Ein Open-Source-Projekt verbindet Blender direkt mit Claude AI. Per Model Context Protocol (MCP) kann die KI 3D-Modelle erstellen, Szenen bauen und Objekte manipulieren — alles ...
Lego hat den "Smart Brick" vorgestellt — einen vernetzten Baustein, der piepst, quakt und brabbelt. Klingt nach Zukunft, fühlt sich aber eher nach sprechendem Furby an.