Wer mit KI redet, will nicht warten. Salesforce AI Research hat ein neues Framework vorgestellt, das die Antwortzeit von sprachbasierten RAG-Systemen um das 316-Fache drückt.
OpenAI rüstet die Responses API auf WebSockets um. Schluss mit dem ständigen HTTP-Hin-und-Her bei Agenten-Workflows.
Google DeepMind feuert das nächste Update raus. Gemini 3.1 Flash Live soll Audio-Interaktionen flüssiger, natürlicher und präziser machen — weniger Latenz, mehr Genauigkeit.
Together AI bringt den schnellsten Sprach-KI-Stack auf den Markt. Unter einer Sekunde Latenz — vom gesprochenen Wort bis zur gesprochenen Antwort.
KI frisst Strom wie nichts Gutes. Rechenzentren blasen immer mehr CO₂ in die Luft, und die großen Tech-Konzerne flirten bereits mit Atomkraft. Jetzt wollen Forscher einen anderen ...
Google bringt zwei neue Preisstufen für die Gemini-API. Flex und Priority heißen die neuen Tiers — und Entwickler müssen sich jetzt entscheiden: Geld sparen oder Geschwindigkeit ...
Google hat Gemini 3.1 Flash Live als Preview veröffentlicht — ein Modell, das Audio, Video und Tool-Nutzung in Echtzeit verarbeitet. Entwickler können ab sofort über die Gemini ...
Ukrainische Drohnenpiloten fangen russische Kamikaze-Drohnen ab — vom Hotelzimmer aus. Die Entfernung zum Schlachtfeld: bis zu 2.000 Kilometer.
Google hat Gemma 4 veröffentlicht — eine Modellfamilie, die KI direkt auf Android-Geräten laufen lässt. Ohne Cloud, ohne Umwege, ohne Latenz.
Ein neues Tool will das Compute-Problem von Open-Source-Modellen lösen. Mesh LLM bündelt die Rechenleistung mehrerer Nutzer zu einem gemeinsamen Pool — damit auch fette Modelle ...
Ein neues Indie-Projekt will Rechenleistung bündeln. Mesh LLM setzt auf verteiltes Compute-Pooling, damit Open-Source-Modelle auf normaler Hardware laufen.
Schluss mit der Zwei-Klassen-Gesellschaft. Open-Weight-Modelle wie GLM-5 und MiniMax M2.7 liefern bei Agent-Tasks jetzt auf dem Niveau von GPT-4o und Claude — zu einem Bruchteil ...
Der Large Hadron Collider spuckt Daten aus wie ein Feuerwehrschlauch. 63 Terabit pro Sekunde. Und die Hardware hat nur wenige Nanosekunden, um zu entscheiden: Physik-Nobelpreis ...
Ein Startup will Datacenter in den Orbit schießen. Und Investoren werfen Geld hinterher, als gäbe es keine Schwerkraft.
Französische Forscher schmeißen die Grafikkarte raus. Ihr neues Tool "Pocket TTS" erzeugt Sprache direkt auf der CPU. Einfach installieren und loslegen.
Die KI-Firma hat AMD, Intel, Nvidia und Microsoft dazu gebracht, gemeinsam ein neues Netzwerk-Protokoll zu entwickeln. Es soll die Supercomputer der Zukunft antreiben.
Google packt sein Gemini Nano AI-Modell ungefragt in den Chrome-Ordner. User merken es erst, wenn die Festplatte voll ist.
Mistral schickt ein neues TTS-Modell ins Rennen — und zielt direkt auf ElevenLabs. Voxtral klont Stimmen mehrsprachig und verspricht echte Emotion statt Roboter-Vortrag.
Die nächste KI-Goldgrube liegt nicht in der Wüste, sondern auf hoher See. Investoren wie Peter Thiel setzen jetzt Hunderte Millionen auf schwimmende Rechenzentren, die von ...
ChatGPT hat ein neues Standard-Modell. Ohne große Ankündigung hat OpenAI GPT-5.5 Instant als neuen Default aktiviert.