Forscher zeigen: LLM-Agenten mit externem Memory lösen das Lernproblem nicht — sie verschieben es nur.
Unitree hat seinen zweibeinigen Roboter H1 auf die Sprintbahn geschickt. Unter Laborbedingungen erreicht die Maschine Zeiten, die nah an Usain Bolts Weltrekord rankommen.
xAI hat ein neues Sprachmodell veröffentlicht: grok-voice-think-fast-1.0. Es führt den τ-voice Bench mit 67,3% an — und lässt damit Gemini, GPT Realtime und alle anderen hinter ...
Hugging Face hat einen Open-Source-ML-Ingenieur veröffentlicht. Der "ml-intern" liest Papers, trainiert Modelle und liefert Code.
Ein autonomer Roboter der chinesischen Firma Honor hat einen Halbmarathon in 50 Minuten und 26 Sekunden absolviert. Das sind 7 Minuten schneller als der menschliche Weltrekord.
OpenAI plant den größten Tech-Börsengang aller Zeiten. Doch hinter den Kulissen brodelt es gewaltig — Altmans eigene Investoren zweifeln an ihm.
Anthropic hat Claude Opus 4.7 veröffentlicht. Das Modell zielt auf zwei Enterprise-Probleme: Model Drift und Halluzinationen.
Schwedische Forscher der Chalmers University haben eine Theorie entwickelt, die Quantencomputing grundlegend verändern könnte. Ihr Konzept: "Giant Superatoms" — künstliche ...
Anthropic launcht Claude for Word als Beta. Das Ziel: Anwälte sollen KI nicht mehr über den Browser nutzen, sondern direkt da, wo sie arbeiten — in Word.
Ein Vorfall bei Anthropic hat Washington in Aufruhr versetzt. US-Finanzminister Scott Bessent und Fed-Chef Jerome Powell sahen sich gezwungen, die CEOs der größten Banken ...
LangChain launcht Deep Agents Deploy in der Beta. Ein Open-Source-Harness für Agenten, der direkt gegen Claudes Managed Agents positioniert wird.
Fidji Simo, OpenAIs CEO für AGI-Deployment, geht auf unbestimmte medizinische Auszeit. Grund: eine neuroimmune Erkrankung. Mehrere US-Medien berichten übereinstimmend über den ...
Brad Lightcap, bisher COO von OpenAI, leitet ab sofort "Special Projects". Gleichzeitig verlässt Marketingchefin Kate Rouch das Unternehmen — sie kämpft gegen Krebs.
GLM-5 und MiniMax M2.7 — zwei Open-Weight-Modelle, von denen die meisten noch nie gehört haben. Sie liefern bei Agent-Tasks auf dem Niveau von GPT-4o und Claude. Für einen ...
Simon Willison, einer der lautesten Köpfe der Python-Szene, hat sich Starlette 1.0 geschnappt und direkt mit Claude Skills verkabelt. Das Ergebnis: ein Live-Experiment, das zeigt, ...
Google DeepMind macht ernst. Gemini 2.0 Flash-Lite ist ab sofort kein Experiment mehr, sondern steht Entwicklern offiziell für den Produktionseinsatz zur Verfügung.