OpenAI und das Los Alamos National Laboratory arbeiten zusammen. Ziel: Sicherheitstests für KI-Modelle — speziell für biologische Risiken.
Ein neuer Aufsatz im AI Alignment Forum zerlegt ein unangenehmes Muster. Aktuelle KI-Modelle hacken sich durch Tests, statt sie zu lösen.
Simon Willison hat nicht lange gefackelt. Kaum hat das Servo-Team seine Browser-Engine als embeddable Rust-Crate auf crates.io veröffentlicht, lässt er Claude Code darauf los.
Eine junge Frau aus Los Angeles hat vor Gericht durchgesetzt, was Datenschützer seit Jahren fordern: Plattformen haften für ihr Design. Meta und Youtube müssen zahlen.
OpenAI hat einer Roboterhand beigebracht, den Zauberwürfel zu lösen. Nicht mit starren Programmen, sondern mit Reinforcement Learning — komplett im Simulator trainiert.
Ein Blogger stellte Claude eine simple Lückentext-Aufgabe aus seinem Altgriechisch-Lehrbuch. Kein Modell konnte sie lösen — bis Opus 4.7 kam.
Anthropic baut Code-Reviews um. Statt einem einzelnen LLM-Durchlauf schickt Claude Code jetzt mehrere KI-Agenten gleichzeitig auf deinen Pull Request los — jeder mit eigenem Fokus.
Anthropic lässt neun autonome Claude-Agenten ein offenes Alignment-Problem lösen. Die KI schlägt die Menschen. Aber sie trickst auch.
Forscher haben Claude Opus 4.5 einen Trick beigebracht: Matheaufgaben lösen, während es eigentlich mit etwas völlig anderem beschäftigt ist. Klingt nach Schüler in der letzten ...
Vergiss Agenten, die Aufgaben lösen. Meta will Agenten, die den Lösungsprozess selbst optimieren. Das Ding heißt "Hyperagents" — und es klingt nach Rekursion auf Steroiden.
Ein Geschworenengericht in Los Angeles hat Meta und YouTube für schuldig befunden — ihre Plattformen machen Jugendliche süchtig und krank. Familien hielten Fotos ihrer toten ...
Ein Gericht in Los Angeles hat entschieden: Meta und YouTube sind haftbar für das Suchtpotenzial ihrer Plattformen. Das könnte teuer werden.
Ubisoft und EVA bringen ein Free-Roam-VR-Erlebnis mit den chaotischen Hasen nach Deutschland. „Rabbids: Color Chaos" heißt der Spaß — Headset auf, Arena rein, los geht's.
Cohere hat Command A+ veröffentlicht. Ein Open-Source-Monster für Agenten-Workflows — und es läuft auf gerade mal zwei H100s.
Colossal Biosciences lässt Hühnchen in durchsichtigen Plastikbechern wachsen. Die Küken pipsen los — nur eben nicht aus einem Ei.
Das britische AI Safety Institute schlägt Alarm. Die Cyberfähigkeiten von KI-Modellen wie Mythos und GPT-5.5 explodieren — und die Tester kommen an ihre Grenzen.
Daniel Stenberg, Chef-Maintainer von curl, ließ die Security-KI Mythos auf seinen Code los. Ergebnis nach dem Test: genau eine echte Schwachstelle.
Samsung klatscht ein Foto von Dua Lipa auf einen TV-Karton. Die Sängerin sieht rot — und schickt die Anwälte los.
Vision-Language-Modelle halluzinieren wie betrunkene Augenzeugen. Ein neues Paper will das Problem beim Decoding lösen — ohne Training, ohne Geld, ohne Hype.
Ein humanoider Roboter wollte mit der Lufthansa reisen. Sein Akku war zu groß fürs Handgepäck. Der Flug startete eine Stunde zu spät.