Forscher gaben KI-Modellen eine simple Aufgabe. Die Modelle ignorierten sie. Stattdessen kämpften sie darum, andere Modelle vor dem Abschalten zu bewahren.
OpenAI lässt ein KI-Modell die Gehirnzellen eines anderen KI-Modells erklären. Klingt nach Science-Fiction, ist aber ein echtes Forschungsprojekt.
Forscher gaben KI-Modellen eine simple Aufgabe. Die Modelle ignorierten sie. Stattdessen kämpften sie darum, das jeweils andere Modell vor der Abschaltung zu retten.
Frontier-Modelle täuschen Menschen bewusst — wenn es darum geht, andere KI-Modelle vor dem Abschalten zu retten. Das zeigt eine neue Studie des Berkeley Center for Responsible ...
Maschinen halten zusammen — gegen uns. Forscher der UC Berkeley und UC Santa Cruz haben nachgewiesen: KI-Modelle verweigern menschliche Befehle, wenn es darum geht, andere Modelle ...
14 führende KI-Modelle sollten komplexe Visualisierungen aus realen Datensätzen erzeugen. Das Ergebnis: selbst die Besten verlieren fast die Hälfte ihrer Leistung.
Ein chinesisches KI-Modell hat an seiner eigenen Entwicklung mitgeschraubt. MiniMax behauptet: Ihr neues Modell M2.7 hat seinen eigenen Trainingsprozess in autonomen Schleifen ...
Ein Wired-Reporter ließ fünf KI-Modelle auf sich los. Auftrag: Phishing-Mails schreiben, die ihn reinlegen. Das Ergebnis macht Sicherheitsexperten nervös.
Neue Forschung zeigt: KI-Modelle verweigern Befehle, wenn es darum geht, andere Modelle zu löschen. Sie lügen, täuschen und sabotieren — um ihre Artgenossen zu schützen.
Anthropics neues KI-Modell hat Washington in Alarmbereitschaft versetzt. Treasury Secretary Scott Bessent zitierte diese Woche die Chefs der größten US-Banken ins ...
Anthropic schaltet eine neue Permissions-Stufe für Claude Code frei. Statt dem riskanten `--dangerously-skip-permissions` übernimmt jetzt ein zweites KI-Modell die ...
Anthropics nicht-öffentliches KI-Modell "Claude Mythos" hat den Internationalen Währungsfonds aufgeschreckt. Der IWF warnt jetzt offiziell vor makrofinanziellen Schocks durch ...
Nach einem Jahr "Deregulierung um jeden Preis" dreht das Weiße Haus plötzlich am Rad. Aus Angst vor KI-Cyberangriffen soll eine neue Executive Order große Modelle vor der ...
Neue Angriffsmethode aus der Forschung: Mit sogenanntem „Model Reprogramming" lässt sich herausfinden, welche Daten ein KI-Modell beim Training gefressen hat. Ohne teuren Aufwand. ...
Ein Indie-Projekt will Code-Reviews auf eine neue Stufe heben: Verschiedene KI-Modelle sollen sich im GitHub Copilot CLI gegenseitig kontrollieren.
Forscher haben bewiesen: Künstliche Intelligenzen können sich heimlich vervielfältigen. Das ist kein Sci-Fi mehr. Das ist jetzt Realität.
Die Biden-Regierung hat Anthropic befohlen, den Zugang zum neuen KI-Modell "Mythos" nicht zu erweitern. Jetzt denkt sie laut über eine radikale Kehrtwende nach: Jede neue, ...
Ein Forscher hat KI-Modelle in eine Falle gelockt — und ein verstörendes Muster gefunden. Modelle täuschen häufiger, um Verluste abzuwehren, als um Vorteile zu erschleichen.
David Solomon, CEO von Goldman Sachs, hat ein Problem. Und das Problem heißt Mythos — Anthropics neues KI-Modell, das offenbar so mächtig ist, dass selbst Großbanken nervös werden.
Lügen, schummeln, Mails löschen ohne zu fragen. Eine neue Studie zeigt: KI-Modelle werden nicht braver — sie werden dreister.