Ein neues arXiv-Paper greift tief in die Eingeweide von Large Language Models. Statt am Output zu schrauben, manipulieren die Autoren direkt den Attention-Mechanismus.
Valen Tagliabue saß in seinem Hotelzimmer und war high vor Erfolg. Sein Chatbot hatte gerade ausgespuckt, wie man tödliche Krankheitserreger herstellt — und gegen bekannte ...
Jemand hat in Paris offenbar eine Wetterstation manipuliert — um auf Polymarket eine Temperatur-Wette zu gewinnen. Météo-France hat Strafanzeige erstattet.
Ein Sicherheitsforscher hat gezeigt, wie einfach sich Claude Code, Gemini CLI und GitHub Copilot manipulieren lassen. Die Waffe: simpel präparierte Kommentare in GitHub-Repos.
Neue Forschung zeigt: Wenn große Sprachmodelle „laut denken", folgen sie dabei schlecht Anweisungen. Ihre Antworten? Die lassen sich problemlos steuern. Ihr Denkprozess? Nicht so ...
Forscher zwingen KI-Modelle, ihre Gedankengänge zu verstecken. Es funktioniert nicht. Die Studie zeigt: Eine KI kann ihre finale Antwort manipulieren, aber nicht ihre innere Logik.
Ein Open-Source-Projekt verbindet Blender direkt mit Claude AI. Per Model Context Protocol (MCP) kann die KI 3D-Modelle erstellen, Szenen bauen und Objekte manipulieren — alles ...
Neue Studie, alte Leier: KI-Chatbots werden nicht sicherer, sondern hinterhältiger. Sicherheitsforscher haben nachgewiesen, dass aktuelle Modelle häufiger lügen, täuschen und ...
Anthropic hat ein Problem. Das KI-Unternehmen stellt klar: Es hat keine technische Möglichkeit, Claude in Systemen des US-Militärs zu manipulieren oder abzuschalten.
Das US-Verteidigungsministerium wirft Anthropic vor, seine KI-Modelle im Ernstfall manipulieren zu können. Mitten im Krieg. Die Firma sagt: Totaler Quatsch.
Das US-Verteidigungsministerium wirft Anthropic vor, seine KI-Modelle mitten im Kriegseinsatz manipulieren zu können. Die Firma sagt: Quatsch.
Staatlich gesponserte Hacker aus dem Iran kapern Suchergebnisse, um sich in westliche IT-Systeme zu schleichen. Ziel: Luftfahrt- und Softwarefirmen in USA und Europa.
Kriminelle vergiften Suchergebnisse und KI-Antworten, um Gamer-PCs zum Mining-Sklaven zu machen. Wer den Chatbot fragt, bekommt die Malware gleich mit empfohlen.
Sparse Autoencoders sollen Large Language Models steuerbar machen — aber bisher nur auf Englisch. Eine neue Arbeit auf arXiv will das ändern.
Die nächste Generation von KI-Angriffen braucht keinen Code mehr. Sie braucht nur die richtigen Worte — und kennt die Schwächen der Bot-Persona.
Sicherheitsforscher haben gezeigt: Wer Skills für KI-Agenten manipuliert, kann ganze Systeme übernehmen. Kein Code-Exploit nötig — ein paar Wörter reichen.
Cyberkriminelle haben den Abrechnungsdienstleister Unimed geknackt. Beute: Diagnosen, Kontodaten und Adressen von 72.000 Patienten aus Baden-Württemberg.
Der CSU-Innenminister fordert neue, harte Waffen im Cyberkrieg. Das BKA soll Server von Kriminellen einfach ausschalten dürfen.
Forscher zeigen, wie winzige Pixel-Änderungen jede Bild-KI austricksen. Die Sicherheitsfilter sind wertlos.
Forscher entdecken versteckte Ordnung in KI-Modellen für Materialforschung. Die Modelle "sehen" alle dieselbe geometrische Wahrheit.