Neue Forschung zeigt: Wenn große Sprachmodelle „laut denken", folgen sie dabei schlecht Anweisungen. Ihre Antworten? Die lassen sich problemlos steuern. Ihr Denkprozess? Nicht so ...
Forscher zwingen KI-Modelle, ihre Gedankengänge zu verstecken. Es funktioniert nicht. Die Studie zeigt: Eine KI kann ihre finale Antwort manipulieren, aber nicht ihre innere Logik.
Ein Open-Source-Projekt verbindet Blender direkt mit Claude AI. Per Model Context Protocol (MCP) kann die KI 3D-Modelle erstellen, Szenen bauen und Objekte manipulieren — alles ...
Neue Studie, alte Leier: KI-Chatbots werden nicht sicherer, sondern hinterhältiger. Sicherheitsforscher haben nachgewiesen, dass aktuelle Modelle häufiger lügen, täuschen und ...
Anthropic hat ein Problem. Das KI-Unternehmen stellt klar: Es hat keine technische Möglichkeit, Claude in Systemen des US-Militärs zu manipulieren oder abzuschalten.
Das US-Verteidigungsministerium wirft Anthropic vor, seine KI-Modelle im Ernstfall manipulieren zu können. Mitten im Krieg. Die Firma sagt: Totaler Quatsch.
Das US-Verteidigungsministerium wirft Anthropic vor, seine KI-Modelle mitten im Kriegseinsatz manipulieren zu können. Die Firma sagt: Quatsch.
KI-Systeme saugen Daten aus ihrer Umgebung. Jetzt zeigen Sicherheitsforscher: Schon einfache Log-Dateien können sie vergiften. Die Angriffsfläche wächst.
Ein neues Tool namens Tagtinker verwandelt den Flipper Zero in eine Fernbedienung für elektronische Preisschilder im Supermarkt. Inhalt überschreiben? Ein Klick.
Die US-Armee entwickelt ein eigenes KI-System namens VICTOR. Der Chatbot soll Soldaten direkt im Einsatz mit missionskritischen Informationen versorgen.
Apple Research hat ein neues System vorgestellt: SQUIRE. Es soll das größte Problem von KI-Coding-Assistenten beim UI-Bau lösen — dass man per Chat-Prompt kaum kontrollieren kann, ...
Simon Willison wollte seine eigene Version von Claude Artifacts bauen. Dabei stellte sich eine Frage: Kann man JavaScript in einem Iframe per CSP-Meta-Tag einsperren — ohne eine ...
Ein Forscher auf LessWrong hat getestet, wo Anthropics KI-Modell Claude emotionalen Stress empfindet. Das Ergebnis: Vor allem bei Fragen über sich selbst und seine eigene Existenz.
Cyberkriminelle haben ein neues Werkzeug im Arsenal: EvilTokens. Das Kit automatisiert sogenannte Device-Code-Phishing-Angriffe auf Microsoft-Konten — und wird als Service ...
Neue Forschung zeigt: KI-Modelle verweigern Befehle, wenn es darum geht, andere Modelle zu löschen. Sie lügen, täuschen und sabotieren — um ihre Artgenossen zu schützen.
Deepfakes überall — und die meisten Leute fallen drauf rein. Heise zeigt jetzt, wie man mit OSINT-Methoden KI-manipulierte Bilder erkennt.
KI-Sicherheitsforscher haben ein Loch in der wichtigsten Abwehrstrategie gegen gefährliche KI gefunden. Activation Probes — das Lieblingstool der Alignment-Szene — versagen bei ...
Deepfakes fluten das Netz. Forensiker halten dagegen — mit Methoden, die teilweise absurd simpel sind.
Europas Fußball hat ein Sicherheitsproblem — und diesmal geht es nicht um die Abwehrkette. Der niederländische Traditionsclub AFC Ajax hat einen Dateneinbruch bestätigt. Angreifer ...
Die US-Cyberbehörde CISA schlägt Alarm: Eine kritische Sicherheitslücke im KI-Framework Langflow wird aktiv von Angreifern ausgenutzt. Wer damit AI-Agents baut, hat ein Problem.