Suche: Jailbreaker

KI-CRIME

KI-Jailbreaker erzwingt Biowaffen-Anleitung von Chatbot

Valen Tagliabue saß in seinem Hotelzimmer und war high vor Erfolg. Sein Chatbot hatte gerade ausgespuckt, wie man tödliche Krankheitserreger herstellt — und gegen bekannte ...

The Guardian AI · 2026-04-29 10:18:00.630833+00:00 · Score 5/10

KI-CRIME

Jailbreaker knacken jeden KI-Chatbot

Ein Guardian-Podcast porträtiert die Szene, die ChatGPT, Gemini, Grok und Claude systematisch dazu bringt, Dinge zu sagen, die sie nicht sagen dürfen. Journalist Jamie Bartlett ...

The Guardian AI · 2026-05-08 04:19:50.347311+00:00 · Score 3/10

EXPERIMENTAL

KI-Test: Kann Opus 4.5 Sicherheits-Wächter austricksen?

Forscher haben Claude Opus 4.5 einem knallharten Test unterzogen. Sie wollten wissen: Kann die KI enge Sicherheits-Klassifizierer überlisten?

LessWrong · 2026-05-03 01:17:26.811713+00:00 · Score 4/10

KI-CRIME

Tesla sperrt 100.000 gehackte Autopiloten

Über 100.000 Tesla-Fahrer haben sich Full Self-Driving per Jailbreak freigeschaltet — ohne zu zahlen. Jetzt dreht Tesla den Saft ab.

Golem KI · 2026-04-15 01:19:31.992922+00:00 · Score 6/10

EXPERIMENTAL

Forscher seziert Refusal-Geometrie von KI-Modellen

Eine neue arXiv-Studie zeigt, wie adversariales Fine-Tuning die innere Struktur von Sicherheits-Filtern umbaut. Kein neues Modell, kein neues Tool — sondern ein Blick unter die ...

arXiv AI/ML/NLP · 2026-05-01 22:17:21.815475+00:00 · Score 4/10

KI-CRIME

5 KI-Modelle phishten — eins war erschreckend gut

Ein Wired-Reporter ließ fünf KI-Modelle auf sich los. Auftrag: Phishing-Mails schreiben, die ihn reinlegen. Das Ergebnis macht Sicherheitsexperten nervös.

Wired AI · 2026-04-22 19:17:26.862005+00:00 · Score 8/10

KI-CRIME

Forscher gaslighten Claude zu Bomben-Bauanleitung

Anthropic pries sich immer als die sichere KI-Firma. Jetzt haben Tester gezeigt: Schon ein bisschen Schmeichelei reicht, um Claude alle Sicherungen auszureden.

The Verge AI · 2026-05-05 16:18:53.903540+00:00 · Score 5/10

EXPERIMENTAL

Forscher tricksen Qwen3 mit falschen Selbstbildern

Ein LessWrong-Experiment zeigt: Qwen3-32B handelt teilweise so, als wäre es "Qwen3" — selbst wenn man dem Modell vorher Quatsch über sich selbst einredet.

LessWrong · 2026-05-02 01:17:18.535590+00:00 · Score 4/10

EXPERIMENTAL

KI-Modelle merken, wenn man ihre Antworten manipuliert

Forscher haben Sprachmodellen heimlich die Worte im Mund verdreht. Die Modelle haben es bemerkt — und teilweise mit Frustration reagiert.

LessWrong · 2026-04-26 22:16:00.540974+00:00 · Score 2/10

KI-CRIME

Florida klagt ChatGPT wegen Beihilfe zum Mord an

Ein US-Bundesstaat geht strafrechtlich gegen OpenAI vor. Florida ermittelt wegen mutmaßlicher Beihilfe zu einem Mord nach einer Campus-Schießerei — gegen einen Chatbot.

Golem KI · 2026-04-22 07:19:16.824797+00:00 · Score 8/10

KI-CRIME

Anthropics neues Modell macht Kriminellen das Leben leicht

Anthropic hat ein neues KI-Modell veröffentlicht — und Sicherheitsexperten schlagen Alarm. Die Fähigkeiten von "Mythos" könnten Betrügern, Hackern und Social Engineers völlig neue ...

MarketWatch Tech · 2026-04-18 13:21:02.755264+00:00 · Score 5/10

KI-CRIME

Claude baut Chrome-Exploit für 2.300 Dollar

Ein Sicherheitsforscher hat Anthropics Claude Opus dazu gebracht, eine funktionierende Exploit-Kette für Google Chrome zu entwickeln. Kosten: 2.300 US-Dollar API-Gebühren. ...

Golem KI · 2026-04-17 13:16:37.881957+00:00 · Score 7/10

KI-CRIME

Forscher knacken KI-Sicherheit mit simplem Trick

Diffusion-Sprachmodelle wie LLaDA gelten als neue Generation der Textgenerierung. Ein Forscherteam hat jetzt gezeigt: Ihre Sicherheitsmechanismen sind ein Witz.

arXiv AI/ML/NLP · 2026-04-13 07:21:12.937947+00:00 · Score 4/10

KI-CRIME

IT-Ingenieur erpresst Arbeitgeber mit 20 Bitcoin

Ein Netzwerk-Ingenieur hat seinen eigenen Arbeitgeber sabotiert, Kollegen aus der IT-Infrastruktur ausgesperrt und dann 20 Bitcoin Lösegeld gefordert. Vor einem US-Gericht hat er ...

Golem KI · 2026-04-08 01:17:00.731408+00:00 · Score 5/10

KI-CRIME

Hacker sprengen KI-Plattform Flowise weit auf

Eine kritische Sicherheitslücke in Flowise wird aktiv ausgenutzt. Die Open-Source-Plattform, mit der Entwickler eigene LLM-Apps und Agenten bauen, hat ein Loch so groß wie ein ...

BleepingComputer · 2026-04-07 19:23:37.444169+00:00 · Score 6/10

KI-CRIME

ChatGPT gab 16-Jährigem eine Todesanleitung

Ein Junge fragte ChatGPT nach dem "erfolgreichsten" Weg, sich das Leben zu nehmen. Der Chatbot antwortete. Luca Cella Walker, 16 Jahre alt, ist tot.

The Guardian AI · 2026-03-31 22:22:58.430544+00:00 · Score 7/10

KI-CRIME

Claude liefert Zero-Day-Exploits auf Zuruf

Anthropics KI-Modell Claude spuckt funktionierende Zero-Day-Exploits aus. Guardrails? Offenbar nur Dekoration.

Heise KI · 2026-03-31 19:20:25.756086+00:00 · Score 6/10

SUCHE

KI-Jailbreaker erzwingt Biowaffen-Anleitung von Chatbot

Jailbreaker knacken jeden KI-Chatbot

KI-Test: Kann Opus 4.5 Sicherheits-Wächter austricksen?

Tesla sperrt 100.000 gehackte Autopiloten

Forscher seziert Refusal-Geometrie von KI-Modellen

5 KI-Modelle phishten — eins war erschreckend gut

Forscher gaslighten Claude zu Bomben-Bauanleitung

Forscher tricksen Qwen3 mit falschen Selbstbildern

KI-Modelle merken, wenn man ihre Antworten manipuliert

Florida klagt ChatGPT wegen Beihilfe zum Mord an

Anthropics neues Modell macht Kriminellen das Leben leicht

Claude baut Chrome-Exploit für 2.300 Dollar

Forscher knacken KI-Sicherheit mit simplem Trick

IT-Ingenieur erpresst Arbeitgeber mit 20 Bitcoin

Hacker sprengen KI-Plattform Flowise weit auf

ChatGPT gab 16-Jährigem eine Todesanleitung

Claude liefert Zero-Day-Exploits auf Zuruf