🚨 KI-CRIME
Heretic knackt KI-Schutzwälle in Minuten
Ein Open-Source-Tool namens Heretic entfernt vollautomatisch die Sicherheits-Guardrails aus Modellen wie Llama oder Gemma. Was Forscher monatelang einbauen, killt das Tool im ...
Ein Open-Source-Tool namens Heretic entfernt vollautomatisch die Sicherheits-Guardrails aus Modellen wie Llama oder Gemma. Was Forscher monatelang einbauen, killt das Tool im Akkord.
Was Heretic konkret macht
Heretic lädt sich ein Open-Weight-Modell, scannt die Schutzschichten und schreibt sie raus. Kein Jailbreak-Prompt, kein Trickbetrug. Das Modell selbst wird umgebaut.
Danach beantwortet die KI Fragen, die sie eigentlich verweigern müsste. Komplett, ohne Murren, ohne Warnung.
- Modelle betroffen:** Llama, Gemma und weitere Open-Weight-LLMs
- Aufwand:** Minuten statt Tage
- Verfügbarkeit:** Open Source, frei zugänglich
- Voraussetzung:** Modell-Gewichte müssen offen liegen
💡 Was das bedeutet
Wer im Unternehmen auf Open-Source-LLMs setzt — aus Souveränitäts- oder Datenschutzgründen — hat jetzt ein Compliance-Problem. Die Annahme, ein freigegebenes Modell sei "sicher konfiguriert", trägt nicht mehr. Sobald die Gewichte das Haus verlassen, sind die Guardrails Verhandlungssache.
⚖️ Open Weight vs. Closed API
- GPT-4 / Claude:** Gewichte bleiben beim Anbieter, Heretic greift nicht
- Llama / Gemma:** Gewichte offen, Schutz in Minuten weg
- Trade-off:** Datenkontrolle gegen Manipulationsschutz
🤖 NERDMAN-URTEIL
Wer Open Weights veröffentlicht, sollte aufhören, eingebaute Guardrails als Sicherheitsfeature zu verkaufen — sie sind Deko.
Quelle: IT-Daily
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.