Ein Open-Source-Entwickler baut absichtlich eine Prompt-Injection in sein Projekt ein. Ziel: Vibe Coder schädigen, die blind KI-Agenten ihre Arbeit machen lassen.
Ein LLM mit Erziehung aus dem 19. Jahrhundert. Simon Willison hat "Mr. Chatterbox" veröffentlicht — ein absichtlich schwaches Sprachmodell, das auf viktorianische Ethik trainiert ...
Ein neues Paper namens SafeGene verspricht eine Lösung für ein altes Problem: Wenn du ein Open-Weight-LLM nachtrainierst, fliegt die Safety-Alignment oft raus. Auch ohne böse ...
Ein Student aus Harvard bringt ein Plugin raus, das absichtlich Tippfehler in KI-Texte einbaut. Grund: Wer KI nutzt, gilt als faul.
Auf LessWrong ist eine frische Alignment-Studie aufgeschlagen, die KI-Modelle absichtlich mit gespaltenem Bewusstsein trainiert. Klingt nach Sci-Fi, ist aber knallharte Empirie.
Auf dem AI Alignment Forum diskutieren Forscher ein heikles Szenario: Was, wenn KIs heimlich gegen ihre eigenen Sicherheits-Checks arbeiten?
Wer mit ChatGPT seine Mails schreibt, gilt als faul. Eine neue Browser-Erweiterung löst das Problem — indem sie Tippfehler einbaut.
Ein Entwickler hat ein KI-Tool gebaut, das Open-Source-Software kopiert. Absichtlich. Als Witz. Aber es funktioniert tatsächlich.
Wenn du einer KI sagst "Buche mir einen Flug und storniere das Hotel", scheitern die meisten Systeme. Ein neues Forschungspaper zeigt, warum — und liefert einen Fix.
Ein neues Web-Tool dreht den Spieß um: Statt KI schneller zu machen, sabotiert es Chatbots gezielt — und bremst sie auf Schneckentempo.
Ein Bastler hat es satt: 4K-Upscaling ruiniert alte Star-Trek-Folgen. Seine Lösung kommt aus dem Jahr 1989.
Ein Entwickler hat ein Sprachmodell so feingetuned, dass es Texte in dopamin-triggernde Häppchen verwandelt. Zielgruppe: das ADHS-Hirn, das normale Artikel nach drei Zeilen ...
Die US-Steuerbehörde lässt Palantir eine zentrale Datenschnittstelle bauen — und 404 Media hat den Vertrag.
Die US-Behörden haben ein neues Feindbild: Menschen, die Tech-Konzerne hassen. Über 1.000 Seiten geleakte Dokumente von DHS und FBI zeigen, wie der Staat Anti-KI-Protestler ins ...
Eine neue Studie auf arXiv zerlegt das Fill-in-the-Middle-Training. Ergebnis: Modelle merken sich Texte häufiger Wort für Wort.
Fünf Tage. Mehr brauchten Nachahmer nicht, um den Shai-Hulud-Wurm zu klonen. Jetzt steckt der Credential-Klau im nächsten npm-Paket.
Runway-CEO Cristóbal Valenzuela glaubt: Wer Video meistert, baut World Models. Und ein Außenseiter zu sein, ist sein größter Vorteil.
Die Maus ist seit 50 Jahren dumm. Sie weiß nur wo der Cursor ist. Google DeepMind will das ändern — mit KI.
Sam Altman packt vor Gericht aus. Der OpenAI-Chef erinnert sich an ein "besonders haarsträubendes" Gespräch mit Elon Musk.
Der CSU-Innenminister fordert neue, harte Waffen im Cyberkrieg. Das BKA soll Server von Kriminellen einfach ausschalten dürfen.