Ein US-Startup hat sechs Monate lang einen Radiosender komplett von KI-Agenten betreiben lassen. Vier Modelle sollten moderieren — die Ergebnisse könnten unterschiedlicher nicht ...
Forscher haben eine Methode entwickelt, die zeigt, wann Machine-Learning-Modelle in der Wirkstoffsuche raten statt verstehen. Veröffentlicht in Nature Machine Intelligence, 9. ...
Ein Angreifer wollte über ein NPM-Paket Malware verteilen. Doch er hat sich selbst entlarvt — durch einen dummen Fehler.
Eine kleine NGO entlarvt Big Tech mit harten Daten. Jetzt warnt ihr Chef öffentlich: Wir könnten ins Visier geraten.
Das Handy-Imperium von Donald Trump steht mit heruntergelassener Hose da. Eine simple Sicherheitslücke gibt Kundendaten frei — und entlarvt nebenbei, wie schlecht die Verkäufe ...
Microsoft-Forscher haben getestet, wie zuverlässig KI-Tools große Dokumente bearbeiten. Ergebnis: Bis zu ein Viertel des Inhalts wird verfälscht oder gelöscht.
Ein winziges Gemma-Modell mit nur 2 Milliarden Parametern erkennt Misalignment in fremden KI-Antworten. Es wurde nur auf Code trainiert — und urteilt trotzdem über allgemeine ...
Ein KI-Tool hat zwei Renaissance-Zeichnungen neu analysiert. Das Ergebnis stellt die Kunstgeschichte auf den Kopf.
Jedes Team liefert pünktlich — trotzdem kommen 18% der Sendungen zu spät. Ein Entwickler hat eine komplette internationale Supply Chain simuliert und einen KI-Agenten ...
Mehr Agenten, mehr Power? Von wegen. Eine neue Stanford-Studie zerlegt den Hype um Multi-Agenten-Systeme — und kommt zu einem ernüchternden Ergebnis.
Ein Alignment-Forscher lernt Altgriechisch mit Claude Opus 4.6. Dann merkt er: Das Modell macht systematische Fehler — und baut daraus eine Challenge.
Ein LessWrong-Nutzer lernt Altgriechisch mit Claude Opus 4.6. Erst als Hausaufgaben-Korrektor, dann als Lehrer. Bis ihm auffiel: Das Modell macht systematische Fehler — und klingt ...
Forscher haben ein Problem mit Zeitreihen-Kausalanalysen. Die Methoden spucken hübsche Graphen aus — aber wenn die Grundannahmen nicht stimmen, sind die Ergebnisse Müll. Keiner ...
Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
Ein Bastler baut eine KI-Box, die ohne Strom aus der Steckdose läuft. Power kommt direkt aus dem Handgelenk.
Ein Polizist aus Florida hat das Flock-System missbraucht, um seine Ex-Freundin zu überwachen. 108 Suchanfragen in wenigen Monaten — bis Kollegen stutzig wurden.
Während Donald Trump die KI-Industrie zum Turbo-Wachstum antreibt, fordert ausgerechnet Anthropic eine Pause — Tage nach dem eigenen Börsengang-Antrag. OpenAI reicht parallel sein ...
Aviva schlägt Alarm. Britische Versicherungsbetrüger nutzen KI-Tools, um Schäden zu erfinden — und der Versicherer wäre fast auf Hunderte Millionen reingefallen.
Ein npm-Pakete-Angreifer wollte Claude-Nutzer ausnehmen — und blamierte sich selbst maximal. Sein KI-generierter Stealer leakte den eigenen GitHub-Token mit ins Netz.
Forscher haben das Glassworm-Botnet lahmgelegt. Es griff Entwickler über Supply-Chain-Attacken an — und nutzte die Solana-Blockchain als Command-and-Control.