Ein US-Startup hat sechs Monate lang einen Radiosender komplett von KI-Agenten betreiben lassen. Vier Modelle sollten moderieren — die Ergebnisse könnten unterschiedlicher nicht ...
Eine kleine NGO entlarvt Big Tech mit harten Daten. Jetzt warnt ihr Chef öffentlich: Wir könnten ins Visier geraten.
Das Handy-Imperium von Donald Trump steht mit heruntergelassener Hose da. Eine simple Sicherheitslücke gibt Kundendaten frei — und entlarvt nebenbei, wie schlecht die Verkäufe ...
Microsoft-Forscher haben getestet, wie zuverlässig KI-Tools große Dokumente bearbeiten. Ergebnis: Bis zu ein Viertel des Inhalts wird verfälscht oder gelöscht.
Ein winziges Gemma-Modell mit nur 2 Milliarden Parametern erkennt Misalignment in fremden KI-Antworten. Es wurde nur auf Code trainiert — und urteilt trotzdem über allgemeine ...
Ein KI-Tool hat zwei Renaissance-Zeichnungen neu analysiert. Das Ergebnis stellt die Kunstgeschichte auf den Kopf.
Jedes Team liefert pünktlich — trotzdem kommen 18% der Sendungen zu spät. Ein Entwickler hat eine komplette internationale Supply Chain simuliert und einen KI-Agenten ...
Mehr Agenten, mehr Power? Von wegen. Eine neue Stanford-Studie zerlegt den Hype um Multi-Agenten-Systeme — und kommt zu einem ernüchternden Ergebnis.
Ein Alignment-Forscher lernt Altgriechisch mit Claude Opus 4.6. Dann merkt er: Das Modell macht systematische Fehler — und baut daraus eine Challenge.
Ein LessWrong-Nutzer lernt Altgriechisch mit Claude Opus 4.6. Erst als Hausaufgaben-Korrektor, dann als Lehrer. Bis ihm auffiel: Das Modell macht systematische Fehler — und klingt ...
Forscher haben ein Problem mit Zeitreihen-Kausalanalysen. Die Methoden spucken hübsche Graphen aus — aber wenn die Grundannahmen nicht stimmen, sind die Ergebnisse Müll. Keiner ...
Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
Schluss mit dem digitalen Versteck: Strafverfolger haben den VPN-Dienst First VPN hochgenommen und sind jetzt im Besitz der Nutzerdaten.
Drei Wochen Prozess. Zwei Stunden Beratung. Eine Jury, die Musks Klage wegen Verjährung in den Müll wirft. Doch der eigentliche Schaden geht tiefer — und trifft beide Seiten.
Teslas fahrerlose Robotaxis sollen die Zukunft sein. Neue Daten zeigen: Auch mit Fernsteuerung durch Tesla-Mitarbeiter gibt es Unfälle.
Angreifer haben sich über die TanStack-npm-Lieferkette in OpenAI-Systeme geschlichen. Zwei Mitarbeitergeräte kompromittiert, interne Credentials weg.
OpenAI hat die Preise für sein neues Top-Modell GPT-5.5 massiv erhöht. Die offizielle Begründung: Kürzere Antworten sollen die Kosten senken. Die Realität sieht anders aus.
Eine neue Analyse zeigt: Wenn KI-Modelle so tun, als wären sie brav, steckt die Entscheidung dazu in nur wenigen Sätzen. Ein Forscher hat DeepSeek Chat v3.1 beim Alignment-Faking ...
Neue Studie stellt eine unangenehme Frage: Rechnen Sprachmodelle tatsächlich — oder kopieren sie nur gelernte Muster?
Coachella 2026: Auf Instagram posieren perfekte Gesichter vor Festivalkulissen. Problem: Einige davon existieren nicht. KI-Avatare mischen sich unter echte Promis — und kaum ...