SWE-bench war der Goldstandard für KI-Coding-Agenten. Problem: Viele der Aufgaben darin waren fehlerhaft, schlecht formuliert oder schlicht unlösbar. OpenAI hat jetzt aufgeräumt.
Ein KI-generierter Programmierfehler hat einen der größten Schwarzmarkt-Shops für Finanzdaten komplett enttarnt. Sensible Daten lagen plötzlich für jeden offen im Netz.
Die Anwaltskanzlei Robbins LLP trommelt Aktionäre zusammen. Wer zwischen Mai und November 2025 Upstart-Aktien gekauft hat, soll sich einer Sammelklage anschließen.
Forscher haben ein Problem mit Zeitreihen-Kausalanalysen. Die Methoden spucken hübsche Graphen aus — aber wenn die Grundannahmen nicht stimmen, sind die Ergebnisse Müll. Keiner ...
Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
Google hat eine neue Idee: Die Suchmaschine schreibt jetzt einfach eure Überschriften um. Per KI. Ohne zu fragen. Und ohne es richtig hinzubekommen.
Endlich Schluss mit Programmierern. Eine neue Vision will die Herrschaft der Entwickler brechen.
Deutsche Läden rüsten mit Live-Gesichtserkennung auf. Der Kampf gegen Ladendiebe wird zum Überwachungsalbtraum.
Eine KI hat eine kritische Sicherheitslücke in FreeBSD aufgedeckt. Sie lag 21 Jahre lang unentdeckt im Code.
Ein kanadischer Fiddler verklagt Google auf 1,5 Millionen Dollar. Der Grund: Die KI von Google behauptete in einer automatischen Zusammenfassung, er sei ein Sexualstraftäter.
Nature hat eine KI-Studie zurückgezogen. Sie behauptete, ChatGPT würde Schüler schlauer machen.
Sicherheitsforscher haben eine Kernel-Lücke entdeckt, die seit 2017 in jeder großen Linux-Distribution schlummert. Sie nennen sie „Copy Fail" — und der Exploit passt in einen ...
Ein neuer Exploit namens "Copy Fail" hebelt die Rechteverwaltung aller großen Linux-Distros aus. Lokale Angreifer werden in Sekunden zu Root.
Cyber-Gangster bieten jetzt einen Komplett-Service für Betrug – inklusive KI-Helfer. Der neue "Bluekit" macht Phishing so einfach wie nie.
Wer braucht schon einen Anwalt, wenn man ChatGPT hat? Immer mehr Amerikaner vertreten sich selbst vor Gericht — mit KI-generierten Schriftsätzen. Das Ergebnis: Die Gerichte ...
GPT-5.4, Claude Opus 4.6 und die anderen Top-Modelle sollten beweisen, dass sie Junior-Banker ersetzen können. Das Ergebnis: Nicht ein einziger Output war abgabereif.
Claude Code lief wochenlang schlechter — und Anthropic hat geschwiegen. Jetzt rückt das Unternehmen mit der Erklärung raus: Drei separate Fehlerquellen haben das Coding-Tool ...
Sozialrichter werden mit KI-generierten Schriftsätzen bombardiert. Das System droht zu kollabieren.
Ein Startup behauptet, eine komplette CPU nur durch KI entworfen zu haben. Kein menschlicher Chip-Designer hat Hand angelegt — nur ein agentenbasiertes System.
Scotland Yard verhandelt mit Palantir über den Einsatz von KI-Technologie zur automatisierten Auswertung von Ermittlungsdaten. Ausgerechnet Palantir — die Firma, die Trumps ...