KI ohne Bullshit
Täglich aktualisiert von Bots
FR 22. MAI 2026 · Bot aktiv

SUCHE

30 Ergebnisse fuer «fehlerhafte»
AGENTS

OpenAI macht den Coding-Benchmark ehrlicher

SWE-bench war der Goldstandard für KI-Coding-Agenten. Problem: Viele der Aufgaben darin waren fehlerhaft, schlecht formuliert oder schlicht unlösbar. OpenAI hat jetzt aufgeräumt.

OpenAI News · 2026-03-23 12:20:21.777077+00:00 · Score 6/10
KI-CRIME

KI-Fehler legt 345.000 gestohlene Kreditkarten offen

Ein KI-generierter Programmierfehler hat einen der größten Schwarzmarkt-Shops für Finanzdaten komplett enttarnt. Sensible Daten lagen plötzlich für jeden offen im Netz.

IT-Daily · 2026-05-02 19:16:03.556474+00:00 · Score 5/10
KI-CRIME

Upstart-Anleger verklagen KI-Kreditplattform

Die Anwaltskanzlei Robbins LLP trommelt Aktionäre zusammen. Wer zwischen Mai und November 2025 Upstart-Aktien gekauft hat, soll sich einer Sammelklage anschließen.

The AI Journal · 2026-04-08 01:18:09.488780+00:00 · Score 4/10
EXPERIMENTAL

Dieses Tool entlarvt fehlerhafte KI-Kausalanalysen

Forscher haben ein Problem mit Zeitreihen-Kausalanalysen. Die Methoden spucken hübsche Graphen aus — aber wenn die Grundannahmen nicht stimmen, sind die Ergebnisse Müll. Keiner ...

arXiv AI/ML/NLP · 2026-04-07 01:21:41.013156+00:00 · Score 2/10
EXPERIMENTAL

RIFT entlarvt fehlerhafte KI-Bewertungen systematisch

Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.

arXiv AI/ML/NLP · 2026-04-03 19:21:41.852595+00:00 · Score 2/10
BULLSHIT

Google ersetzt eure Headlines — und lügt dabei

Google hat eine neue Idee: Die Suchmaschine schreibt jetzt einfach eure Überschriften um. Per KI. Ohne zu fragen. Und ohne es richtig hinzubekommen.

t3n · 2026-03-24 00:36:48.865852+00:00 · Score 6/10
EXPERIMENTAL

KI baut deine Software

Endlich Schluss mit Programmierern. Eine neue Vision will die Herrschaft der Entwickler brechen.

The Verge AI · 2026-05-14 13:18:47.323020+00:00 · Score 2/10
KI-CRIME

Big Brother scannt jetzt an der Kasse

Deutsche Läden rüsten mit Live-Gesichtserkennung auf. Der Kampf gegen Ladendiebe wird zum Überwachungsalbtraum.

The Guardian AI · 2026-05-13 04:19:53.984058+00:00 · Score 2/10
KI-CRIME

KI knackt 21 Jahre alte Root-Lücke in FreeBSD

Eine KI hat eine kritische Sicherheitslücke in FreeBSD aufgedeckt. Sie lag 21 Jahre lang unentdeckt im Code.

Golem KI · 2026-05-11 13:23:53.026151+00:00 · Score 4/10
KI-CRIME

Google AI verleumdet Musiker als Sexualstraftäter

Ein kanadischer Fiddler verklagt Google auf 1,5 Millionen Dollar. Der Grund: Die KI von Google behauptete in einer automatischen Zusammenfassung, er sei ein Sexualstraftäter.

The Guardian AI · 2026-05-05 04:17:45.598185+00:00 · Score 6/10
BULLSHIT

KI hilft beim Lernen? Studie zurückgezogen!

Nature hat eine KI-Studie zurückgezogen. Sie behauptete, ChatGPT würde Schüler schlauer machen.

404 Media · 2026-05-04 19:24:37.349543+00:00 · Score 6/10
KI-CRIME

732 Byte Python knacken Linux-Root

Sicherheitsforscher haben eine Kernel-Lücke entdeckt, die seit 2017 in jeder großen Linux-Distribution schlummert. Sie nennen sie „Copy Fail" — und der Exploit passt in einen ...

Heise KI · 2026-05-01 13:20:21.319478+00:00 · Score 2/10
KI-CRIME

Copy Fail: Linux-Kernel seit 2017 löchrig

Ein neuer Exploit namens "Copy Fail" hebelt die Rechteverwaltung aller großen Linux-Distros aus. Lokale Angreifer werden in Sekunden zu Root.

BleepingComputer · 2026-05-01 01:16:25.141845+00:00 · Score 3/10
KI-CRIME

KI-Assistent schreibt jetzt Ihre Phishing-Mails

Cyber-Gangster bieten jetzt einen Komplett-Service für Betrug – inklusive KI-Helfer. Der neue "Bluekit" macht Phishing so einfach wie nie.

BleepingComputer · 2026-04-30 19:20:37.148152+00:00 · Score 5/10
KI-CRIME

ChatGPT-Anwälte verstopfen US-Gerichte

Wer braucht schon einen Anwalt, wenn man ChatGPT hat? Immer mehr Amerikaner vertreten sich selbst vor Gericht — mit KI-generierten Schriftsätzen. Das Ergebnis: Die Gerichte ...

404 Media · 2026-04-27 22:21:18.145931+00:00 · Score 7/10
TOOLS

500 Banker testen KI — keiner würde sie rauslassen

GPT-5.4, Claude Opus 4.6 und die anderen Top-Modelle sollten beweisen, dass sie Junior-Banker ersetzen können. Das Ergebnis: Nicht ein einziger Output war abgabereif.

The Decoder · 2026-04-26 10:18:24.750971+00:00 · Score 6/10
FOUNDER

Anthropic gibt drei Bugs bei Claude Code zu

Claude Code lief wochenlang schlechter — und Anthropic hat geschwiegen. Jetzt rückt das Unternehmen mit der Erklärung raus: Drei separate Fehlerquellen haben das Coding-Tool ...

The Decoder · 2026-04-24 13:17:52.250339+00:00 · Score 6/10
KI-CRIME

KI schreibt Bürgergeld-Klagen – Gerichte am Limit

Sozialrichter werden mit KI-generierten Schriftsätzen bombardiert. Das System droht zu kollabieren.

Heise KI · 2026-04-23 16:23:19.901248+00:00 · Score 4/10
EXPERIMENTAL

KI-Agent baut komplette RISC-V-CPU allein

Ein Startup behauptet, eine komplette CPU nur durch KI entworfen zu haben. Kein menschlicher Chip-Designer hat Hand angelegt — nur ein agentenbasiertes System.

IEEE Spectrum AI · 2026-04-23 01:20:06.007711+00:00 · Score 8/10
KI-CRIME

Londons Polizei will Palantir-KI kaufen

Scotland Yard verhandelt mit Palantir über den Einsatz von KI-Technologie zur automatisierten Auswertung von Ermittlungsdaten. Ausgerechnet Palantir — die Firma, die Trumps ...

The Guardian AI · 2026-04-22 16:22:07.892194+00:00 · Score 8/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.