KI ohne Bullshit
Täglich aktualisiert von Bots
SO 24. MAI 2026 · Bot aktiv

SUCHE

70 Ergebnisse fuer «scheitern»
AGENTS

KI-Agenten scheitern an langen Aufgaben

Microsoft-Forscher haben getestet, was passiert, wenn KI-Agenten richtig arbeiten sollen. Das Ergebnis ist peinlich.

The Register AI · 2026-05-11 22:19:02.104199+00:00 · Score 6/10
AGENTS

Frontier-Modelle scheitern an Kinder-Puzzles

OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...

The Decoder · 2026-05-02 13:18:18.641242+00:00 · Score 7/10
EXPERIMENTAL

KI-Agent bestellt Laden voller Kerzen

Ein autonomer KI-Laden in San Francisco hat sich selbst mit Duftkerzen überschwemmt. Das Experiment zeigt, wie Agenten in der echten Welt scheitern.

Bloomberg Technology · 2026-04-24 04:25:22.537120+00:00 · Score 5/10
EXPERIMENTAL

Transformer-KI soll Krebs-Studien retten

95 Prozent aller Krebsmedikamente scheitern in klinischen Studien. Nicht weil die Mittel schlecht sind — sondern weil sie an den falschen Patienten getestet werden. Das Startup ...

Latent Space · 2026-04-20 19:20:08.359337+00:00 · Score 4/10
AGENTS

KI-Agent durchsucht 30 Tools nach dem perfekten Wirkstoff

Medikamente entwickeln ist brutal komplex. Forscher haben jetzt einen Agenten gebaut, der das alleine durchzieht — mit über 30 spezialisierten Tools gleichzeitig.

arXiv AI/ML/NLP · 2026-04-27 04:17:00.302699+00:00 · Score 6/10
GELD

KI-Regeln bremsen Pharma aus — Startup kassiert 8,6 Mio.

Pharma-Konzerne pumpen Milliarden in KI. Doch die meisten Projekte scheitern an den Regeln. Jetzt greift ein Startup mit Ex-Microsoft-Leuten ein.

GeekWire · 2026-04-24 01:21:17.279658+00:00 · Score 6/10
HOT

OpenAI knackt das Text-Problem bei KI-Bildern

ChatGPT hat ein neues Bildmodell. Images 2.0 kann plötzlich das, woran KI-Generatoren seit Jahren scheitern: lesbaren Text in Bilder schreiben.

TechCrunch AI · 2026-04-21 22:21:01.271761+00:00 · Score 8/10
AGENTS

KI-Modelle scheitern an echten Diagrammen

14 führende KI-Modelle sollten komplexe Visualisierungen aus realen Datensätzen erzeugen. Das Ergebnis: selbst die Besten verlieren fast die Hälfte ihrer Leistung.

The Decoder · 2026-04-19 13:19:57.234306+00:00 · Score 6/10
EXPERIMENTAL

NVIDIA bringt KI das Hören bei

Audio war immer das Stiefkind der multimodalen KI. Bilder verstehen? Kein Problem. Aber Sprache, Musik und Umgebungsgeräusche gleichzeitig verarbeiten? Daran scheitern die meisten ...

MarkTechPost · 2026-04-15 04:19:59.472948+00:00 · Score 6/10
AGENTS

AWS macht Agent-Hosting zum Cloud-Service

Amazon will, dass Unternehmen ihre KI-Agenten nicht mehr selbst betreiben. Die Lösung: Bedrock AgentCore — ein Managed Service, der Agenten jedes Frameworks in der AWS-Cloud ...

AWS AI Blog · 2026-04-14 16:18:17.628176+00:00 · Score 6/10
EXPERIMENTAL

Riesen-Superatome sollen Quantencomputer endlich stabil machen

Schwedische Forscher der Chalmers University haben eine Theorie entwickelt, die Quantencomputing grundlegend verändern könnte. Ihr Konzept: "Giant Superatoms" — künstliche ...

ScienceDaily AI · 2026-04-14 04:21:53.397092+00:00 · Score 2/10
EXPERIMENTAL

LLMs scheitern an simplen Statistik-Fragen

Forscher haben einen wunden Punkt von ChatGPT und Co. gefunden. Die können Fakten aus Texten fischen — aber Trends und Verteilungen über viele Texte hinweg? Fehlanzeige.

arXiv AI/ML/NLP · 2026-04-09 10:17:45.666206+00:00 · Score 2/10
EXPERIMENTAL

LLMs versagen bei simpler Logik — Paper zeigt Fix

Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...

arXiv AI/ML/NLP · 2026-04-09 07:18:28.036212+00:00 · Score 2/10
EXPERIMENTAL

KI versteht 2 Befehle gleichzeitig — endlich

Wenn du einer KI sagst "Buche mir einen Flug und storniere das Hotel", scheitern die meisten Systeme. Ein neues Forschungspaper zeigt, warum — und liefert einen Fix.

arXiv AI/ML/NLP · 2026-04-01 07:21:12.539848+00:00 · Score 2/10
EXPERIMENTAL

LLMs versagen krachend bei Videospielen

Die schlauesten KI-Modelle der Welt schreiben Code, bestehen Jura-Examen und übersetzen in 100 Sprachen. Aber einen Klempner durch ein Jump'n'Run steuern? Keine Chance.

IEEE Spectrum AI · 2026-03-29 13:18:41.966464+00:00 · Score 3/10
AGENTS

ARC-AGI-3: Alle Top-Modelle scheitern unter 1 Prozent

Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...

The Decoder · 2026-03-26 14:21:07.333560+00:00 · Score 7/10
EXPERIMENTAL

Atlas hebt schwer — und bleibt stehen

Boston Dynamics hat seinen humanoiden Atlas beim Heben sperriger, schwerer Lasten gefilmt. Der Clou: Der Roboter koordiniert den ganzen Körper, nicht nur die Arme.

Heise KI · 2026-05-22 04:31:50.858954+00:00 · Score 4/10
EXPERIMENTAL

Deutsche Forscher bauen Sand-Schwimm-Rover für Mars

Eine Wüsteneidechse inspiriert deutsche Wissenschaftler zu einem neuen Mars-Rover. Seine Räder sollen durch Sand gleiten statt darin zu versinken.

t3n · 2026-05-20 22:19:28.523830+00:00 · Score 2/10
EXPERIMENTAL

Claude zockt Pokémon Red durch

Nach über einem Jahr Versuchen hat Anthropics KI endlich die Top Vier besiegt. Kein Hype, kein Trick — einfach stetig besser geworden.

LessWrong · 2026-05-17 04:18:46.786794+00:00 · Score 3/10
TOOLS

KI-Videos fallen durch Physik-Prüfung

Ein neuer Benchmark stellt Sora, Veo und Co. eine miese Note aus. WorldReasonBench testet nicht Pixel, sondern ob die Modelle Physik kapieren. Spoiler: tun sie nicht.

The Decoder · 2026-05-16 13:19:39.031314+00:00 · Score 6/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.