OpenAIs neues Topmodell hat in 80 Minuten geschafft, woran sich Mathematiker seit Jahrzehnten die Zähne ausbeißen. GPT-5.4 Pro löste eigenständig das offene Erdős-Problem #1196.
Ein Typ ohne Mathe-Studium tippt einen Prompt in GPT-5.4 Pro — und löst damit das offene Erdős-Problem #1196. Mathematiker weltweit reiben sich die Augen.
Forscher aus China haben ein Problem identifiziert, das jeden LLM-Nutzer betrifft: Chain-of-Thought-Reasoning klingt schlau, hat aber logische Löcher. Ihre Lösung heißt TDA-RC.
Neues Paper aus der RL-Forschung will das größte Problem der Branche lösen: Agenten, die außerhalb ihrer Trainingsumgebung sofort versagen.
Sprachmodelle haben ein peinliches Problem: Sie lernen Fakten, können aber nicht rückwärts denken. Ein neues Paper zeigt, wie man das mit Rechenzeit zur Inferenz flicken kann.
Ein neues arXiv-Paper packt ein altes Problem an: KI-Modelle, die beim Lernen alles wieder verlernen. Die Lösung heißt "Adaptive Weight Decay" — also gezieltes Vergessen.
Forscher zeigen: LLM-Agenten mit externem Memory lösen das Lernproblem nicht — sie verschieben es nur.
Wer mit ChatGPT seine Mails schreibt, gilt als faul. Eine neue Browser-Erweiterung löst das Problem — indem sie Tippfehler einbaut.
OpenAI hat sein Bildmodell aufgebohrt. Images 2.0 soll endlich Text auf Bildern korrekt darstellen — der eine Punkt, an dem bisher jeder KI-Generator kläglich scheiterte.
Solid-State-Batterien versprechen seit Jahren die Zukunft der Energiespeicherung. Jetzt haben gleich zwei Forscherteams unabhängig voneinander herausgefunden, warum die Dinger ...
Ein neues Open-Source-Framework will das größte Problem von KI-Agenten lösen: Niemand benutzt sie.
Anthropic lässt neun autonome Claude-Agenten ein offenes Alignment-Problem lösen. Die KI schlägt die Menschen. Aber sie trickst auch.
Amazon Bedrock AgentCore Runtime bekommt stateful MCP-Client-Fähigkeiten. Heißt übersetzt: KI-Agenten können jetzt mitten im Workflow pausieren, nachfragen, warten — und dann ...
Apple Research hat ein neues System vorgestellt: SQUIRE. Es soll das größte Problem von KI-Coding-Assistenten beim UI-Bau lösen — dass man per Chat-Prompt kaum kontrollieren kann, ...
Reinforcement Learning hat ein dummes Problem: Jeder Denkschritt wird gleich belohnt — egal ob er brillant oder nutzlos ist. Alibabas Qwen-Team hat einen Algorithmus gebaut, der ...
Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
Das BKA-Gesichtserkennungssystem läuft heiß. Mehr als doppelt so viele Abfragen wie im Vorjahr haben Kriminalämter über die INPOL-Datei laufen lassen. Das Problem: Das System hat ...
Anthropics Coding-Assistent Claude Code verbrennt Nutzer-Kontingente schneller als gedacht. So schnell, dass Anthropic selbst überrascht ist.
KI-Modelle können coden. Aber sie kennen ihre eigenen Updates nicht. Google hat jetzt einen simplen Fix dafür.
Ein neues arXiv-Paper knöpft sich ein nerviges Problem vor: Sprachmodelle wirken oft selbstbewusst — auch wenn sie Mist labern.