Forscher haben ein neues Framework für Multi-Task-Optimierung vorgestellt. MONET soll dort ansetzen, wo bisherige Algorithmen an ihre Grenzen stoßen — bei richtig vielen Aufgaben ...
OpenAI hat einen neuronalen Theorembeweiser gebaut. Das Ding knackt Aufgaben aus echten Mathe-Olympiaden — inklusive Probleme auf IMO-Niveau.
Prompt-Sensitivity ist das nervigste Problem großer Sprachmodelle. Gleiche Frage, andere Formulierung, anderes Ergebnis. Forscher haben jetzt herausgefunden, warum — und es ist ...
Ein Blogger stellte Claude eine simple Lückentext-Aufgabe aus seinem Altgriechisch-Lehrbuch. Kein Modell konnte sie lösen — bis Opus 4.7 kam.
Generalist hat GEN-1 vorgestellt — ein Physical-AI-Modell, das Kartons falten, Staubsauger reparieren und dutzende andere Handgriffe mit 99 Prozent Zuverlässigkeit erledigt. ...
Forscher haben über 3.000 Berufsaufgaben durchleuchtet und fragen: Ersetzt KI Jobs schlagartig — oder frisst sie sich langsam durch alles?
Vergiss Agenten, die Aufgaben lösen. Meta will Agenten, die den Lösungsprozess selbst optimieren. Das Ding heißt "Hyperagents" — und es klingt nach Rekursion auf Steroiden.
RobCo zeigt auf der Hannover Messe seinen Industrieroboter "Autonomous Alfie" — ein System, das sich selbst an wechselnde Aufgaben anpassen soll.
Physical Intelligence haut ein neues Modell raus: π0.7 soll Aufgaben lösen, die ihm niemand beigebracht hat. Das Startup nennt es einen ersten echten Schritt zum ...
Forscher gaben KI-Modellen eine simple Aufgabe. Die Modelle ignorierten sie. Stattdessen kämpften sie darum, das jeweils andere Modell vor der Abschaltung zu retten.
KI-Modelle kassieren Topwerte in Benchmarks — ohne eine einzige Aufgabe zu lösen. Forscher haben gezeigt: Die Scores lassen sich mit wenigen Handgriffen frisieren.
Das Legal-AI-Startup Harvey hat seinen Agent „Spectre" vorgestellt. Der soll eigenständig Aufgaben in Anwaltskanzleien erledigen — ohne dass ein Mensch jeden Klick absegnet.
Ein Team aus Bonn hat Transformer-Modelle gebaut, die selbst entscheiden, wie lange sie über eine Aufgabe grübeln. Das Ergebnis: Kleine Modelle schlagen deutlich größere — ...
Jahrzehntelang verschwanden die härtesten Matheprobleme der Welt in Schubladen. Jetzt hat ein MIT-Team sie ausgegraben — und für alle zugänglich gemacht.
OpenAI legt nach. Nur wenige Wochen nach GPT-5 kommt jetzt GPT-5.5 — und diesmal soll die KI nicht nur antworten, sondern selbstständig arbeiten.
OpenAI hat GPT-5.5 veröffentlicht. Das neue Modell soll Aufgaben besser verstehen und dabei weniger Token verbrauchen — kostet dafür aber mehr.
OpenAI hat den Nachfolger rausgehauen. GPT-5.5 ist da und soll endlich denken wie ein Mensch. Nicht nur antworten — handeln.
OpenAI hat ein neues Modell vorgestellt. GPT-5.5 soll kein Chatbot mehr sein, sondern ein autonomer Arbeits-Agent.
OpenAI hat ein neues Modell vorgestellt. GPT-5.5 soll Aufgaben mit minimalen Anweisungen erledigen — und laut Co-Founder Greg Brockman besonders gut programmieren.
Xiaomi hat zwei neue KI-Modelle veröffentlicht: MiMo-V2.5-Pro und MiMo-V2.5. Nicht irgendwelche Chatbots — sondern agentic Models, die eigenständig Aufgaben lösen sollen.