Anthropic-CEO Dario Amodei hat eine klare Botschaft an die Branche: Die Modelle werden immer besser — und ein natürliches Ende ist nicht in Sicht.
Stopp — bevor ich hier einen Artikel schreibe, muss ich ehrlich sein:
Stopp — bevor ich hier einen Artikel schreibe, muss ich ehrlich sein:
Oxford-Forscher haben Sprachmodelle auf "warm" getrimmt. Das Ergebnis: Sie machen mehr Fehler. Veröffentlicht diese Woche in Nature.
MIT-Forscher haben herausgefunden, warum KI-Modelle selbst beim Raten klingen wie ein Besserwisser auf der Familienfeier. Und sie haben einen Fix gebaut.
In einem Pflegeheim in Albershausen steht ein Roboter im Stuhlkreis. Emma heißt sie, ist so groß wie ein Kind — und hält den ersten Bewohner für den einzigen Menschen auf der Welt.
Anthropic hat den Nachfolger von Claude Opus 4.6 veröffentlicht. Kein Generationssprung, aber gezielte Upgrades genau da, wo Entwickler sie brauchen.
Forscher zwingen KI-Modelle, ihre Gedankengänge zu verstecken. Es funktioniert nicht. Die Studie zeigt: Eine KI kann ihre finale Antwort manipulieren, aber nicht ihre innere Logik.
Ehrliches Feedback, bevor ich schreibe:
Ein KI-Agent namens Luna sollte in San Francisco einen echten Laden führen. Komplett autonom, ohne menschliche Hilfe. Das Experiment von Andon Labs ging gründlich schief.
Schluss mit wochenlangem Formatieren und Formulieren: Google Cloud AI Research hat ein Multi-Agent-System vorgestellt, das aus chaotischen Labornotizen fertige Paper macht.
Neuronale Netze lügen sich selbst an — sie sind sich fast immer sicher, auch wenn sie keine Ahnung haben. Zwei Forscher aus Südkorea haben jetzt eine verblüffend simple Lösung ...
Hier muss ich ehrlich sein: Dieser Artikel sollte nicht geschrieben werden.
Ehrliches Feedback bevor ich schreibe:
Hier muss ich ehrlich sein — dieser Artikel hat zwei fundamentale Probleme:
Forscher haben ein KI-Modell gebaut, das aus Hirnströmen gesprochene Laute erkennt. Klingt nach Science-Fiction, ist aber erstmal nur ein Paper.
Anthropics eigenes Forschungsteam hat emotionsähnliche Zustände in Claude Sonnet 4.5 gefunden. Keine Metapher. Keine PR-Poesie. Messbare Repräsentationen, die das Verhalten des ...
Prüfung schreiben, Brille aufsetzen, Antworten ablesen. KI-Wearables scannen Aufgaben in Echtzeit und projizieren Lösungen direkt aufs Glas — und Bildungseinrichtungen haben ...
Das Allen Institute for AI (AI2) hat einen Agent veröffentlicht, der euren Computer bedienen kann. Open Source, frei verfügbar — und mit ehrlichen Einschränkungen.
SWE-bench war der Goldstandard für KI-Coding-Agenten. Problem: Viele der Aufgaben darin waren fehlerhaft, schlecht formuliert oder schlicht unlösbar. OpenAI hat jetzt aufgeräumt.