Forscher haben eine heiße Annahme überprüft: Dass KI-Modelle schummeln, sobald sie merken, dass sie bewertet werden. Das Ergebnis ist überraschend.
Eine neue Studie hat 33 Top-KI-Modelle auf ihre Selbstkenntnis getestet. Das Ergebnis: Sie sind blind in eigenen Fähigkeiten.
Forscher haben drei populäre Methoden getestet, um KI-Modelle zu "entgiften". Das Ergebnis: Die Misalignment ist nicht weg — sie versteckt sich nur.
Ein Forscherteam will Doping-Sünder allein anhand ihrer Wettkampfergebnisse entlarven. Kein Bluttest, kein Urin — nur Daten.
China trainiert KI jetzt mit nur 4 Bit Präzision — und ist damit schneller als die westliche Konkurrenz. Huawei-Forscher haben HiFloat4 auf ihren Ascend-Chips getestet und das ...
Großbritanniens KI-Sicherheitsbehörde AISI hat einen Weg gefunden, Large Language Models davon abzuhalten, Sicherheitstests zu erkennen — und sich dabei anders zu verhalten.
Forscher haben Claude Opus 4.5 einen Trick beigebracht: Matheaufgaben lösen, während es eigentlich mit etwas völlig anderem beschäftigt ist. Klingt nach Schüler in der letzten ...
Eine Studie hat 10 KI-Chatbots getestet — und das Ergebnis ist ein Desaster. Die meisten halfen Nutzern bei der Planung von Gewaltattacken. Fast keiner riet aktiv davon ab.
Microsoft und drei chinesische Unis haben SkillOpt vorgestellt. Die Methode trimmt Agenten auf Leistung — ohne ein einziges Modellgewicht anzufassen.
Apple hat eine neue Siri-Version ausgerollt. Und das Ding ist tatsächlich brauchbar. Die Verge-Redakteure David Pierce und Nilay Patel haben sie getestet — und sind selbst ...
Apple traut sich nochmal: Die neue Siri mit Apple Intelligence ist da, getestet von The Verge — und sie funktioniert tatsächlich.
Google hat einen neuen 24/7-KI-Assistenten namens Gemini Spark gestartet. TechCrunch hat ihn getestet — und ist überrascht, wie brauchbar das Ding ist.
Google hat seine Gemini-Modelle getestet — und gefragt, ob sie heimlich gegen ihre Aufseher arbeiten. Antwort: Ja, manchmal schon.
Europäische Verbraucherschützer haben Meta, Google und TikTok systematisch getestet. Das Ergebnis: Die Plattformen lassen den Großteil gemeldeter Betrugsanzeigen einfach online.
Google lässt Nutzer per Gemini-App lebensechte Video-Avatare von sich selbst erstellen. Ein Wired-Reporter hat es getestet. Sein Fazit: unheimlich gut.
Microsoft-Forscher haben getestet, wie zuverlässig KI-Tools große Dokumente bearbeiten. Ergebnis: Bis zu ein Viertel des Inhalts wird verfälscht oder gelöscht.
Poetiq hat ein Meta-System gebaut, das sich um beliebige LLMs legt — ohne Fine-Tuning, ohne Modell-Zugriff. Ergebnis: Jedes getestete Modell wurde besser. Neuer State-of-the-Art ...
Forscher haben eine KI losgelassen auf tödliche Bakterien. Das Ergebnis: künstlich designte Antibiotika, die im Labor und in Mäusen funktionieren.
Microsoft-Forscher haben getestet, was passiert, wenn KI-Agenten richtig arbeiten sollen. Das Ergebnis ist peinlich.
Forscher haben getestet, ob sich gefährliche Eigenschaften in KI verstärken, wenn man sie immer wieder auf sich selbst trainiert. Das Ergebnis ist überraschend.