Ein US-Startup hat sechs Monate lang einen Radiosender komplett von KI-Agenten betreiben lassen. Vier Modelle sollten moderieren — die Ergebnisse könnten unterschiedlicher nicht ...
Ein winziges Gemma-Modell mit nur 2 Milliarden Parametern erkennt Misalignment in fremden KI-Antworten. Es wurde nur auf Code trainiert — und urteilt trotzdem über allgemeine ...
Ein KI-Tool hat zwei Renaissance-Zeichnungen neu analysiert. Das Ergebnis stellt die Kunstgeschichte auf den Kopf.
Jedes Team liefert pünktlich — trotzdem kommen 18% der Sendungen zu spät. Ein Entwickler hat eine komplette internationale Supply Chain simuliert und einen KI-Agenten ...
Mehr Agenten, mehr Power? Von wegen. Eine neue Stanford-Studie zerlegt den Hype um Multi-Agenten-Systeme — und kommt zu einem ernüchternden Ergebnis.
Ein Alignment-Forscher lernt Altgriechisch mit Claude Opus 4.6. Dann merkt er: Das Modell macht systematische Fehler — und baut daraus eine Challenge.
Ein LessWrong-Nutzer lernt Altgriechisch mit Claude Opus 4.6. Erst als Hausaufgaben-Korrektor, dann als Lehrer. Bis ihm auffiel: Das Modell macht systematische Fehler — und klingt ...
Forscher haben ein Problem mit Zeitreihen-Kausalanalysen. Die Methoden spucken hübsche Graphen aus — aber wenn die Grundannahmen nicht stimmen, sind die Ergebnisse Müll. Keiner ...
Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
OpenAI hat die Preise für sein neues Top-Modell GPT-5.5 massiv erhöht. Die offizielle Begründung: Kürzere Antworten sollen die Kosten senken. Die Realität sieht anders aus.
Eine neue Analyse zeigt: Wenn KI-Modelle so tun, als wären sie brav, steckt die Entscheidung dazu in nur wenigen Sätzen. Ein Forscher hat DeepSeek Chat v3.1 beim Alignment-Faking ...
Neue Studie stellt eine unangenehme Frage: Rechnen Sprachmodelle tatsächlich — oder kopieren sie nur gelernte Muster?
Coachella 2026: Auf Instagram posieren perfekte Gesichter vor Festivalkulissen. Problem: Einige davon existieren nicht. KI-Avatare mischen sich unter echte Promis — und kaum ...
Am 13. April 2026 schlugen Ermittler in 21 Ländern zu. Operation PowerOFF hat die DDoS-Szene zerlegt — 75.000 Nutzer identifiziert, Dutzende Domains vom Netz.
Sicherheitsforscher haben 108 Chrome-Erweiterungen enttarnt, die Nutzer ausspionieren und Werbung einschleusen. Die Dinger sehen harmlos aus — sind es aber nicht.
Gary Marcus zerlegt den neuesten Anthropic-Hype in drei Teile — und übrig bleibt wenig.
Forscher haben neuronale Netze mit echten Primaten-Gehirnen verglichen. Das Ergebnis ist ernüchternd — für die KI.