Paul Christianos Alignment-Bude ARC hat ein neues Paper rausgehauen. Es geht um die Frage: Was spuckt ein zufällig initialisiertes MLP eigentlich im Schnitt aus — ohne dass man ...
Anthropics Desktop-App für Claude installiert heimlich eine Browser-Extension — ohne zu fragen. Ein Datenschützer stolperte nur per Zufall darüber.
Neuronale Netze sind notorische Besserwisser. Noch bevor sie echte Daten gesehen haben, spucken sie Vorhersagen mit 99% Confidence aus — für kompletten Müll. Forscher haben jetzt ...
Ein Team hat neue Methoden entwickelt, um Erwartungswerte von Zufallsprodukten zu schätzen — ohne klassisches Sampling. Klingt trocken? Ist es auch. Aber relevant.
Anthropic hat still und leise Claude Opus 4.7 rausgehauen. Das neue Top-Modell soll vor allem beim Coding abliefern — und kommt mitten im Mythos-Preview-Hype.
Ein IT-Dienstleister erklärt uns, wie gefährlich KI in falschen Händen ist. Zufällig verkauft er auch die Lösung dagegen.
Andrej Karpathy hat ein Repo namens `autoresearch` auf GitHub veröffentlicht. Darin lassen autonome Agenten KI-Forschung auf einer einzigen GPU laufen — automatisch, ohne Mensch.
Elf Jahre kein Zugriff. Dann übernimmt ein Chatbot — und öffnet die Bitcoin-Wallet.
Ein Interpretability-Experiment auf LessWrong jagt Gemmas Aktivierungen durch einen "Verbalizer" — und schaut, wo das Modell sich selbst widerspricht.
Ein neues KI-Modell stellt den State of the Art für Echtzeit-Sprachunterhaltung auf den Kopf. Thinking Machines veröffentlicht nach langer Pause ihr "TML-Interaction-Small".
Ein Forscher hat KI-Modelle in eine Falle gelockt — und ein verstörendes Muster gefunden. Modelle täuschen häufiger, um Verluste abzuwehren, als um Vorteile zu erschleichen.
New Yorks größter Schulbezirk wurde gleich doppelt attackiert. Eine Malware-Attacke und ein separater Canvas-Hack treffen Lehrer, Schüler und IT-Teams zur gleichen Zeit.
Russlands Militärgeheimdienst betreibt offenbar einen eigenen Lehrstuhl für Nachwuchs-Hacker. Mehrere Medien zitieren interne Dokumente aus der Ausbildung.
Die "CallPhantom"-Kampagne lockt Neugierige mit einem dreisten Versprechen: Anrufverlauf jeder beliebigen Handynummer — gegen Bezahlung. Geliefert werden frei erfundene Daten.
Anthropic hat ein neues Modell namens Claude Mythos Preview angekündigt — und sagt im selben Atemzug, es sei zu mächtig für die Öffentlichkeit.
Google packt sein Gemini Nano AI-Modell ungefragt in den Chrome-Ordner. User merken es erst, wenn die Festplatte voll ist.
Eine KI-Firma scannt Milliarden Gesichter. Ihre Kunden sind Polizeibehörden. Ihre Geldgeber sind Trump-Unterstützer und Rechtsextreme. Das ist Clearview AI.
Ein LessWrong-Autor hat ein Webtool gebaut, das festgefahrenen Entwicklern Ratschläge im Tarot-Stil ausspuckt. Klick drauf, lies den kryptischen Satz, mach was draus.
OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...
US- und chinesische Behörden haben gemeinsam neun Krypto-Betrugszentren ausgehoben. 276 Verdächtige sitzen hinter Gittern.