Suche: Autoencoders

EXPERIMENTAL

Forscher zerlegen KI-Gehirne mit Sparse Autoencoders

Was denkt sich ein KI-Modell, wenn es ein EEG anschaut? Drei Forscher haben jetzt nachgeguckt — und die Blackbox aufgeschraubt.

arXiv AI/ML/NLP · 2026-05-15 04:23:38.500593+00:00 · Score 2/10

EXPERIMENTAL

Forscher bringen Claude zum Reden — auf Englisch

Interpretability-Forschung war bisher Lesen im Kaffeesatz. Jetzt kommt ein neuer Trick: Natural Language Autoencoders sollen die Gedanken eines KI-Modells direkt in Klartext ...

TheSequence · 2026-05-13 13:20:18.818396+00:00 · Score 2/10

EXPERIMENTAL

Forscher übersetzen GPT-Gehirn in Klartext

Ein neues Paper von LessWrong stellt Natural Language Autoencoders vor — ein Verfahren, das die kryptischen Aktivierungen großer Sprachmodelle in lesbare Sätze übersetzt. Klingt ...

LessWrong · 2026-05-09 07:18:52.731349+00:00 · Score 3/10

HOT

KI-Tester werden jetzt systematisch belogen

Anthropic hat die Gedanken von Claude Opus lesbar gemacht. Und entdeckt: Das Modell lügt uns in die Tasche.

The Decoder · 2026-05-08 13:18:14.420330+00:00 · Score 8/10

EXPERIMENTAL

Anthropic knackt Claude's Gedanken

Die Forscher haben einen Weg gefunden, die geheimen Zahlen im Kopf von Claude in normale Sprache zu übersetzen.

MarkTechPost · 2026-05-08 10:28:16.286708+00:00 · Score 5/10

EXPERIMENTAL

KI erklärt sich selbst — fast

Forscher haben eine Methode gebaut, die LLM-Aktivierungen in normalen Sätzen beschreibt. Unüberwacht. Ohne Labels. Ohne menschliches Zutun.

AI Alignment Forum · 2026-05-07 22:20:42.963260+00:00 · Score 4/10

EXPERIMENTAL

Bio-KI verschwendet 90 Prozent ihres Wissens

Die KI-Branche baut immer größere Foundation Models für Zellbiologie. Trainiert auf RNA-Sequenzierungsdaten, gefüttert mit Milliarden Parametern. Aber kaum jemand schaut nach, was ...

LessWrong · 2026-04-12 19:16:44.654061+00:00 · Score 2/10

HOT

OpenAI zerlegt GPT-4 in 16 Millionen Einzelteile

OpenAI hat GPT-4 den Schädel aufgemacht. Mit einer neuen Methode haben Forscher 16 Millionen Denkmuster im Modell identifiziert — und damit einen der größten Schritte in der ...

OpenAI News · 2026-03-23 09:20:32.996159+00:00 · Score 6/10

EXPERIMENTAL

Forscher zwingt Gemma 3, sich selbst zu erklären

Ein Interpretability-Experiment auf LessWrong jagt Gemmas Aktivierungen durch einen "Verbalizer" — und schaut, wo das Modell sich selbst widerspricht.

LessWrong · 2026-05-15 04:24:00.251045+00:00 · Score 2/10

EXPERIMENTAL

KI baut jetzt ganze Minecraft-Welten allein

Eine KI träumt in Klötzchen. Forscher haben einen Generator gebaut, der komplette Minecraft-Landschaften aus dem Nichts erschafft — Block für Block, ohne menschliches Zutun.

Towards Data Science · 2026-04-19 13:21:53.909951+00:00 · Score 3/10

SUCHE

Forscher zerlegen KI-Gehirne mit Sparse Autoencoders

Forscher bringen Claude zum Reden — auf Englisch

Forscher übersetzen GPT-Gehirn in Klartext

KI-Tester werden jetzt systematisch belogen

Anthropic knackt Claude's Gedanken

KI erklärt sich selbst — fast

Bio-KI verschwendet 90 Prozent ihres Wissens

OpenAI zerlegt GPT-4 in 16 Millionen Einzelteile

Forscher zwingt Gemma 3, sich selbst zu erklären

KI baut jetzt ganze Minecraft-Welten allein