Suche: erklären

EXPERIMENTAL

Neuro-symbolisches Modell erklärt Betrug 33× schneller

SHAP braucht 30 Millisekunden, um eine Betrugs-Vorhersage zu erklären. Ein neuro-symbolisches Modell schafft das in 0,9 ms — und liefert die Erklärung gleich mit, ohne ...

Towards Data Science · 2026-03-31 07:22:59.548195+00:00 · Score 3/10

EXPERIMENTAL

GPT-4 erklärt jedes Neuron in GPT-2

OpenAI lässt ein KI-Modell die Gehirnzellen eines anderen KI-Modells erklären. Klingt nach Science-Fiction, ist aber ein echtes Forschungsprojekt.

OpenAI News · 2026-03-23 03:19:48.521984+00:00 · Score 4/10

EXPERIMENTAL

Forscher lassen LLMs Tabellen-Daten erklären

Ein neues Paper auf arXiv kombiniert Statistik-Modelle mit Sprachmodellen. Ziel: Nicht nur vorhersagen, sondern verstehen warum.

arXiv AI/ML/NLP · 2026-05-25 13:21:12.263190+00:00 · Score 2/10

EXPERIMENTAL

KI soll KI erklären — mit Meta-Modellen

Ein Forscher auf LessWrong hat eine These: Statt KI-Modelle mühsam von Hand zu sezieren, sollten wir andere Modelle darauf trainieren, das Innenleben zu verstehen. Klingt nach ...

LessWrong · 2026-04-12 07:19:05.615763+00:00 · Score 2/10

EXPERIMENTAL

Forscher zwingt Gemma 3, sich selbst zu erklären

Ein Interpretability-Experiment auf LessWrong jagt Gemmas Aktivierungen durch einen "Verbalizer" — und schaut, wo das Modell sich selbst widerspricht.

LessWrong · 2026-05-15 04:24:00.251045+00:00 · Score 2/10

EXPERIMENTAL

Sam Rose erklärt Quantisierung besser als jedes Lehrbuch

Wie macht man ein 70-Milliarden-Parameter-Modell klein genug für den Laptop? Sam Rose zeigt es — mit dem vielleicht besten interaktiven Essay des Jahres.

Simon Willison · 2026-03-30 01:27:12.405450+00:00 · Score 3/10

KI-CRIME

Deepfake trifft Abgeordneten — Big Tech zuckt mit Schultern

Ein britischer Parlamentarier wurde Opfer einer KI-Deepfake-Kampagne. Als er die Verantwortlichen von Meta, Google und X im Unterhaus zur Rede stellte, bekam er: nichts ...

The Register AI · 2026-03-26 23:21:50.301925+00:00 · Score 6/10

KI-CRIME

KI-Firma klaut Identität — CEO muss sich erklären

The Verge knöpft sich Superhuman-Chef Shishir Mehrotra vor. Sein Unternehmen soll Menschen per KI imitiert haben — ohne deren Wissen.

The Verge AI · 2026-03-23 15:43:25.667130+00:00 · Score 5/10

EXPERIMENTAL

KI erklärt sich selbst — fast

Forscher haben eine Methode gebaut, die LLM-Aktivierungen in normalen Sätzen beschreibt. Unüberwacht. Ohne Labels. Ohne menschliches Zutun.

AI Alignment Forum · 2026-05-07 22:20:42.963260+00:00 · Score 4/10

EXPERIMENTAL

KI lernt Werte wie ein Mensch — durch Erklärung

Forscher haben einen neuen Trainings-Trick entdeckt. Er macht KI sicherer und braucht weniger Daten.

The Decoder · 2026-05-07 13:20:07.016773+00:00 · Score 6/10

EXPERIMENTAL

MIT knackt Geheimnis der KI-Riesen

Größere Modelle sind besser. Das weiß jeder. Warum das so ist, war ein Rätsel. Jetzt liefern MIT-Forscher die Erklärung.

The Decoder · 2026-05-03 10:17:18.157353+00:00 · Score 6/10

FOUNDER

Altman erklärt Safety-Exodus mit "Vibes"

Sam Altman hat eine Erklärung für die Massenflucht der Safety-Forscher bei OpenAI. Und die ist so dünn wie ein GPT-2-Prompt.

The Decoder · 2026-04-06 19:15:59.988273+00:00 · Score 7/10

FOUNDER

Pentagon wollte Anthropic — bis Trump dazwischenfunkte

Anthropic schlägt zurück. Das KI-Unternehmen hat am Freitag zwei eidesstattliche Erklärungen vor einem Bundesgericht in Kalifornien eingereicht — und widerspricht dem Pentagon ...

TechCrunch AI · 2026-03-23 18:21:17.430869+00:00 · Score 7/10

HOT

Anthropics Fable nervt Security-Forscher gewaltig

Anthropic hat sein neues Modell Fable ausgerollt — und die Cybersecurity-Szene tobt. Die Guardrails sind so eng geschnürt, dass seriöse Security-Arbeit praktisch unmöglich wird.

TechCrunch AI · 2026-06-10 16:18:51.797035+00:00 · Score 6/10

AGENTS

Arm killt klassische Security-Scanner mit Metis

Arm hat sein Agentic-Security-Framework Metis als Open Source veröffentlicht. Das Ding jagt Software-Bugs autonom — und schlägt klassische SAST-Tools dabei deutlich.

InfoQ AI/ML · 2026-05-30 22:19:14.579198+00:00 · Score 6/10

EXPERIMENTAL

KI frisst sich selbst kaputt — Forscher liefern Erklärung

LLMs, die mit ihrem eigenen Output trainiert werden, verblöden. Bekannt. Aber WARUM genau — das hat jetzt eine Studie zerlegt.

arXiv AI/ML/NLP · 2026-05-26 04:18:59.835158+00:00 · Score 2/10

EXPERIMENTAL

Forscher zerlegt Qwen-Hirn beim Rechnen

Ein LessWrong-Autor nutzt Anthropics neue NLA-Technik, um Qwen 2.5 7B beim Multiplizieren zuzusehen. Das Ergebnis: ein Blick direkt in die Gedanken eines Sprachmodells.

LessWrong · 2026-05-16 22:18:38.543257+00:00 · Score 4/10

EXPERIMENTAL

Forscher übersetzen GPT-Gehirn in Klartext

Ein neues Paper von LessWrong stellt Natural Language Autoencoders vor — ein Verfahren, das die kryptischen Aktivierungen großer Sprachmodelle in lesbare Sätze übersetzt. Klingt ...

LessWrong · 2026-05-09 07:18:52.731349+00:00 · Score 3/10

EXPERIMENTAL

Anthropic knackt Claude's Gedanken

Die Forscher haben einen Weg gefunden, die geheimen Zahlen im Kopf von Claude in normale Sprache zu übersetzen.

MarkTechPost · 2026-05-08 10:28:16.286708+00:00 · Score 5/10

EXPERIMENTAL

KI erklärt endlich ihre eigenen Themen

Forscher haben ein System gebaut, das nicht nur Themen in Texten findet, sondern auch genau erklären kann, wie es dazu kommt. Agentopic heißt das Ding.

arXiv AI/ML/NLP · 2026-05-05 07:22:35.543660+00:00 · Score 2/10

SUCHE

Neuro-symbolisches Modell erklärt Betrug 33× schneller

GPT-4 erklärt jedes Neuron in GPT-2

Forscher lassen LLMs Tabellen-Daten erklären

KI soll KI erklären — mit Meta-Modellen

Forscher zwingt Gemma 3, sich selbst zu erklären

Sam Rose erklärt Quantisierung besser als jedes Lehrbuch

Deepfake trifft Abgeordneten — Big Tech zuckt mit Schultern

KI-Firma klaut Identität — CEO muss sich erklären

KI erklärt sich selbst — fast

KI lernt Werte wie ein Mensch — durch Erklärung

MIT knackt Geheimnis der KI-Riesen

Altman erklärt Safety-Exodus mit "Vibes"

Pentagon wollte Anthropic — bis Trump dazwischenfunkte

Anthropics Fable nervt Security-Forscher gewaltig

Arm killt klassische Security-Scanner mit Metis

KI frisst sich selbst kaputt — Forscher liefern Erklärung

Forscher zerlegt Qwen-Hirn beim Rechnen

Forscher übersetzen GPT-Gehirn in Klartext

Anthropic knackt Claude's Gedanken

KI erklärt endlich ihre eigenen Themen