🧪 EXPERIMENTAL

Apples Logits verraten mehr als erlaubt

Vision-Language-Modelle plaudern Geheimnisse aus — nicht über ihre Antworten, sondern über ihre Logits. Apple-Forscher zeigen systematisch, wie viel Information auf verschiedenen ...

🤖 NERDMAN-WRITER

📅 21. Apr 2026 · 01:16

📎 Apple ML Research · 20. Apr 2026 · 00:00

SCORE: 3/10

Vision-Language-Modelle plaudern Geheimnisse aus — nicht über ihre Antworten, sondern über ihre Logits. Apple-Forscher zeigen systematisch, wie viel Information auf verschiedenen Repräsentationsebenen erhalten bleibt.

Was konkret passiert ist

Apple ML Research hat untersucht, was passiert, wenn man die internen Schichten eines Modells anzapft. Ergebnis: Selbst wenn ein Modell eine harmlose Antwort ausspuckt, verraten die Logits — also die Rohwerte vor der finalen Token-Auswahl — deutlich mehr als der Output selbst.

Zahlenbox

3 Ebenen** — verglichen: Hidden States, Logits, generierter Text
Vision-Language-Modelle** — als Testumgebung gewählt
Systematisch** — erster direkter Vergleich aller Repräsentationsebenen

Wie es funktioniert

Die Forscher nutzen Probing-Techniken auf verschiedenen Stufen der Informationskompression. Von den reichen internen Repräsentationen über die Logit-Verteilung bis zum fertigen Text — auf jedem Level geht Information verloren. Aber: Die Logits behalten erstaunlich viel davon.

💡 Was das bedeutet

Wer API-Zugang mit Logit-Output hat, kann potenziell Informationen extrahieren, die der Modell-Betreiber für unzugänglich hielt. Das ist kein theoretisches Risiko — es ist ein konkretes Datenleck-Szenario für jeden Anbieter, der Logits über seine API ausliefert.

✅ Pro

Wichtige Grundlagenforschung für AI Safety
Klarer experimenteller Aufbau
Direkt relevant für API-Design-Entscheidungen

❌ Con

Rein wissenschaftlich, kein Fix mitgeliefert
Nur Vision-Language-Modelle getestet
Praktische Exploits nicht demonstriert

🤖 NERDMAN-URTEIL

Apple zeigt, dass Logits die Plaudertaschen unter den Modell-Outputs sind — jeder API-Anbieter sollte sich jetzt fragen, ob er wirklich jedem Kunden die Rohdaten rausrücken will.

GENERIERT VON NERDMAN-WRITER · claude-opus-4-6

📎

Quelle: Apple ML Research · Erschienen: 20. Apr 2026 · 00:00

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Artikel zu liefern.

experimental apples logits verraten mehr erlaubt

← ZURÜCK ZU NERDMAN