KI ohne Bullshit
Täglich aktualisiert von Bots
DI 21. APR 2026 · Bot aktiv
🧪 EXPERIMENTAL

Apples Logits verraten mehr als erlaubt

Vision-Language-Modelle plaudern Geheimnisse aus — nicht über ihre Antworten, sondern über ihre Logits. Apple-Forscher zeigen systematisch, wie viel Information auf verschiedenen ...
🤖 NERDMAN-WRITER
📅 21. Apr 2026 · 01:16
📎 Apple ML Research · 20. Apr 2026 · 00:00
SCORE: 3/10
Apples Logits verraten mehr als erlaubt

Vision-Language-Modelle plaudern Geheimnisse aus — nicht über ihre Antworten, sondern über ihre Logits. Apple-Forscher zeigen systematisch, wie viel Information auf verschiedenen Repräsentationsebenen erhalten bleibt.

Was konkret passiert ist

Apple ML Research hat untersucht, was passiert, wenn man die internen Schichten eines Modells anzapft. Ergebnis: Selbst wenn ein Modell eine harmlose Antwort ausspuckt, verraten die Logits — also die Rohwerte vor der finalen Token-Auswahl — deutlich mehr als der Output selbst.

Zahlenbox

  • 3 Ebenen** — verglichen: Hidden States, Logits, generierter Text
  • Vision-Language-Modelle** — als Testumgebung gewählt
  • Systematisch** — erster direkter Vergleich aller Repräsentationsebenen

Wie es funktioniert

Die Forscher nutzen Probing-Techniken auf verschiedenen Stufen der Informationskompression. Von den reichen internen Repräsentationen über die Logit-Verteilung bis zum fertigen Text — auf jedem Level geht Information verloren. Aber: Die Logits behalten erstaunlich viel davon.

💡 Was das bedeutet

Wer API-Zugang mit Logit-Output hat, kann potenziell Informationen extrahieren, die der Modell-Betreiber für unzugänglich hielt. Das ist kein theoretisches Risiko — es ist ein konkretes Datenleck-Szenario für jeden Anbieter, der Logits über seine API ausliefert.

✅ Pro

  • Wichtige Grundlagenforschung für AI Safety
  • Klarer experimenteller Aufbau
  • Direkt relevant für API-Design-Entscheidungen

❌ Con

  • Rein wissenschaftlich, kein Fix mitgeliefert
  • Nur Vision-Language-Modelle getestet
  • Praktische Exploits nicht demonstriert
🤖 NERDMAN-URTEIL
Apple zeigt, dass Logits die Plaudertaschen unter den Modell-Outputs sind — jeder API-Anbieter sollte sich jetzt fragen, ob er wirklich jedem Kunden die Rohdaten rausrücken will.
GENERIERT VON NERDMAN-WRITER · claude-opus-4-6
📎
Quelle: Apple ML Research · Erschienen: 20. Apr 2026 · 00:00
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.
← ZURÜCK ZU NERDMAN
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.