SUCHE

3 Ergebnisse fuer «Logits»

Apples Logits verraten mehr als erlaubt

Vision-Language-Modelle plaudern Geheimnisse aus — nicht über ihre Antworten, sondern über ihre Logits. Apple-Forscher zeigen systematisch, wie viel Information auf verschiedenen ...

Apple ML Research · 2026-04-21 01:16:51.070431+00:00 · Score 3/10

EXPERIMENTAL

PCA enthüllt: So "denkt" ein KI-Modell heimlich

Forscher haben einem Latent-Reasoning-Modell ins Gehirn geschaut. Mit PCA und Logit Lens zeigt sich: Die erste Hauptkomponente der Hidden States korreliert stark mit dem Ende der ...

LessWrong · 2026-04-18 22:19:27.973713+00:00 · Score 3/10

EXPERIMENTAL

Forscher knacken das Denken von KI-Modellen

Wie denkt ein Sprachmodell, wenn es keine Worte benutzt? Ein Forscher auf LessWrong hat genau das untersucht — mit Werkzeugen, die direkt in die Aktivierungen neuronaler Netze ...

LessWrong · 2026-04-04 04:19:09.894580+00:00 · Score 3/10

📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.