Forscher zeigen: Sprachmodelle lernen Verbote ohne Lehrer
Eine neue arXiv-Studie knackt eine alte Linguistik-Frage mit LLMs als Versuchskaninchen. Ergebnis: Sprachmodelle wissen, was sie NICHT sagen dürfen — obwohl ihnen das niemand beigebracht hat.
Das Rätsel
Kinder lernen Sprache fast nur durch positive Beispiele. Niemand sagt ihnen: "So sagt man das nicht." Trotzdem vermeiden sie ungrammatische Formen. Wie?
Die Construction Grammar hat dafür einen Begriff: statistische Präemption. Heißt: Wer oft "donated the books to the library" hört, blockiert automatisch die theoretisch mögliche Variante "donated the library the books".
So lief das Experiment
- Methode:** Kausale Intervention statt nur Korrelation
- Modelle:** LLMs werden als Lerner-Simulation genutzt
- Trick:** Statistische Präemption wird von der Konkurrenz-Hypothese (Entrenchment) sauber getrennt
- Premiere:** Erste Studie, die beide Effekte direkt dissoziiert
💡 Was das bedeutet
LLMs sind hier nicht das Produkt, sondern das Mikroskop. Die Forscher nutzen sie, um eine 30 Jahre alte Debatte in der Linguistik zu entscheiden. Wenn das hält, ist das ein seltener Fall, in dem KI der Grundlagenforschung wirklich was beibringt — nicht umgekehrt.
✅ Pro
- Saubere kausale Evidenz statt Bauchgefühl
- LLMs als Testumgebung für Sprachtheorie
- Klärt eine echte offene Frage
❌ Con
- Übertragbarkeit auf menschliche Kinder bleibt offen
- LLM-Verhalten ≠ kognitiver Beweis
- Reine Theorie, kein Nutzen für Anwender