Ein neues arXiv-Paper schlägt vor, die Attention-Schicht von Transformern mit einem 100 Jahre alten Physik-Konzept aufzubohren. Klingt nerdig — ist es auch.
Claude bekommt ein Skill-System. Anthropic hat ein öffentliches Repository veröffentlicht, das Agenten beibringt, spezialisierte Aufgaben wiederholbar auszuführen.
Ein LessWrong-Post zeigt: Sprachmodelle haben eine eigene Vorstellung von Distanz zwischen Tokens. Und die ist überraschend.
Diffusion Language Models (DLMs) bekommen ein Problem gelöst, das bisher kaum jemand verstanden hat: Standard-Finetuning macht sie schlechter statt besser. Ein neues Paper zeigt ...
Ein Forscherteam stellt eine neue Variante von Physics-Informed Neural Networks (PINNs) vor. Das Netz balanciert Physik- und Daten-Loss jetzt selbst aus.