Microsoft und drei chinesische Unis haben SkillOpt vorgestellt. Die Methode trimmt Agenten auf Leistung — ohne ein einziges Modellgewicht anzufassen.
Ein neues Paper auf arXiv stellt FuRA vor — eine Fine-Tuning-Methode, die LoRA alt aussehen lassen will. Der Trick: Spektrale Vorkonditionierung statt blinder Gewichts-Updates.