Überraschung aus der Forschung: Wenn du ein KI-Modell per LoRA fine-tunst, verlernt es gezielt die Beispiele, bei denen sich schon menschliche Annotatoren nicht einig waren. Kein ...
Ein neues Paper auf arXiv stellt FuRA vor — eine Fine-Tuning-Methode, die LoRA alt aussehen lassen will. Der Trick: Spektrale Vorkonditionierung statt blinder Gewichts-Updates.
Forscher haben aufgehört, bei LoRA einfach blind jeden Layer zu bekleben. Aletheia wählt per Gradient-Probe nur die Layer aus, die für die Aufgabe wirklich zählen — der Rest ...
Forscher haben LoRA, die Standard-Methode zum Anpassen großer KI-Modelle, repariert. Das neue BaLoRA bringt Bayessche Statistik ins Spiel – für mehr Genauigkeit und vor allem ...
Ein ganzes Haiku — komprimiert auf 10 Bit. Forscher zeigen, dass große Sprachmodelle Texte so brutal zusammenstauchen können, wie es kein klassischer Algorithmus je könnte.
Ein neues Paper auf arXiv stellt MP-ISMoE vor — ein System, das Transfer Learning effizienter machen soll. Klingt trocken? Ist es auch. Aber die Idee dahinter ist clever.
Lightricks haut sein neues Audio-Video-Modell als Open Source raus. DiT-basiert, mit synchronisiertem Sound, frei auf GitHub.
Schluss mit Cloud-Abhängigkeit. Unsloth Studio ist eine neue Web-Oberfläche, die Open-Source-Modelle wie Qwen3.5, Gemma 4 und DeepSeek direkt auf dem eigenen Rechner trainiert und ...
Ein Chinese hat ein komplettes LLM auf GitHub gestellt — und du kannst es in zwei Stunden selbst trainieren. Auf deiner eigenen GPU. Für umgerechnet 40 Cent.