Die größte Preprint-Plattform der Welt zieht den Stecker. ArXiv hat genug von Forschern, die ChatGPT-Müll als Wissenschaft verkaufen.
Ein neues arXiv-Paper schickt Large Language Models in die Neural Architecture Search. Die Idee: Statt Menschen lassen wir die KI selbst bessere KI-Modelle entwerfen.
Ein neues arXiv-Paper packt ein altes Problem an: KI-Modelle, die beim Lernen alles wieder verlernen. Die Lösung heißt "Adaptive Weight Decay" — also gezieltes Vergessen.
Ein neues Paper auf arXiv schlägt ein Framework vor, das die Länge von KI-Antworten auf Token-Ebene vorhersagt. Klingt nerdig — könnte aber Inferenz-Kosten massiv drücken.
Ein neues Paper auf arXiv will Neural Networks beim Training live überwachen — bevor sie kollabieren. Das Werkzeug heißt Collapse Index. Klingt nach Sci-Fi, ist aber Mathematik.
Ein neues Paper aus dem Arxiv will LLM-Halluzinationen nicht wegtrainieren — sondern wegfiltern. Der Ansatz: Wenn das Modell sich unsicher ist, soll es einfach die Klappe halten.
Ein neues arXiv-Paper drückt die Cramér-Distanz in den Soft-Actor-Critic-Algorithmus. Das Ergebnis heißt C-DSAC und ist reine Mathe-Spielerei für RL-Nerds.
Ein neues Paper auf arXiv präsentiert "LKV" — eine Methode, die den größten Engpass langer Kontexte angeht: den KV-Cache.
Ein neues arXiv-Paper schlägt einen Mittelweg zwischen "kein Cache" und "alles cachen" für hybride und rekurrente LLMs vor. Klingt nerdig — ist es auch.
Ein neues Paper auf arXiv stellt einen Lernansatz vor, bei dem ein KI-Modell nacheinander von verschiedenen Lehrer-Modellen lernt — ohne deren Trainingsdaten zu kennen.
Ein neues Paper auf arXiv stellt MP-ISMoE vor — ein System, das Transfer Learning effizienter machen soll. Klingt trocken? Ist es auch. Aber die Idee dahinter ist clever.
Ein neues Paper auf arXiv schlägt einen Optimizer vor, der seine eigenen Hyperparameter regelt. Der Name: MetaAdamW.
Ein neues arXiv-Paper will Maschinen beibringen, ihr eigenes Lernverhalten umzuschalten. Ohne externen Trigger. Nur durch interne Dynamik.
Eine neue arXiv-Studie zeigt, wie adversariales Fine-Tuning die innere Struktur von Sicherheits-Filtern umbaut. Kein neues Modell, kein neues Tool — sondern ein Blick unter die ...
Ein neues arXiv-Paper packt ein altes Problem an: Physics-Informed Neural Networks müssen für jede Aufgabe neu trainiert werden. Die Autoren wollen das mit Compositional ...
Ein neues arXiv-Paper schlägt einen simplen Trick vor, der Masked Diffusion Models (MDMs) schlauer machen soll. Der Name: Self-Conditioning Adaptation.
Forscher haben eine neue Methode gefunden, den KV-Cache von Transformern zu schrumpfen — und zwar über das bisherige theoretische Limit hinaus.
Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...
Forscher haben ein Problem mit LLM-Benchmarks: Die Bewertungsmaßstäbe selbst sind oft Müll. RIFT liefert jetzt eine Taxonomie, die zeigt, wo genau Rubrics versagen.
Wissenschaftliche Papers behaupten viel — und belegen es mit Grafiken, Tabellen, Diagrammen. Aber checkt die KI auch wirklich, ob Bild und Behauptung zusammenpassen? Ein neuer ...