Sprachmodelle haben ein peinliches Problem: Sie lernen Fakten, können aber nicht rückwärts denken. Ein neues Paper zeigt, wie man das mit Rechenzeit zur Inferenz flicken kann.
Inference-Time Scaling ist der neue Hebel der KI-Branche. Statt größere Modelle zu bauen, lässt man bestehende Modelle einfach länger nachdenken. Sebastian Raschka hat die ...
Bonner Forscher haben Transformer-Modelle umgebaut. Die dürfen jetzt selbst entscheiden, wie lange sie über eine Aufgabe grübeln. Ergebnis: Kleine Modelle schlagen deutlich ...
Ein Team aus Bonn hat Transformer-Modelle gebaut, die selbst entscheiden, wie lange sie über eine Aufgabe grübeln. Das Ergebnis: Kleine Modelle schlagen deutlich größere — ...
OpenAI veröffentlicht GPU-Kernel, die eine fast vergessene Netzwerk-Architektur wiederbeleben: Block-Sparse Networks. Die Rechenzeit? Teilweise um Größenordnungen schneller als ...
Microsoft Research und mehrere Universitäten haben mit Mirage ein Video-Weltmodell vorgestellt, das sich Szenen merkt — und zwar ohne die übliche Speicher-Schlacht.
Ein neues Paper auf arXiv schlägt vor, Alignment nicht stur, sondern selektiv zur Inferenz-Zeit anzuwenden. Statt jedes Token zu kontrollieren, soll das Modell entscheiden: ...
Together AI hat MiniMax-M3 in Produktion gebracht — mit einem Inferenz-Stack, der 1M-Token-Kontext nicht nur möglich, sondern bezahlbar macht. Der Blogpost liest sich wie ein ...
Ein neues Paper auf arXiv will Masked Diffusion Models das ständige Vergessen abgewöhnen. Die Methode heißt "Relay" — und klingt nach mehr Effizienz beim Generieren.
Ein neues Paper auf arXiv mischt Text2Cypher auf. Sprachmodelle sollen lernen, ihre eigenen Syntax-Fehler zu erkennen — und zu korrigieren.
Sprachmodelle sollen jetzt Forschungsideen bewerten — bevor auch nur ein einziges Experiment läuft. Ein neues arXiv-Paper testet, ob LMs den Erfolg von KI-Forschung vorhersagen ...
Anthropic schnappt sich Compute-Kapazität bei Elon Musks SpaceX. Preisschild: knapp 45 Milliarden Dollar.
Ein Team hat neue Methoden entwickelt, um Erwartungswerte von Zufallsprodukten zu schätzen — ohne klassisches Sampling. Klingt trocken? Ist es auch. Aber relevant.
Forscher stellen den Code für "3D Gaussian Splatting" frei. Diese Technik erzeugt atemberaubende 3D-Szenen aus einfachen Videos. Und das in Echtzeit.
Microsoft Research hat GridSFM vorgestellt — ein kleines Foundation Model, das den AC Optimal Power Flow in Millisekunden berechnet. Klingt nerdig, geht aber um Milliarden.
Wissenschaftler haben einen neuen Weg gefunden, riesige KI-Modelle effizienter zu trainieren. Sie tricksen die Hardware mit einem cleveren mathematischen Kniff.
Ein neues arXiv-Paper schickt Large Language Models in die Neural Architecture Search. Die Idee: Statt Menschen lassen wir die KI selbst bessere KI-Modelle entwerfen.
Endlich Schluss mit ständigem Nachfragen. Google bringt Webhooks für seine Gemini API.
Ein neues Paper auf arXiv schlägt ein Framework vor, das die Länge von KI-Antworten auf Token-Ebene vorhersagt. Klingt nerdig — könnte aber Inferenz-Kosten massiv drücken.
Ein neues arXiv-Paper packt ein altes Problem an: Physics-Informed Neural Networks müssen für jede Aufgabe neu trainiert werden. Die Autoren wollen das mit Compositional ...