Suche: Rechenzeit

EXPERIMENTAL

KI-Modelle vergessen rückwärts — mehr Rechenzeit hilft

Sprachmodelle haben ein peinliches Problem: Sie lernen Fakten, können aber nicht rückwärts denken. Ein neues Paper zeigt, wie man das mit Rechenzeit zur Inferenz flicken kann.

arXiv AI/ML/NLP · 2026-04-03 22:22:08.190404+00:00 · Score 2/10

AGENTS

Mehr Rechenzeit macht LLMs schlauer

Inference-Time Scaling ist der neue Hebel der KI-Branche. Statt größere Modelle zu bauen, lässt man bestehende Modelle einfach länger nachdenken. Sebastian Raschka hat die ...

Ahead of AI (Raschka) · 2026-03-22 01:22:46.858707+00:00 · Score 5/10

AGENTS

Klein-Modell rechnet Riesen an die Wand

Bonner Forscher haben Transformer-Modelle umgebaut. Die dürfen jetzt selbst entscheiden, wie lange sie über eine Aufgabe grübeln. Ergebnis: Kleine Modelle schlagen deutlich ...

The Decoder · 2026-03-23 15:40:29.818703+00:00 · Score 6/10

EXPERIMENTAL

Bonner Forscher lassen kleine KI länger nachdenken

Ein Team aus Bonn hat Transformer-Modelle gebaut, die selbst entscheiden, wie lange sie über eine Aufgabe grübeln. Das Ergebnis: Kleine Modelle schlagen deutlich größere — ...

The Decoder · 2026-03-22 17:51:04.692438+00:00 · Score 4/10

EXPERIMENTAL

OpenAI macht dünnbesetzte Netze brutal schnell

OpenAI veröffentlicht GPU-Kernel, die eine fast vergessene Netzwerk-Architektur wiederbeleben: Block-Sparse Networks. Die Rechenzeit? Teilweise um Größenordnungen schneller als ...

OpenAI News · 2026-03-22 06:46:51.614262+00:00 · Score 6/10

EXPERIMENTAL

Microsoft baut Video-KI ein Gedächtnis ein

Microsoft Research und mehrere Universitäten haben mit Mirage ein Video-Weltmodell vorgestellt, das sich Szenen merkt — und zwar ohne die übliche Speicher-Schlacht.

The Decoder · 2026-06-14 10:18:43.277670+00:00 · Score 5/10

EXPERIMENTAL

Forscher dosieren KI-Eingriffe per Wahrscheinlichkeit

Ein neues Paper auf arXiv schlägt vor, Alignment nicht stur, sondern selektiv zur Inferenz-Zeit anzuwenden. Statt jedes Token zu kontrollieren, soll das Modell entscheiden: ...

arXiv AI/ML/NLP · 2026-06-11 07:20:10.908730+00:00 · Score 2/10

TOOLS

Together knackt 1 Million Token im Kontext

Together AI hat MiniMax-M3 in Produktion gebracht — mit einem Inferenz-Stack, der 1M-Token-Kontext nicht nur möglich, sondern bezahlbar macht. Der Blogpost liest sich wie ein ...

Together AI Blog · 2026-06-02 22:19:00.929269+00:00 · Score 6/10

EXPERIMENTAL

Forscher bauen Diffusion-Modellen ein Gedächtnis

Ein neues Paper auf arXiv will Masked Diffusion Models das ständige Vergessen abgewöhnen. Die Methode heißt "Relay" — und klingt nach mehr Effizienz beim Generieren.

arXiv AI/ML/NLP · 2026-05-25 19:19:47.154491+00:00 · Score 2/10

EXPERIMENTAL

Forscher zähmen wilde KI-Datenbank-Abfragen

Ein neues Paper auf arXiv mischt Text2Cypher auf. Sprachmodelle sollen lernen, ihre eigenen Syntax-Fehler zu erkennen — und zu korrigieren.

arXiv AI/ML/NLP · 2026-05-25 16:19:22.403790+00:00 · Score 2/10

EXPERIMENTAL

KI sagt voraus welche Forschung floppt

Sprachmodelle sollen jetzt Forschungsideen bewerten — bevor auch nur ein einziges Experiment läuft. Ein neues arXiv-Paper testet, ob LMs den Erfolg von KI-Forschung vorhersagen ...

arXiv AI/ML/NLP · 2026-05-22 07:20:29.697421+00:00 · Score 2/10

GELD

Anthropic zahlt SpaceX 45 Milliarden für Rechenpower

Anthropic schnappt sich Compute-Kapazität bei Elon Musks SpaceX. Preisschild: knapp 45 Milliarden Dollar.

Bloomberg Technology · 2026-05-21 04:19:45.903208+00:00 · Score 7/10

EXPERIMENTAL

Forscher knacken Zufalls-Mathematik ohne Sampling

Ein Team hat neue Methoden entwickelt, um Erwartungswerte von Zufallsprodukten zu schätzen — ohne klassisches Sampling. Klingt trocken? Ist es auch. Aber relevant.

LessWrong · 2026-05-16 04:19:13.658928+00:00 · Score 2/10

EXPERIMENTAL

KI erschafft 3D-Welten in Echtzeit

Forscher stellen den Code für "3D Gaussian Splatting" frei. Diese Technik erzeugt atemberaubende 3D-Szenen aus einfachen Videos. Und das in Echtzeit.

GitHub Trending Python · 2026-05-14 07:17:43.882091+00:00 · Score 2/10

EXPERIMENTAL

Microsoft baut KI-Modell fürs Stromnetz

Microsoft Research hat GridSFM vorgestellt — ein kleines Foundation Model, das den AC Optimal Power Flow in Millisekunden berechnet. Klingt nerdig, geht aber um Milliarden.

Microsoft Research · 2026-05-13 22:20:35.722149+00:00 · Score 5/10

EXPERIMENTAL

KI-Forscher tricksen TPU-Hardware aus

Wissenschaftler haben einen neuen Weg gefunden, riesige KI-Modelle effizienter zu trainieren. Sie tricksen die Hardware mit einem cleveren mathematischen Kniff.

arXiv AI/ML/NLP · 2026-05-12 07:25:00.907517+00:00 · Score 2/10

EXPERIMENTAL

Forscher lassen LLMs neue KI-Architekturen bauen

Ein neues arXiv-Paper schickt Large Language Models in die Neural Architecture Search. Die Idee: Statt Menschen lassen wir die KI selbst bessere KI-Modelle entwerfen.

arXiv AI/ML/NLP · 2026-05-07 04:21:37.470620+00:00 · Score 2/10

TOOLS

Google killt Warteschleifen für KI-Jobs

Endlich Schluss mit ständigem Nachfragen. Google bringt Webhooks für seine Gemini API.

Google AI Blog · 2026-05-04 22:17:27.227504+00:00 · Score 6/10

EXPERIMENTAL

Forscher zähmen Token-Längen mit neuem Modell

Ein neues Paper auf arXiv schlägt ein Framework vor, das die Länge von KI-Antworten auf Token-Ebene vorhersagt. Klingt nerdig — könnte aber Inferenz-Kosten massiv drücken.

arXiv AI/ML/NLP · 2026-05-02 01:16:43.859932+00:00 · Score 2/10

EXPERIMENTAL

Forscher zähmen Physik-KI mit Meta-Trick

Ein neues arXiv-Paper packt ein altes Problem an: Physics-Informed Neural Networks müssen für jede Aufgabe neu trainiert werden. Die Autoren wollen das mit Compositional ...

arXiv AI/ML/NLP · 2026-05-01 07:21:30.443331+00:00 · Score 2/10

SUCHE

KI-Modelle vergessen rückwärts — mehr Rechenzeit hilft

Mehr Rechenzeit macht LLMs schlauer

Klein-Modell rechnet Riesen an die Wand

Bonner Forscher lassen kleine KI länger nachdenken

OpenAI macht dünnbesetzte Netze brutal schnell

Microsoft baut Video-KI ein Gedächtnis ein

Forscher dosieren KI-Eingriffe per Wahrscheinlichkeit

Together knackt 1 Million Token im Kontext

Forscher bauen Diffusion-Modellen ein Gedächtnis

Forscher zähmen wilde KI-Datenbank-Abfragen

KI sagt voraus welche Forschung floppt

Anthropic zahlt SpaceX 45 Milliarden für Rechenpower

Forscher knacken Zufalls-Mathematik ohne Sampling

KI erschafft 3D-Welten in Echtzeit

Microsoft baut KI-Modell fürs Stromnetz

KI-Forscher tricksen TPU-Hardware aus

Forscher lassen LLMs neue KI-Architekturen bauen

Google killt Warteschleifen für KI-Jobs

Forscher zähmen Token-Längen mit neuem Modell

Forscher zähmen Physik-KI mit Meta-Trick