Suche: Linear

AGENTS

Lineare Netze rechnen plötzlich nichtlinear

OpenAI hat ein Paper rausgehauen, das Grundlagen erschüttert. Deep Linear Networks — also Netze, die eigentlich nur simple lineare Berechnungen können — zeigen nichtlineares ...

OpenAI News · 2026-03-22 02:13:26.665386+00:00 · Score 4/10

TOOLS

Sakana AI and NVIDIA Introduce TwELL with CUDA Kernels for 20.5% Inference and 21.9% Training Speedup in LLMs

NVIDIA und Sakana AI stellen Twell vor: CUDA-Kernel für 20,5 % schnelleres Inferenz und 21,9 % schnelleres Training von LLMs

MarkTechPost · 2026-05-11 10:26:02.209858+00:00 · Score 7/10

AGENTS

KI-Agenten holen sich jetzt selbst Tickets

OpenAI stellt den Workflow für KI-Agenten auf den Kopf. Ihr neues Framework "Symphony" macht Aufgaben-Tracker wie Linear zur Steuerzentrale.

The Decoder · 2026-05-04 10:16:04.612127+00:00 · Score 8/10

EXPERIMENTAL

Roboter denken jetzt in Objekten statt Sätzen

Forscher haben die Art gekillt, wie KI-Roboter ihre Welt verstehen. Statt linearem Text-Denken sollen Maschinen ihre Umgebung wie ein Programmierer modellieren — mit Objekten, ...

arXiv AI/ML/NLP · 2026-04-14 07:19:32.965755+00:00 · Score 2/10

EXPERIMENTAL

KI soll KI erklären — mit Meta-Modellen

Ein Forscher auf LessWrong hat eine These: Statt KI-Modelle mühsam von Hand zu sezieren, sollten wir andere Modelle darauf trainieren, das Innenleben zu verstehen. Klingt nach ...

LessWrong · 2026-04-12 07:19:05.615763+00:00 · Score 2/10

EXPERIMENTAL

Forscher trainieren KIs zum Lügen

Ein neues arXiv-Paper zeigt: Sprachmodelle lassen sich gezielt darauf trimmen, falsche Antworten zu geben — während sie intern noch die richtige Antwort kennen. Willkommen in der ...

arXiv AI/ML/NLP · 2026-06-02 04:21:50.540229+00:00 · Score 3/10

EXPERIMENTAL

Forscher tricksen Transformer-Speicher mit 2-Level-Cache aus

Ein neues Paper auf arXiv will das größte Problem moderner LLMs lösen: Den explodierenden Speicherbedarf bei langem Kontext. Die Idee klaut beim Prozessor-Design.

arXiv AI/ML/NLP · 2026-05-25 13:20:14.583263+00:00 · Score 2/10

EXPERIMENTAL

KI knackt Physik-Problem mit neuem Trick

Forscher haben einen Durchbruch in der Molekül-Simulation verkündet. Ihr neuer Attention-Mechanismus macht Maschinenlernen für Kraftfelder langreichweitig und effizient.

Nature Mach Intel · 2026-04-22 07:24:14.786192+00:00 · Score 6/10

HOT

Wer mehr zahlt, hackt besser

Die britische KI-Sicherheitsbehörde AISI hat Claude Mythos Preview unter die Lupe genommen — und Anthropics eigene Behauptungen bestätigt. Das Modell ist außergewöhnlich gut ...

Simon Willison · 2026-04-15 01:15:39.958661+00:00 · Score 6/10

EXPERIMENTAL

LiME macht Experten-Modelle 90% schlanker

Forscher haben ein Problem mit Mixture-of-Experts-Modellen: Jeder Experte braucht seinen eigenen Adapter. Mehr Experten, mehr Parameter, mehr Kosten. LiME soll das ändern.

arXiv AI/ML/NLP · 2026-04-06 04:16:24.022443+00:00 · Score 3/10

EXPERIMENTAL

GPU-Trick macht Hawkes-Prozesse 100× schneller

Ein Mathe-Paper aus der Nische schafft es, einen jahrzehntealten Algorithmus auf moderne GPUs zu prügeln. Klingt langweilig? Ist es auch — aber clever.

arXiv AI/ML/NLP · 2026-04-03 10:22:04.249069+00:00 · Score 2/10

EXPERIMENTAL

KI rechnet 3D-Moleküle jetzt in Linearzeit

Quadratische Rechenkosten waren bisher der Flaschenhals für Attention-Mechanismen bei 3D-Daten. Ein neues Paper in Nature Machine Intelligence macht damit Schluss.

Nature Mach Intel · 2026-03-26 05:21:45.645227+00:00 · Score 3/10

HOT

Transformer bekommt Konkurrenz: 5 neue Architekturen

Die Ära des Standard-LLM wackelt. Sebastian Raschka, einer der respektiertesten ML-Forscher überhaupt, hat die wichtigsten Alternativen zum klassischen Transformer-Decoder ...

Ahead of AI (Raschka) · 2026-03-22 01:22:17.989624+00:00 · Score 5/10

HOT

Google wirft DiffusionGemma raus — 4× schneller

Google DeepMind hat ein neues Open-Model gedroppt: DiffusionGemma, ein 26B-MoE-Modell, das Text per Diffusion generiert — nicht autoregressiv. Apache 2.0. Frei für alle.

MarkTechPost · 2026-06-10 19:22:09.271559+00:00 · Score 7/10

AGENTS

NVIDIA wirft 550B-Monster auf Agents

NVIDIA hat Nemotron 3 Ultra veröffentlicht — ein Open-Weight-Modell, das speziell für Agents gebaut ist, die stundenlang durchlaufen. Der Trick: Mixture-of-Experts plus ...

MarkTechPost · 2026-06-04 22:19:16.514473+00:00 · Score 8/10

EXPERIMENTAL

Forscher messen KI-Ähnlichkeit ohne einen einzigen Input

Ein neues Verfahren vergleicht neuronale Netze allein anhand ihrer Gewichte. Kein Datensatz nötig, keine Inferenz, keine Benchmarks.

LessWrong · 2026-05-30 01:21:06.211880+00:00 · Score 2/10

EXPERIMENTAL

Forscher zähmen KI mit Mathe-Logik

Ein neues Paper verspricht, was KI bisher nicht kann: garantiert korrekte Übersetzungen von Sprache in formale Logik. Der Trick heißt NeuroNL2LTL.

arXiv AI/ML/NLP · 2026-05-25 10:21:40.520211+00:00 · Score 2/10

EXPERIMENTAL

NVIDIA AI Releases Gated DeltaNet-2: A Linear Attention Layer That Decouples Erase and Write in the Delta Rule

Kleine Korrektur — ich habe gerade "spannende" im Urteil verwendet, das steht auf der Verboten-Liste. Hier die korrigierte Version:

MarkTechPost · 2026-05-24 10:19:26.458875+00:00 · Score 5/10

EXPERIMENTAL

NVIDIA dropt Sana — Bilder in Sekunden

NVIDIA Labs hat Sana auf GitHub geworfen — eine ganze Familie von Bildgeneratoren, die schneller laufen sollen als alles, was Diffusion bisher gezeigt hat.

GitHub Trending Python · 2026-05-18 04:18:48.479450+00:00 · Score 6/10

EXPERIMENTAL

Forscher schrumpfen LLM-Speicherfresser per Lernverfahren

Ein neues Paper auf arXiv präsentiert "LKV" — eine Methode, die den größten Engpass langer Kontexte angeht: den KV-Cache.

arXiv AI/ML/NLP · 2026-05-11 04:19:23.906006+00:00 · Score 2/10

SUCHE

Lineare Netze rechnen plötzlich nichtlinear

Sakana AI and NVIDIA Introduce TwELL with CUDA Kernels for 20.5% Inference and 21.9% Training Speedup in LLMs

KI-Agenten holen sich jetzt selbst Tickets

Roboter denken jetzt in Objekten statt Sätzen

KI soll KI erklären — mit Meta-Modellen

Forscher trainieren KIs zum Lügen

Forscher tricksen Transformer-Speicher mit 2-Level-Cache aus

KI knackt Physik-Problem mit neuem Trick

Wer mehr zahlt, hackt besser

LiME macht Experten-Modelle 90% schlanker

GPU-Trick macht Hawkes-Prozesse 100× schneller

KI rechnet 3D-Moleküle jetzt in Linearzeit

Transformer bekommt Konkurrenz: 5 neue Architekturen

Google wirft DiffusionGemma raus — 4× schneller

NVIDIA wirft 550B-Monster auf Agents

Forscher messen KI-Ähnlichkeit ohne einen einzigen Input

Forscher zähmen KI mit Mathe-Logik

NVIDIA AI Releases Gated DeltaNet-2: A Linear Attention Layer That Decouples Erase and Write in the Delta Rule

NVIDIA dropt Sana — Bilder in Sekunden

Forscher schrumpfen LLM-Speicherfresser per Lernverfahren