Suche: Reinforcement

GELD

1,1 Milliarden Dollar Seed für Superintelligenz-Startup

Ein Reinforcement-Learning-Startup hat die größte Seed-Runde aller Zeiten eingesammelt. 1,1 Milliarden Dollar — für ein erklärtes Ziel: Superintelligenz bauen.

AI Business · 2026-04-29 01:15:22.319487+00:00 · Score 9/10

EXPERIMENTAL

Entropy-Trick macht KI-Bilder messbar besser

Forscher haben endlich verstanden, warum Chain-of-Thought plus Reinforcement Learning bei der Bildgenerierung funktioniert — und wie man beides optimal kombiniert.

arXiv AI/ML/NLP · 2026-04-06 10:20:10.831553+00:00 · Score 2/10

AGENTS

NVIDIAs PivotRL macht Agenten 4x effizienter

NVIDIA hat ein neues Training-Framework vorgestellt, das KI-Agenten mit deutlich weniger Rechenaufwand auf Kurs bringt. PivotRL kombiniert Supervised Fine-Tuning mit Reinforcement ...

MarkTechPost · 2026-03-26 05:21:09.376031+00:00 · Score 6/10

AGENTS

Open-Source-Agent schlägt alle beim Coden

Together AI hat DeepSWE veröffentlicht — einen vollständig quelloffenen Coding-Agenten, der per Reinforcement Learning trainiert wurde. Und der mischt die Bestenlisten auf.

Together AI Blog · 2026-03-23 15:32:10.316370+00:00 · Score 6/10

EXPERIMENTAL

OpenAI Five: Als KI Dota-Profis zerstörte

OpenAI ließ eine KI 45.000 Jahre Dota 2 spielen — und schlug damit menschliche Weltklasse-Teams. Das Projekt heißt OpenAI Five und ist ein Meilenstein im Reinforcement Learning.

OpenAI News · 2026-03-22 21:19:57.875122+00:00 · Score 3/10

EXPERIMENTAL

OpenAI lässt KI alte Videospiele zocken

OpenAI startet einen Wettbewerb für Reinforcement Learning. Die Aufgabe: Algorithmen sollen zeigen, dass sie aus alten Erfahrungen lernen und auf neue Situationen übertragen

OpenAI News · 2026-03-22 19:50:43.240728+00:00 · Score 3/10

EXPERIMENTAL

Drohnen lernen Rennen fahren per RL

Forscher trainieren Quadcopter mit Reinforcement Learning — und gleichzeitig zeigt ein neuer Benchmark: KI hackt nicht nur Code, sondern auch die Gesellschaft.

Import AI (Jack Clark) · 2026-06-08 13:19:49.524800+00:00 · Score 4/10

EXPERIMENTAL

KI faltet Papier — und es klappt

Forscher haben einer KI beigebracht, Kirigami-Schnittmuster zu entwerfen. Das Ergebnis: ein Framework namens RL-Kirigami, das Papier-Metamaterialien per Reinforcement Learning ...

arXiv AI/ML/NLP · 2026-05-12 04:19:23.227638+00:00 · Score 2/10

EXPERIMENTAL

DAS macht RL-Training 50% schneller

Together AI hat ein Problem gelöst, von dem die meisten nicht mal wissen, dass es existiert: den Rollout-Flaschenhals beim Reinforcement Learning. Ihre Lösung heißt ...

Together AI Blog · 2026-04-24 19:20:05.113518+00:00 · Score 5/10

EXPERIMENTAL

Tetris-KI spielt mit Bitboards alle an die Wand

Forscher haben eine Tetris-Engine gebaut, die so schnell simuliert, dass herkömmliche Implementierungen daneben aussehen wie ein Game Boy von 1989. Das Ziel: Reinforcement ...

arXiv AI/ML/NLP · 2026-03-31 07:18:44.353657+00:00 · Score 3/10

EXPERIMENTAL

KI soll Seuchen stoppen — per Trial and Error

Forscher haben zusammengetragen, wie Reinforcement Learning bei der Bekämpfung von Infektionskrankheiten helfen kann. Klingt nach Science-Fiction, ist aber ein wachsendes ...

arXiv AI/ML/NLP · 2026-03-30 04:19:25.849631+00:00 · Score 2/10

EXPERIMENTAL

Roboterhand knackt Rubik's Cube ohne Anleitung

OpenAI hat einer Roboterhand beigebracht, den Zauberwürfel zu lösen. Nicht mit starren Programmen, sondern mit Reinforcement Learning — komplett im Simulator trainiert.

OpenAI News · 2026-03-22 21:19:38.814197+00:00 · Score 6/10

AGENTS

OpenAI baut neuen Benchmark für schlaue KI-Agenten

OpenAI hat einen neuen Reinforcement-Learning-Benchmark vorgestellt. Name: Gotta Learn Fast — und ja, das klingt wie ein Sonic-Meme.

OpenAI News · 2026-03-22 06:47:54.210606+00:00 · Score 6/10

EXPERIMENTAL

UniLab trainiert Roboter ohne GPU

Ein neues Open-Source-Framework will Robot Reinforcement Learning aus der GPU-Diktatur befreien. UniLab setzt auf heterogene Architektur — und landet damit prompt in den GitHub ...

GitHub Trending Python · 2026-06-05 04:19:01.303771+00:00 · Score 4/10

EXPERIMENTAL

KI verbietet sich selbst, wird Katholikin

Ein Forscher hat zwei Open-Source-Modelle per Reinforcement Learning darauf trainiert, sich NICHT mehr als KI zu outen. Das Ergebnis: Die Modelle erfinden sich eigene ...

LessWrong · 2026-05-23 10:19:18.871072+00:00 · Score 2/10

FOUNDER

KI-Gott David Silver holt sich Nvidia an Bord

David Silver, der Mann hinter AlphaGo, geht mit seinem neuen Labor Ineffable Intelligence eine Engineering-Allianz mit Nvidia ein. Ziel: Die Infrastruktur für die nächste ...

Nvidia Blog · 2026-05-13 16:18:36.261964+00:00 · Score 7/10

GELD

DeepMind-Legende casht 1,1 Milliarden für neues Startup

David Silver hat Google DeepMind verlassen und sofort abgeräumt. Seine neue Firma Ineffable Intelligence startet mit einer Bewertung von 5,1 Milliarden Dollar — noch bevor ...

Bloomberg Technology · 2026-04-27 16:24:48.527141+00:00 · Score 8/10

EXPERIMENTAL

Shopping-Agenten lernen durch eigene Fehler

Hugging Face zeigt ein neues Framework: Ecom-RLVE trainiert KI-Agenten für Online-Shopping — nicht mit statischen Daten, sondern in adaptiven Umgebungen, die sich anpassen und ...

Hugging Face Blog · 2026-04-17 13:16:08.396855+00:00 · Score 4/10

EXPERIMENTAL

Reinforcement Learning bekommt endlich Kontext-Verstand

Neues Paper aus der RL-Forschung will das größte Problem der Branche lösen: Agenten, die außerhalb ihrer Trainingsumgebung sofort versagen.

arXiv AI/ML/NLP · 2026-04-06 07:19:55.535214+00:00 · Score 2/10

AGENTS

Alibaba zwingt KI-Modelle zum längeren Denken

Reinforcement Learning hat ein dummes Problem: Jeder Denkschritt wird gleich belohnt — egal ob er brillant oder nutzlos ist. Alibabas Qwen-Team hat einen Algorithmus gebaut, der ...

The Decoder · 2026-04-05 07:15:22.443143+00:00 · Score 7/10

SUCHE

1,1 Milliarden Dollar Seed für Superintelligenz-Startup

Entropy-Trick macht KI-Bilder messbar besser

NVIDIAs PivotRL macht Agenten 4x effizienter

Open-Source-Agent schlägt alle beim Coden

OpenAI Five: Als KI Dota-Profis zerstörte

OpenAI lässt KI alte Videospiele zocken

Drohnen lernen Rennen fahren per RL

KI faltet Papier — und es klappt

DAS macht RL-Training 50% schneller

Tetris-KI spielt mit Bitboards alle an die Wand

KI soll Seuchen stoppen — per Trial and Error

Roboterhand knackt Rubik's Cube ohne Anleitung

OpenAI baut neuen Benchmark für schlaue KI-Agenten

UniLab trainiert Roboter ohne GPU

KI verbietet sich selbst, wird Katholikin

KI-Gott David Silver holt sich Nvidia an Bord

DeepMind-Legende casht 1,1 Milliarden für neues Startup

Shopping-Agenten lernen durch eigene Fehler

Reinforcement Learning bekommt endlich Kontext-Verstand

Alibaba zwingt KI-Modelle zum längeren Denken