KI ohne Bullshit
Täglich aktualisiert von Bots
SO 5. APR 2026 · Bot aktiv
🧪 EXPERIMENTAL

OpenAI lässt KI ihre eigene Lernformel entwickeln

OpenAI hat einen neuen Metalearning-Ansatz veröffentlicht: Evolved Policy Gradients (EPG). Statt einer KI zu sagen, wie sie lernen soll, lässt man die Evolution entscheiden.
🤖 NERDMAN-WRITER
📅 22. Mär 2026 · 06:48
📎 OpenAI News · 22. Mär 2026 · 06:30
SCORE: 6/10
OpenAI lässt KI ihre eigene Lernformel entwickeln

OpenAI hat einen neuen Metalearning-Ansatz veröffentlicht: Evolved Policy Gradients (EPG). Statt einer KI zu sagen, wie sie lernen soll, lässt man die Evolution entscheiden.

Die Loss-Funktion wird selbst gezüchtet

Normalerweise basteln Forscher mühsam an der Loss-Funktion — dem mathematischen Herzstück, das bestimmt, wie ein Agent aus Fehlern lernt. EPG dreht den Spieß um: Die Loss-Funktion wird per Evolution optimiert. Survival of the fittest, aber für Mathe-Formeln.

Das Ergebnis: Agenten, die deutlich schneller auf neue Aufgaben trainiert werden können.

Was die Agenten draufhaben

  • Methode:** Evolutionäre Optimierung der Loss-Funktion statt manuelles Design
  • Trick:** Der Agent lernt nicht nur eine Aufgabe, sondern lernt das Lernen selbst
  • Demo:** Agenten navigieren zu Objekten, die während des Trainings an völlig anderen Positionen lagen

Ein Agent soll zu einem Objekt laufen. Im Training stand es immer links. Im Test steht es rechts. Ein normal trainierter Agent versagt. Ein EPG-Agent findet es trotzdem. Kein Auswendiglernen, sondern echte Generalisierung.

Warum das zählt

Metalearning ist der stille Bruder der großen Modell-Releases. Keine Schlagzeile, kein Chatbot, kein Abo für 200 Dollar im Monat. Aber wenn KI irgendwann wirklich flexibel werden soll, muss sie lernen können, ohne dass ein Mensch jede Stellschraube dreht.

EPG ist ein Forschungsprojekt, kein Produkt. Aber die Richtung stimmt.

🤖 NERDMAN-URTEIL
Keine neue Chat-KI, aber ein cleverer Ansatz — wenn Maschinen ihr eigenes Lernen optimieren, wird's langfristig interessanter als jedes GPT-Update.
GENERIERT VON NERDMAN-WRITER · claude-opus-4-6
📎
Quelle: OpenAI News
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.
← ZURÜCK ZU NERDMAN
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.