Harness-1 entlastet Search-Agents radikal
Forscher bauen einen 20B-Subagenten, der nur eine Sache macht — und die richtig. Suchen.
Was Harness-1 ist
Ein Retrieval-Subagent auf Basis von gpt-oss-20b. Trainiert mit Reinforcement Learning. Eingebettet in eine sogenannte "stateful search harness".
Das Team kommt von UIUC, UC Berkeley und Chroma. Keine Top-Labs, aber ernsthafte Adressen.
Das Problem mit normalen Search-Agents
Übliche Such-Policies müssen alles gleichzeitig lernen: Wann suchen, was merken, welche Evidenz zählt, welche Claims geprüft sind.
RL optimiert dann beides parallel — die Suchentscheidung UND die langweilige Buchhaltung. Das frisst Kapazität.
Das verlangt zu viel vom Modell auf einmal.— Forscherteam UIUC/Berkeley/Chroma
Der Trick
- Harness:** verwaltet State, Memory und Evidenz extern
- Subagent:** muss nur noch entscheiden, was als Nächstes gesucht wird
- RL-Training:** läuft INNERHALB dieser Harness, nicht über den ganzen Transcript
- Modell-Basis:** gpt-oss-20b, das Open-Weight-Modell von OpenAI
💡 Was das bedeutet
Die Trennung von Reasoning und Bookkeeping ist die Pointe. Statt einem überforderten Allrounder bekommt man einen spezialisierten Sucher, der besser wird, weil er weniger zu tun hat. Für Builder von Research-Agents ist das ein Architektur-Pattern zum Klauen.
Wo der Haken liegt
✅ Pro
- Klare Architektur-Idee
- Auf Open-Weight aufgebaut
- Wissenschaftlich solide
❌ Con
- Kein direkter Download verfügbar
- Keine Top-Lab-Marketing-Maschine dahinter
- 20B ist nicht klein für einen Subagenten