🤖 AGENTS
Ai2 macht Browser-Agenten Open Source
Das Allen Institute for AI (Ai2) aus Seattle veröffentlicht MolmoWeb — einen Open-Source-Agenten, der eigenständig im Browser arbeitet. Direkte Kampfansage an die geschlossenen ...
Das Allen Institute for AI (Ai2) aus Seattle veröffentlicht MolmoWeb — einen Open-Source-Agenten, der eigenständig im Browser arbeitet. Direkte Kampfansage an die geschlossenen Systeme von OpenAI, Google und Anthropic.
Wie MolmoWeb funktioniert
Der Agent denkt wie ein Mensch. Statt den Quellcode einer Website zu lesen, interpretiert MolmoWeb Screenshots — so wie du auf deinen Bildschirm schaust. Basiert auf Ai2s multimodalem Modell Molmo 2. Klicken, scrollen, Formulare ausfüllen: alles per visueller Erkennung.
💡 Was das bedeutet
Geschlossene Agenten von OpenAI (Operator), Google (Mariner) und Anthropic (Computer Use) sind Black Boxes. Niemand weiß, was drin passiert. MolmoWeb legt den Code offen — Entwickler können nachvollziehen, debuggen, anpassen.
✅ Pro
- Vollständig Open Source — Code einsehbar und veränderbar
- Screenshot-basiert statt Code-Parsing — funktioniert auf jeder Website
- Gemeinnütziges Institut dahinter, kein Profit-Druck
❌ Con
- Molmo 2 spielt bei Modell-Power nicht in der Liga von GPT-4o oder Claude Opus
- Open Source heißt nicht automatisch besser — Community muss mitziehen
- Kein eigenes Cloud-Angebot, Deployment bleibt am Entwickler hängen
⚖️ Vergleich: MolmoWeb vs. geschlossene Agenten
- Transparenz:** MolmoWeb vollständig offen — Konkurrenz: Blackbox
- Modell-Basis:** Molmo 2 (Open Weight) vs. GPT-4o / Claude / Gemini
- Ansatz:** Screenshot-Interpretation bei allen, aber nur MolmoWeb zeigt wie
- Preis:** Kostenlos vs. API-Kosten bei OpenAI, Google, Anthropic
🤖 NERDMAN-URTEIL
Endlich kann jemand bei Web-Agenten unter die Motorhaube schauen — Ai2 liefert das Werkzeug, jetzt muss die Open-Source-Community liefern.
Quelle: GeekWire
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.