🤖 AGENTS
AWS knackt Browser-Automation auf OS-Ebene
Amazon erweitert seinen AgentCore Browser um OS-Level Actions. Damit können KI-Agenten endlich auch native Dialoge bedienen — nicht nur den DOM.
Amazon erweitert seinen AgentCore Browser um OS-Level Actions. Damit können KI-Agenten endlich auch native Dialoge bedienen — nicht nur den DOM.
Was bisher der Killer war
Web-Agents arbeiten über Playwright oder das Chrome DevTools Protocol. Klingt mächtig, hat aber eine harte Grenze: Alles was das Betriebssystem rendert, bleibt unsichtbar.
Native Sicherheits-Pop-ups. Zertifikats-Chooser. Datei-Upload-Dialoge. Kontextmenüs. Genau dort scheitern die meisten Browser-Agents bisher kläglich.
Was AgentCore jetzt kann
- OS-Level Input:** Maus- und Tastatur-Events direkt auf System-Ebene
- Native Dialoge:** Auth-Prompts, Datei-Picker, Zertifikate werden bedienbar
- Sandbox bleibt:** Läuft weiter in der isolierten Browser-Umgebung von AWS
- CDP-Kompatibel:** Bestehende Playwright-Skripte funktionieren weiter
✅ Pro
- Schließt eine echte Lücke in Browser-Automation
- Funktioniert mit existierenden Agent-Frameworks
- AWS-Sandbox isoliert die Aktionen sauber
❌ Con
- Lock-in in Bedrock-Ökosystem
- Preis pro Session bei AWS bekanntlich nicht zimperlich
- Open-Source-Alternativen (Browserbase, Steel) ziehen nach
💡 Was das bedeutet
Wer ernsthafte Web-Agents bauen will, kommt um OS-Level-Steuerung nicht herum. Banking-Logins, Behörden-Portale, Enterprise-Tools — überall stehen native Dialoge im Weg. AWS liefert hier ein fehlendes Puzzleteil für Production-Agents.
🤖 NERDMAN-URTEIL
Endlich ein Browser-Agent, der nicht panisch wird, wenn Windows einen Dateidialog öffnet — überfällig, aber gut.
Quelle: AWS AI Blog
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.