Xiaomi baut KI-Agenten mit drei neuen Modellen
Xiaomi meint es ernst mit Agenten. Das Smartphone-Imperium aus China hat gleich drei KI-Modelle auf einmal rausgehauen — alle unter dem Namen MiMo-V2.
Sehen, Handeln, Sprechen
Das MiMo-Team hat sich nicht mit einem Modell zufriedengegeben. Drei Stück, jedes mit eigener Spezialität:
- Vision:** Agenten, die Bildschirme lesen und Software bedienen können
- Action:** Selbstständig im Browser navigieren, klicken, kaufen
- Speech:** Sprachsteuerung für die ganze Kette
Das Ziel ist klar: KI-Agenten, die nicht nur labern, sondern tatsächlich Dinge tun. Software steuern, Online-Einkäufe abwickeln, irgendwann sogar Roboter kontrollieren.
Warum Das Wichtig Ist
Xiaomi ist kein KI-Startup mit PowerPoint-Träumen. Die haben Hunderte Millionen Geräte im Feld — Smartphones, Smart-Home, Elektroautos. Wenn die ihre Agenten in dieses Ökosystem einbauen, reden wir nicht über eine Demo, sondern über Produkte mit echten Nutzern.
Drei Modelle gleichzeitig zu launchen zeigt: Hier wird nicht experimentiert. Hier wird eine Pipeline aufgebaut. Multimodal, von Anfang an.
China Drückt Aufs Tempo
Während OpenAI und Google noch über AGI-Zeitpläne philosophieren, liefert China Hardware-nahe KI-Agenten. Xiaomi reiht sich ein neben Alibaba, ByteDance und Baidu — alle mit eigenem Agent-Stack.