🧪 EXPERIMENTAL
Deepmind ersetzt Prompts durch Mausklicks
Vergessen Sie lange Texteingaben. Deepminds neues Experiment steuert KI mit dem Mauszeiger.
Vergessen Sie lange Texteingaben. Deepminds neues Experiment steuert KI mit dem Mauszeiger.
Was ist Pointer Engineering?
Statt Worte tippen Sie Koordinaten. Sie klicken auf ein Bild und sagen "mach das rot". Die KI versteht den Befehl am Punkt. Das System heißt "Point-and-Ask".
- Modell:** Multimodales Vision-Language-Modell
- Eingabe:** Bild + Mauszeiger-Position + Sprachbefehl
- Ausgabe:** Manipuliertes Bild oder Antwort
✅ Pro
- Intuitiver als präzise Prompts
- Kombiniert natürliche Sprache mit visuellem Kontext
- Potenzial für komplexe Bildbearbeitung
❌ Con
- Noch reine Forschungsdemo
- Keine öffentliche API verfügbar
- Genauigkeit bei feinen Details unklar
Was das bedeutet
Das könnte UI-Design revolutionieren. Anwendungen wie Photoshop oder CAD-Software könnten Befehle direkt auf Objekte erhalten. Die Barriere zwischen Mensch und Maschine schmilzt weiter.
🤖 NERDMAN-URTEIL
Ein cleverer Schritt weg von der Text-Tyrannei – endlich denkt eine KI mal mit den Augen.
Quelle: The Decoder
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.