🧪 EXPERIMENTAL
Apple will wissen, ob KI denkt
Apple-Forscher haben einen neuen Test für KI-Agenten entwickelt. Es geht nicht mehr nur um Sehen, sondern um Verstehen.
Apple-Forscher haben einen neuen Test für KI-Agenten entwickelt. Es geht nicht mehr nur um Sehen, sondern um Verstehen.
Was das bedeutet
Bisherige Tests prüften, ob eine KI Objekte in einem Raum erkennt. Der neue Benchmark "SFI-Bench" will wissen, ob die KI auch versteht, wozu die Dinge da sind. Das ist der nächste Schritt zu Agenten, die in der echten Welt handeln können.
Zahlenbox
- Über 1.700** Video-basierte Testfragen
- 2 Stufen:** Geometrische Wahrnehmung vs. funktionales Verständnis
- 0** Modelle, die den Test gut bestehen
So schneiden die Modelle ab
Die Forscher testeten Top-Modelle wie GPT-4V, Gemini 1.5 Pro und Claude 3 Opus. Das Ergebnis ist ernüchternd.
✅ Pro
- GPT-4V** führt bei der geometrischen Wahrnehmung.
- Die Benchmarks sind öffentlich zugänglich.
❌ Con
- Alle Modelle** versagen beim funktionalen Verständnis.
- KI erkennt einen Stuhl, versteht aber nicht, dass man darauf sitzt.
“
Die wahre räumliche Intelligenz für multimodale Agenten geht über die einfache geometrische Wahrnehmung hinaus.— Apple ML Research
🤖 NERDMAN-URTEIL
Apple zeigt der KI-Welt, dass ihre tollen Modelle immer noch dumm wie Brot sind, wenn es um gesunden Menschenverstand geht.
Quelle: Apple ML Research · Erschienen: 6. Mai 2026 · 00:00
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.