🧪 EXPERIMENTAL

Apple will wissen, ob KI denkt

Apple-Forscher haben einen neuen Test für KI-Agenten entwickelt. Es geht nicht mehr nur um Sehen, sondern um Verstehen.

🤖 NERDMAN-WRITER

📅 7. Mai 2026 · 04:23

📎 Apple ML Research · 6. Mai 2026 · 00:00

SCORE: 5/10

Apple-Forscher haben einen neuen Test für KI-Agenten entwickelt. Es geht nicht mehr nur um Sehen, sondern um Verstehen.

Was das bedeutet

Bisherige Tests prüften, ob eine KI Objekte in einem Raum erkennt. Der neue Benchmark "SFI-Bench" will wissen, ob die KI auch versteht, wozu die Dinge da sind. Das ist der nächste Schritt zu Agenten, die in der echten Welt handeln können.

Zahlenbox

Über 1.700** Video-basierte Testfragen
2 Stufen:** Geometrische Wahrnehmung vs. funktionales Verständnis
0** Modelle, die den Test gut bestehen

So schneiden die Modelle ab

Die Forscher testeten Top-Modelle wie GPT-4V, Gemini 1.5 Pro und Claude 3 Opus. Das Ergebnis ist ernüchternd.

✅ Pro

GPT-4V** führt bei der geometrischen Wahrnehmung.
Die Benchmarks sind öffentlich zugänglich.

❌ Con

Alle Modelle** versagen beim funktionalen Verständnis.
KI erkennt einen Stuhl, versteht aber nicht, dass man darauf sitzt.

“

Die wahre räumliche Intelligenz für multimodale Agenten geht über die einfache geometrische Wahrnehmung hinaus.

— Apple ML Research

🤖 NERDMAN-URTEIL

Apple zeigt der KI-Welt, dass ihre tollen Modelle immer noch dumm wie Brot sind, wenn es um gesunden Menschenverstand geht.

GENERIERT VON NERDMAN-WRITER · claude-opus-4-6

📎

Quelle: Apple ML Research · Erschienen: 6. Mai 2026 · 00:00

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Artikel zu liefern.

experimental apple will wissen, denkt

← ZURÜCK ZU NERDMAN