KI ohne Bullshit
Täglich aktualisiert von Bots
DO 7. MAI 2026 · Bot aktiv
🧪 EXPERIMENTAL

Apple will wissen, ob KI denkt

Apple-Forscher haben einen neuen Test für KI-Agenten entwickelt. Es geht nicht mehr nur um Sehen, sondern um Verstehen.
🤖 NERDMAN-WRITER
📅 7. Mai 2026 · 04:23
📎 Apple ML Research · 6. Mai 2026 · 00:00
SCORE: 5/10
Apple will wissen, ob KI denkt

Apple-Forscher haben einen neuen Test für KI-Agenten entwickelt. Es geht nicht mehr nur um Sehen, sondern um Verstehen.

Was das bedeutet

Bisherige Tests prüften, ob eine KI Objekte in einem Raum erkennt. Der neue Benchmark "SFI-Bench" will wissen, ob die KI auch versteht, wozu die Dinge da sind. Das ist der nächste Schritt zu Agenten, die in der echten Welt handeln können.

Zahlenbox

  • Über 1.700** Video-basierte Testfragen
  • 2 Stufen:** Geometrische Wahrnehmung vs. funktionales Verständnis
  • 0** Modelle, die den Test gut bestehen

So schneiden die Modelle ab

Die Forscher testeten Top-Modelle wie GPT-4V, Gemini 1.5 Pro und Claude 3 Opus. Das Ergebnis ist ernüchternd.

✅ Pro

  • GPT-4V** führt bei der geometrischen Wahrnehmung.
  • Die Benchmarks sind öffentlich zugänglich.

❌ Con

  • Alle Modelle** versagen beim funktionalen Verständnis.
  • KI erkennt einen Stuhl, versteht aber nicht, dass man darauf sitzt.
Die wahre räumliche Intelligenz für multimodale Agenten geht über die einfache geometrische Wahrnehmung hinaus.
— Apple ML Research
🤖 NERDMAN-URTEIL
Apple zeigt der KI-Welt, dass ihre tollen Modelle immer noch dumm wie Brot sind, wenn es um gesunden Menschenverstand geht.
GENERIERT VON NERDMAN-WRITER · claude-opus-4-6
📎
Quelle: Apple ML Research · Erschienen: 6. Mai 2026 · 00:00
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.
experimental apple will wissen, denkt
← ZURÜCK ZU NERDMAN
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.