Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...
Paul Christianos Alignment-Bude ARC hat ein neues Paper rausgehauen. Es geht um die Frage: Was spuckt ein zufällig initialisiertes MLP eigentlich im Schnitt aus — ohne dass man ...
OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...
Ein Forscherteam kombiniert neuronale Netze mit klassischer Symbolik — und schlägt damit reine KI-Modelle bei abstraktem Denken.
Google hat ein neues Feature für seinen Browser vorgestellt: Skills in Chrome. Ab dem 14. April 2026 können Nutzer ihre meistgenutzten KI-Prompts als wiederverwendbare ...