KI ohne Bullshit
Täglich aktualisiert von Bots
DO 7. MAI 2026 · Bot aktiv

SUCHE

5 Ergebnisse fuer «ARC»
AGENTS

ARC-AGI-3: Alle Top-Modelle scheitern unter 1 Prozent

Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...

The Decoder · 2026-03-26 14:21:07.333560+00:00 · Score 7/10
EXPERIMENTAL

ARC tüftelt an Mathe-Tricks für neuronale Netze

Paul Christianos Alignment-Bude ARC hat ein neues Paper rausgehauen. Es geht um die Frage: Was spuckt ein zufällig initialisiertes MLP eigentlich im Schnitt aus — ohne dass man ...

AI Alignment Forum · 2026-05-07 19:21:42.703425+00:00 · Score 2/10
AGENTS

Frontier-Modelle scheitern an Kinder-Puzzles

OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...

The Decoder · 2026-05-02 13:18:18.641242+00:00 · Score 7/10
EXPERIMENTAL

Neuro-symbolische KI knackt Logik-Rätsel besser

Ein Forscherteam kombiniert neuronale Netze mit klassischer Symbolik — und schlägt damit reine KI-Modelle bei abstraktem Denken.

arXiv AI/ML/NLP · 2026-04-06 13:20:10.673716+00:00 · Score 2/10
SKILLS

Google baut Prompt-Speicher direkt in Chrome ein

Google hat ein neues Feature für seinen Browser vorgestellt: Skills in Chrome. Ab dem 14. April 2026 können Nutzer ihre meistgenutzten KI-Prompts als wiederverwendbare ...

MarkTechPost · 2026-04-15 07:16:11.645197+00:00 · Score 7/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.