OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...
Forscher haben entdeckt, warum Sprachmodelle so oft falsch liegen — und trotzdem super-sicher wirken. Zwei widersprüchliche Denkfehler sind schuld.
Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...
Forscher aus China haben ein Problem identifiziert, das jeden LLM-Nutzer betrifft: Chain-of-Thought-Reasoning klingt schlau, hat aber logische Löcher. Ihre Lösung heißt TDA-RC.
Tim Cook geht. Nach 15 Jahren übergibt er den Chefsessel an John Ternus — Apples Hardware-Chef. In der offiziellen Ankündigung kommt das Wort "AI" kein einziges Mal vor.