EXPERIMENTAL
LLMs scheitern an simplen Statistik-Fragen
Forscher haben einen wunden Punkt von ChatGPT und Co. gefunden. Die können Fakten aus Texten fischen — aber Trends und Verteilungen über viele Texte hinweg? Fehlanzeige.
arXiv AI/ML/NLP
· 2026-04-09 10:17:45.666206+00:00
· Score 2/10