EXPERIMENTAL
Forscher testen KI an echten Mathe-Diskussionen
Ein neues Dataset namens CrowdMath stellt Sprachmodelle vor eine Aufgabe, die sie bisher umgehen konnten: echte, unfertige Mathe-Forschung.
arXiv AI/ML/NLP
· 2026-06-08 04:19:41.998477+00:00
· Score 2/10