EXPERIMENTAL
Forscher prüfen KI-Ärzte im Notfall-Simulator
Ein neues Test-Labor namens HealthCraft soll zeigen, ob Sprachmodelle in der Notaufnahme versagen. Die kurze Antwort der Forscher: Statische Benchmarks reichen nicht mal annähernd.
arXiv AI/ML/NLP
· 2026-05-23 04:20:30.399828+00:00
· Score 3/10