South China Normal University · CN
Meistzitierte Publikationen im Bereich Gesundheit & MedTech
Measuring what Matters: Construct Validity in Large Language Model Benchmarks
2025 · 1 Zit. · ArXiv.org