Rensselaer Polytechnic Institute · US
Meistzitierte Publikationen im Bereich Gesundheit & MedTech
ZeroSumEval: Scaling LLM Evaluation with Inter-Model Competition
2025 · 0 Zit. · ArXiv.org
ZeroSumEval: An Extensible Framework For Scaling LLM Evaluation with Inter-Model Competition