Dies ist eine Übersichtsseite mit Metadaten zu dieser wissenschaftlichen Arbeit. Der vollständige Artikel ist beim Verlag verfügbar.
Analyzing AI Evaluation Benchmarks Through Information Retrieval and Network Science
0
Zitationen
5
Autoren
2025
Jahr
Abstract
Results and supplementary materials for the ECIR 2026 paper Analyzing AI Evaluation Benchmarks Through Information Retrieval and Network Science. The project supports a HITS-based bipartite graph analysis of LLM QA benchmarks, with a focus on benchmark bias, ranking stability, and leaderboard robustness.
Ähnliche Arbeiten
Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Localization
2017 · 20.567 Zit.
Generative Adversarial Nets
2023 · 19.892 Zit.
Visualizing and Understanding Convolutional Networks
2014 · 15.299 Zit.
"Why Should I Trust You?"
2016 · 14.391 Zit.
On a Method to Measure Supervised Multiclass Model’s Interpretability: Application to Degradation Diagnosis (Short Paper)
2024 · 13.164 Zit.