AGI-Eval es una comunidad de evaluación especializada diseñada para comparar las capacidades y el rendimiento de varios modelos de lenguaje de gran tamaño basados en IA.
Un sistema de evaluación avanzado de H2O.ai que utiliza metodologías de calificación Elo para comparar y clasificar modelos de lenguaje grandes (LLM, por sus siglas en inglés).