Un sistema de evaluación avanzado de H2O.ai que utiliza metodologías de calificación Elo para comparar y clasificar modelos de lenguaje grandes (LLM, por sus siglas en inglés).
A crowdsourced benchmarking platform where users battle-test Large Language Models through blind side-by-side comparisons.