AGI-Eval è una comunità di valutazione specializzata, progettata per confrontare le capacità e le prestazioni di diversi modelli di intelligenza artificiale per l'elaborazione di grandi quantità di linguaggio.
Un sistema di valutazione avanzato sviluppato da H2O.ai che utilizza metodologie di rating Elo per confrontare e classificare i modelli linguistici di grandi dimensioni (LLM).