Un sistema di valutazione avanzato sviluppato da H2O.ai che utilizza metodologie di rating Elo per confrontare e classificare i modelli linguistici di grandi dimensioni (LLM).
Una piattaforma di benchmarking collaborativa in cui gli utenti mettono alla prova modelli linguistici di grandi dimensioni attraverso confronti diretti e alla cieca.