AI 모델 벤치마크 H2O EvalGPT H2O.ai에서 개발한 고급 평가 시스템으로, Elo 레이팅 방법론을 활용하여 대규모 언어 모델(LLM)의 성능을 벤치마킹하고 순위를 매깁니다.