AGI-Evalは、様々なAI大規模言語モデルの能力と性能をベンチマークするために設計された、専門的な評価コミュニティです。
H2O.aiによる高度な評価システムで、Eloレーティングの手法を用いて大規模言語モデル(LLM)のベンチマークとランキングを行います。