モデル比較 - AIToolsFly

AIモデルのベンチマーク AGI評価

AGI-Evalは、様々なAI大規模言語モデルの能力と性能をベンチマークするために設計された、専門的な評価コミュニティです。

AIモデルのベンチマーク H2O EvalGPT

H2O.aiによる高度な評価システムで、Eloレーティングの手法を用いて大規模言語モデル（LLM）のベンチマークとランキングを行います。