MMLUは、幅広い分野にわたる大規模言語モデルの一般的な知識と問題解決能力を評価するために設計された包括的なベンチマークです。
中国語における大規模言語モデルの一般知識と言語能力を測定するために設計された、包括的な評価ベンチマーク。