MMLU는 광범위한 분야에 걸쳐 대규모 언어 모델의 일반 지식 및 문제 해결 능력을 평가하기 위해 설계된 종합적인 벤치마크입니다.
중국어 대규모 언어 모델의 일반 지식 및 언어 능력을 측정하기 위해 설계된 종합 평가 기준입니다.