중국어에 특화된 대규모 언어 모델(LLM)의 지식 및 역량을 평가하기 위해 설계된 종합 평가 도구 모음입니다.
중국어 대규모 언어 모델의 일반 지식 및 언어 능력을 측정하기 위해 설계된 종합 평가 기준입니다.