중국어 NLP - AIToolsFly

AI 모델 벤치마크 C-Eval

중국어에 특화된 대규모 언어 모델(LLM)의 지식 및 역량을 평가하기 위해 설계된 종합 평가 도구 모음입니다.

AI 모델 벤치마크 CMMLU

중국어 대규모 언어 모델의 일반 지식 및 언어 능력을 측정하기 위해 설계된 종합 평가 기준입니다.