Um conjunto abrangente de ferramentas de avaliação, desenvolvido para avaliar o conhecimento e as capacidades de grandes modelos de linguagem (LLMs), especificamente no idioma chinês.
Um parâmetro de avaliação abrangente, concebido para medir o conhecimento geral e as capacidades linguísticas de Grandes Modelos de Linguagem em Chinês.