MMLU é um benchmark abrangente projetado para avaliar o conhecimento geral e as capacidades de resolução de problemas de grandes modelos de linguagem em uma vasta gama de disciplinas.
Um parâmetro de avaliação abrangente, concebido para medir o conhecimento geral e as capacidades linguísticas de Grandes Modelos de Linguagem em Chinês.