Modelos de Fundamentos

Benchmarks de modelos de IA Avaliação C

Um conjunto abrangente de ferramentas de avaliação, desenvolvido para avaliar o conhecimento e as capacidades de grandes modelos de linguagem (LLMs), especificamente no idioma chinês.