Un sistema de evaluación profesional del Laboratorio de Procesamiento del Lenguaje Natural de la Universidad de Fudan, diseñado para medir el rendimiento y la fiabilidad de los modelos de lenguaje a gran escala.
Un conjunto integral de herramientas de evaluación diseñado para valorar el conocimiento y las capacidades de los grandes modelos lingüísticos (MLL, por sus siglas en inglés), específicamente en el idioma chino.
Un marco de evaluación profesional que proporciona parámetros estandarizados para medir la inteligencia y la utilidad de los modelos de IA en idioma chino.