Un référentiel d'évaluation professionnelle du laboratoire de traitement automatique du langage naturel de l'université Fudan, conçu pour mesurer les performances et la fiabilité des grands modèles de langage.
Une suite d'évaluation complète conçue pour évaluer les connaissances et les capacités des grands modèles de langage (LLM) spécifiquement dans la langue chinoise.
Un cadre d'évaluation professionnel fournissant des points de repère standardisés pour mesurer l'intelligence et l'utilité des modèles d'IA en langue chinoise.