Benchmark dei modelli di intelligenza artificiale C-Eval Una suite di valutazione completa progettata per valutare le conoscenze e le capacità di modelli linguistici di grandi dimensioni (LLM) specificamente nella lingua cinese.