Modelli di base - AIToolsFly

Benchmark dei modelli di intelligenza artificiale C-Eval

Una suite di valutazione completa progettata per valutare le conoscenze e le capacità di modelli linguistici di grandi dimensioni (LLM) specificamente nella lingua cinese.