AIToolsFly
  • 人工智能应用
    • 人工智能代理
    • 人工智能聊天机器人
    • 人工智能文档工具
    • 人工智能办公工具
    • 人工智能演示工具
    • 人工智能生产力工具
    • 人工智能搜索引擎
    • 人工智能视频工具
    • 人工智能写作工具
  • 人工智能内容创作
    • 人工智能音频工具
    • 人工智能设计工具
    • AI图像背景移除器
    • 人工智能图像生成器
    • 人工智能图像工具
  • 人工智能开发
    • 人工智能框架
    • 人工智能模型
    • 人工智能编程工具
    • 人工智能提示工具
  • 人工智能分析与优化
    • 人工智能内容检测和优化工具
    • 人工智能模型基准测试
  • 人工智能学习资源
    • 学习人工智能的网站
  • 人工智能应用
    • 人工智能代理
    • 人工智能聊天机器人
    • 人工智能文档工具
    • 人工智能办公工具
    • 人工智能演示工具
    • 人工智能生产力工具
    • 人工智能搜索引擎
    • 人工智能视频工具
    • 人工智能写作工具
  • 人工智能内容创作
    • 人工智能音频工具
    • 人工智能设计工具
    • AI图像背景移除器
    • 人工智能图像生成器
    • 人工智能图像工具
  • 人工智能开发
    • 人工智能框架
    • 人工智能模型
    • 人工智能编程工具
    • 人工智能提示工具
  • 人工智能分析与优化
    • 人工智能内容检测和优化工具
    • 人工智能模型基准测试
  • 人工智能学习资源
    • 学习人工智能的网站
  1. 家
  2. 标签
  3. 法学硕士评估
AGI-Eval

人工智能模型基准测试 AGI-Eval

AGI-Eval 是一个专门的评估社区,旨在对各种 AI 大型语言模型的能力和性能进行基准测试。

52 浏览量 0 评论
人工智能模型基准测试 2024年12月18日
H2O EvalGPT

人工智能模型基准测试 H2O EvalGPT

H2O.ai 开发的先进评估系统,利用 Elo 评分方法对大型语言模型 (LLM) 进行基准测试和排名。

75 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
LLMEval3

人工智能模型基准测试 LLMEval3

这是复旦大学自然语言处理实验室设计的专业评估基准,旨在衡量大型语言模型的性能和可靠性。

79 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
HELM

人工智能模型基准测试 舵

斯坦福大学开发的标准化、整体评估框架,旨在衡量大型语言模型的性能和安全性。

126 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
OpenCompass

人工智能模型基准测试 OpenCompass

OpenCompass 是由上海人工智能实验室开发的开源评估框架,旨在为大型语言模型提供标准化、全面的基准测试。

96 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
FlagEval

人工智能模型基准测试 旗帜评估

北京人工智能研究院(BAAI)开发的开源评估框架,用于标准化和扩展LLM基准测试。

109 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
MMLU

人工智能模型基准测试 MMLU

MMLU 是一个综合性的基准测试,旨在评估大型语言模型在众多学科领域的通用知识和问题解决能力。

93 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
C-Eval

人工智能模型基准测试 C-Eval

一套综合评估工具,旨在评估大型语言模型(LLM)在中文方面的知识和能力。

104 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
SuperCLUE

人工智能模型基准测试 超级线索

一个专业的评估框架,提供标准化的基准来衡量中文人工智能模型的智能和实用性。

91 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
CMMLU

人工智能模型基准测试 CMMLU

一个综合评估基准,旨在衡量大型语言模型在中文方面的通用知识和语言能力。

101 浏览量 0 评论
人工智能模型基准测试 2023年10月29日
  • 1
  • 2
  • »
关于我们

AIToolsFly 是一个精选的 AI 工具、效率平台和数字资源目录。我们帮助用户快速发现并比较不同类别中的最佳工具。

版权说明

© 2026 AIToolsFly。版权所有。所有内容仅供参考。商标和产品名称归其各自所有者所有。