AIToolsFly
  • Aplicações de IA
    • Agentes de IA
    • Chatbots de IA
    • Ferramentas de Documentação de IA
    • Ferramentas de escritório com IA
    • Ferramentas de apresentação de IA
    • Ferramentas de produtividade com IA
    • Mecanismos de busca com IA
    • Ferramentas de vídeo com IA
    • Ferramentas de escrita com IA
  • Criação de conteúdo com IA
    • Ferramentas de áudio com IA
    • Ferramentas de design de IA
    • Removedores de fundo de imagem com IA
    • Geradores de imagens com IA
    • Ferramentas de imagem com IA
  • Desenvolvimento de IA
    • Estruturas de IA
    • Modelos de IA
    • Ferramentas de Programação de IA
    • Ferramentas de IA
  • Análise e Otimização de IA
    • Ferramentas de IA para detecção e otimização de conteúdo
    • Benchmarks de modelos de IA
  • Recursos de aprendizagem em IA
    • Sites para aprender IA
  • Aplicações de IA
    • Agentes de IA
    • Chatbots de IA
    • Ferramentas de Documentação de IA
    • Ferramentas de escritório com IA
    • Ferramentas de apresentação de IA
    • Ferramentas de produtividade com IA
    • Mecanismos de busca com IA
    • Ferramentas de vídeo com IA
    • Ferramentas de escrita com IA
  • Criação de conteúdo com IA
    • Ferramentas de áudio com IA
    • Ferramentas de design de IA
    • Removedores de fundo de imagem com IA
    • Geradores de imagens com IA
    • Ferramentas de imagem com IA
  • Desenvolvimento de IA
    • Estruturas de IA
    • Modelos de IA
    • Ferramentas de Programação de IA
    • Ferramentas de IA
  • Análise e Otimização de IA
    • Ferramentas de IA para detecção e otimização de conteúdo
    • Benchmarks de modelos de IA
  • Recursos de aprendizagem em IA
    • Sites para aprender IA
  1. Lar
  2. Análise e Otimização de IA
  3. Article list
Ferramentas de IA para detecção e otimização de conteúdo
Benchmarks de modelos de IA
MMBench

Benchmarks de modelos de IA MMBench

MMBench is a comprehensive evaluation framework designed to measure the capabilities of multimodal large language models across a wide array of visual and textual tasks.

66 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
HELM

Benchmarks de modelos de IA HELM

A standardized, holistic evaluation framework from Stanford University designed to measure the performance and safety of large language models.

103 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
OpenCompass

Benchmarks de modelos de IA OpenCompass

OpenCompass is an open-source evaluation framework developed by the Shanghai AI Lab to provide standardized, comprehensive benchmarking for large language models.

78 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
FlagEval

Benchmarks de modelos de IA FlagEval

An open-source evaluation framework developed by the Beijing Academy of Artificial Intelligence (BAAI) to standardize and scale LLM benchmarking.

89 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
LMArena

Benchmarks de modelos de IA LMArena

A crowdsourced benchmarking platform where users battle-test Large Language Models through blind side-by-side comparisons.

90 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
MMLU

Benchmarks de modelos de IA MMLU

MMLU é um benchmark abrangente projetado para avaliar o conhecimento geral e as capacidades de resolução de problemas de grandes modelos de linguagem em uma vasta gama de disciplinas.

82 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
C-Eval

Benchmarks de modelos de IA C-Eval

A comprehensive evaluation suite designed to assess the knowledge and capabilities of large language models (LLMs) specifically in the Chinese language.

87 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
SuperCLUE

Benchmarks de modelos de IA SuperCLUE

A professional evaluation framework providing standardized benchmarks to measure the intelligence and utility of Chinese-language Modelos de IA.

71 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
Open LLM Leaderboard

Benchmarks de modelos de IA Open LLM Leaderboard

A comprehensive, community-driven benchmark platform by Hugging Face to track and compare the performance of open-source large language models.

63 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
CMMLU

Benchmarks de modelos de IA CMMLU

A comprehensive evaluation benchmark designed to measure the general knowledge and linguistic capabilities of Large Language Models in Chinese.

76 Vistas 0 Comentários
Benchmarks de modelos de IA 2023年10月29日
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
关于我们

AIToolsFly é um diretório selecionado de ferramentas de IA, plataformas de produtividade e recursos digitais. Ajudamos os usuários a descobrir e comparar rapidamente as melhores ferramentas em diferentes categorias.

版权说明

© 2026 AIToolsFly. Todos os direitos reservados. Todo o conteúdo é apenas para fins informativos. Marcas registradas e nomes de produtos pertencem aos seus respectivos proprietários.