AIToolsFly
  • Aplicações de IA
    • Agentes de IA
    • Chatbots de IA
    • Ferramentas de Documentação de IA
    • Ferramentas de escritório com IA
    • Ferramentas de apresentação de IA
    • Ferramentas de produtividade com IA
    • Mecanismos de busca com IA
    • Ferramentas de vídeo com IA
    • Ferramentas de escrita com IA
  • Criação de conteúdo com IA
    • Ferramentas de áudio com IA
    • Ferramentas de design de IA
    • Removedores de fundo de imagem com IA
    • Geradores de imagens com IA
    • Ferramentas de imagem com IA
  • Desenvolvimento de IA
    • Estruturas de IA
    • Modelos de IA
    • Ferramentas de Programação de IA
    • Ferramentas de IA
  • Análise e Otimização de IA
    • Ferramentas de IA para detecção e otimização de conteúdo
    • Benchmarks de modelos de IA
  • Recursos de aprendizagem em IA
    • Sites para aprender IA
  • Aplicações de IA
    • Agentes de IA
    • Chatbots de IA
    • Ferramentas de Documentação de IA
    • Ferramentas de escritório com IA
    • Ferramentas de apresentação de IA
    • Ferramentas de produtividade com IA
    • Mecanismos de busca com IA
    • Ferramentas de vídeo com IA
    • Ferramentas de escrita com IA
  • Criação de conteúdo com IA
    • Ferramentas de áudio com IA
    • Ferramentas de design de IA
    • Removedores de fundo de imagem com IA
    • Geradores de imagens com IA
    • Ferramentas de imagem com IA
  • Desenvolvimento de IA
    • Estruturas de IA
    • Modelos de IA
    • Ferramentas de Programação de IA
    • Ferramentas de IA
  • Análise e Otimização de IA
    • Ferramentas de IA para detecção e otimização de conteúdo
    • Benchmarks de modelos de IA
  • Recursos de aprendizagem em IA
    • Sites para aprender IA
  1. Lar
  2. Marcação
  3. Teste de modelo
LLMEval3

Benchmarks de modelos de IA LLMEval3

Um parâmetro de avaliação profissional do Laboratório de PNL da Universidade de Fudan, projetado para medir o desempenho e a confiabilidade de grandes modelos de linguagem.

69 Vistas 0 Comentários
Benchmarks de modelos de IA 2023, 29 de outubro de 2023
HELM

Benchmarks de modelos de IA LEME

Uma estrutura de avaliação padronizada e holística da Universidade de Stanford, projetada para medir o desempenho e a segurança de grandes modelos de linguagem.

111 Vistas 0 Comentários
Benchmarks de modelos de IA 2023, 29 de outubro de 2023
OpenCompass

Benchmarks de modelos de IA OpenCompass

O OpenCompass é uma estrutura de avaliação de código aberto desenvolvida pelo Laboratório de IA de Xangai para fornecer uma avaliação comparativa padronizada e abrangente para grandes modelos de linguagem.

82 Vistas 0 Comentários
Benchmarks de modelos de IA 2023, 29 de outubro de 2023
FlagEval

Benchmarks de modelos de IA Avaliação de sinalizador

Uma estrutura de avaliação de código aberto desenvolvida pela Academia de Inteligência Artificial de Pequim (BAAI) para padronizar e ampliar a avaliação comparativa de projetos de mestrado em direito (LLM).

100 Vistas 0 Comentários
Benchmarks de modelos de IA 2023, 29 de outubro de 2023
MMLU

Benchmarks de modelos de IA MMLU

MMLU é um benchmark abrangente projetado para avaliar o conhecimento geral e as capacidades de resolução de problemas de grandes modelos de linguagem em uma vasta gama de disciplinas.

87 Vistas 0 Comentários
Benchmarks de modelos de IA 2023, 29 de outubro de 2023
C-Eval

Benchmarks de modelos de IA Avaliação C

Um conjunto abrangente de ferramentas de avaliação, desenvolvido para avaliar o conhecimento e as capacidades de grandes modelos de linguagem (LLMs), especificamente no idioma chinês.

91 Vistas 0 Comentários
Benchmarks de modelos de IA 2023, 29 de outubro de 2023
SuperCLUE

Benchmarks de modelos de IA SuperCLUE

Uma estrutura de avaliação profissional que fornece parâmetros padronizados para medir a inteligência e a utilidade de modelos de IA em língua chinesa.

75 Vistas 0 Comentários
Benchmarks de modelos de IA 2023, 29 de outubro de 2023
CMMLU

Benchmarks de modelos de IA CMMLU

Um parâmetro de avaliação abrangente, concebido para medir o conhecimento geral e as capacidades linguísticas de Grandes Modelos de Linguagem em Chinês.

78 Vistas 0 Comentários
Benchmarks de modelos de IA 2023, 29 de outubro de 2023
关于我们

AIToolsFly é um diretório selecionado de ferramentas de IA, plataformas de produtividade e recursos digitais. Ajudamos os usuários a descobrir e comparar rapidamente as melhores ferramentas em diferentes categorias.

版权说明

© 2026 AIToolsFly. Todos os direitos reservados. Todo o conteúdo é apenas para fins informativos. Marcas registradas e nomes de produtos pertencem aos seus respectivos proprietários.