AIToolsFly
  • Aplicaciones de IA
    • Agentes de IA
    • Chatbots de IA
    • Herramientas de documentación de IA
    • Herramientas de oficina con IA
    • Herramientas de presentación de IA
    • Herramientas de productividad de IA
    • Motores de búsqueda de IA
    • Herramientas de vídeo con IA
    • Herramientas de escritura de IA
  • Creación de contenido con IA
    • Herramientas de audio AI
    • Herramientas de diseño de IA
    • Eliminadores de fondo de imágenes con IA
    • Generadores de imágenes de IA
    • Herramientas de imagen de IA
  • Desarrollo de IA
    • Marcos de IA
    • Modelos de IA
    • Herramientas de programación de IA
    • Herramientas de aviso de IA
  • Análisis y optimización mediante IA
    • Herramientas de detección y optimización de contenido mediante IA
    • Puntos de referencia de modelos de IA
  • Recursos de aprendizaje de IA
    • Sitios web para aprender IA
  • Aplicaciones de IA
    • Agentes de IA
    • Chatbots de IA
    • Herramientas de documentación de IA
    • Herramientas de oficina con IA
    • Herramientas de presentación de IA
    • Herramientas de productividad de IA
    • Motores de búsqueda de IA
    • Herramientas de vídeo con IA
    • Herramientas de escritura de IA
  • Creación de contenido con IA
    • Herramientas de audio AI
    • Herramientas de diseño de IA
    • Eliminadores de fondo de imágenes con IA
    • Generadores de imágenes de IA
    • Herramientas de imagen de IA
  • Desarrollo de IA
    • Marcos de IA
    • Modelos de IA
    • Herramientas de programación de IA
    • Herramientas de aviso de IA
  • Análisis y optimización mediante IA
    • Herramientas de detección y optimización de contenido mediante IA
    • Puntos de referencia de modelos de IA
  • Recursos de aprendizaje de IA
    • Sitios web para aprender IA
  1. Hogar
  2. Etiqueta
  3. Evaluación del LLM
AGI-Eval

Puntos de referencia de modelos de IA Evaluación de AGI

AGI-Eval es una comunidad de evaluación especializada diseñada para comparar las capacidades y el rendimiento de varios modelos de lenguaje de gran tamaño basados ​​en IA.

48 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 2024年18 de diciembre
H2O EvalGPT

Puntos de referencia de modelos de IA Evaluación de H2O GPT

Un sistema de evaluación avanzado de H2O.ai que utiliza metodologías de calificación Elo para comparar y clasificar modelos de lenguaje grandes (LLM, por sus siglas en inglés).

68 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
LLMEval3

Puntos de referencia de modelos de IA LLMEval3

Un sistema de evaluación profesional del Laboratorio de Procesamiento del Lenguaje Natural de la Universidad de Fudan, diseñado para medir el rendimiento y la fiabilidad de los modelos de lenguaje a gran escala.

69 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
HELM

Puntos de referencia de modelos de IA TIMÓN

Un marco de evaluación estandarizado e integral de la Universidad de Stanford, diseñado para medir el rendimiento y la seguridad de los modelos de lenguaje a gran escala.

111 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
OpenCompass

Puntos de referencia de modelos de IA OpenCompass

OpenCompass es un marco de evaluación de código abierto desarrollado por el Laboratorio de IA de Shanghái para proporcionar una evaluación comparativa estandarizada y completa para grandes modelos de lenguaje.

82 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
FlagEval

Puntos de referencia de modelos de IA FlagEval

Un marco de evaluación de código abierto desarrollado por la Academia de Inteligencia Artificial de Beijing (BAAI) para estandarizar y ampliar la evaluación comparativa de los programas de maestría en derecho (LLM).

100 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
MMLU

Puntos de referencia de modelos de IA MMLU

MMLU es una herramienta de evaluación comparativa integral diseñada para evaluar el conocimiento general y la capacidad de resolución de problemas de grandes modelos de lenguaje en una amplia gama de disciplinas.

88 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
C-Eval

Puntos de referencia de modelos de IA Evaluación C

Un conjunto integral de herramientas de evaluación diseñado para valorar el conocimiento y las capacidades de los grandes modelos lingüísticos (MLL, por sus siglas en inglés), específicamente en el idioma chino.

94 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
SuperCLUE

Puntos de referencia de modelos de IA SuperCLUE

Un marco de evaluación profesional que proporciona parámetros estandarizados para medir la inteligencia y la utilidad de los modelos de IA en idioma chino.

75 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
CMMLU

Puntos de referencia de modelos de IA CMMLU

Un sistema de evaluación integral diseñado para medir el conocimiento general y las capacidades lingüísticas de los modelos lingüísticos a gran escala en chino.

84 Vistas 0 Comentarios
Puntos de referencia de modelos de IA 29 de octubre de 2023
  • 1
  • 2
  • »
关于我们

AIToolsFly es un directorio especializado de herramientas de IA, plataformas de productividad y recursos digitales. Ayudamos a los usuarios a descubrir y comparar rápidamente las mejores herramientas en diferentes categorías.

版权说明

© 2026 AIToolsFly. Todos los derechos reservados. El contenido es meramente informativo. Las marcas comerciales y los nombres de productos pertenecen a sus respectivos propietarios.