AIToolsFly
  • Applications d'IA
    • Agents IA
    • Chatbots IA
    • Outils de documentation IA
    • Outils bureautiques IA
    • Outils de présentation IA
    • Outils de productivité IA
    • Moteurs de recherche IA
    • Outils vidéo IA
    • Outils d'écriture IA
  • Création de contenu par IA
    • Outils audio IA
    • Outils de conception d'IA
    • Suppression d'arrière-plan d'images par IA
    • Générateurs d'images IA
    • Outils d'imagerie IA
  • Développement de l'IA
    • Cadres d'IA
    • Modèles d'IA
    • Outils de programmation d'IA
    • Outils d'invite IA
  • Analyse et optimisation par IA
    • Outils de détection et d'optimisation de contenu par IA
    • Benchmarks de modèles d'IA
  • Ressources d'apprentissage en IA
    • Sites web pour apprendre l'IA
  • Applications d'IA
    • Agents IA
    • Chatbots IA
    • Outils de documentation IA
    • Outils bureautiques IA
    • Outils de présentation IA
    • Outils de productivité IA
    • Moteurs de recherche IA
    • Outils vidéo IA
    • Outils d'écriture IA
  • Création de contenu par IA
    • Outils audio IA
    • Outils de conception d'IA
    • Suppression d'arrière-plan d'images par IA
    • Générateurs d'images IA
    • Outils d'imagerie IA
  • Développement de l'IA
    • Cadres d'IA
    • Modèles d'IA
    • Outils de programmation d'IA
    • Outils d'invite IA
  • Analyse et optimisation par IA
    • Outils de détection et d'optimisation de contenu par IA
    • Benchmarks de modèles d'IA
  • Ressources d'apprentissage en IA
    • Sites web pour apprendre l'IA
  1. Maison
  2. Analyse et optimisation par IA
  3. Article list
Outils de détection et d'optimisation de contenu par IA
Benchmarks de modèles d'IA
MMBench

Benchmarks de modèles d'IA MMBench

MMBench est un cadre d'évaluation complet conçu pour mesurer les capacités des grands modèles de langage multimodaux à travers un large éventail de tâches visuelles et textuelles.

73 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
HELM

Benchmarks de modèles d'IA HELM

A standardized, holistic evaluation framework from Stanford University designed to measure the performance and safety of large language models.

111 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
OpenCompass

Benchmarks de modèles d'IA OpenCompass

OpenCompass is an open-source evaluation framework developed by the Shanghai AI Lab to provide standardized, comprehensive benchmarking for large language models.

82 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
FlagEval

Benchmarks de modèles d'IA FlagEval

An open-source evaluation framework developed by the Beijing Academy of Artificial Intelligence (BAAI) to standardize and scale LLM benchmarking.

100 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
LMArena

Benchmarks de modèles d'IA LMArena

A crowdsourced benchmarking platform where users battle-test Large Language Models through blind side-by-side comparisons.

94 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
MMLU

Benchmarks de modèles d'IA MMLU

MMLU is a comprehensive benchmark designed to evaluate the general knowledge and problem-solving capabilities of large language models across a vast array of disciplines.

88 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
C-Eval

Benchmarks de modèles d'IA C-Eval

Une suite d'évaluation complète conçue pour évaluer les connaissances et les capacités des grands modèles de langage (LLM) spécifiquement dans la langue chinoise.

94 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
SuperCLUE

Benchmarks de modèles d'IA SuperCLUE

A professional evaluation framework providing standardized benchmarks to measure the intelligence and utility of Chinese-language Modèles d'IA.

75 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
Open LLM Leaderboard

Benchmarks de modèles d'IA Open LLM Leaderboard

A comprehensive, community-driven benchmark platform by Hugging Face to track and compare the performance of open-source large language models.

68 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
CMMLU

Benchmarks de modèles d'IA CMMLU

A comprehensive evaluation benchmark designed to measure the general knowledge and linguistic capabilities of Large Language Models in Chinese.

84 Vues 0 Commentaires
Benchmarks de modèles d'IA 29/10/2023
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
关于我们

AIToolsFly est un répertoire sélectif d'outils d'IA, de plateformes de productivité et de ressources numériques. Nous aidons les utilisateurs à découvrir et comparer rapidement les meilleurs outils dans différentes catégories.

版权说明

© 2026 AIToolsFly. Tous droits réservés. Le contenu est fourni à titre informatif uniquement. Les marques et noms de produits appartiennent à leurs propriétaires respectifs.