AIToolsFly
  • AI 애플리케이션
    • AI 에이전트
    • AI 챗봇
    • AI 문서 도구
    • AI 오피스 도구
    • AI 프레젠테이션 도구
    • AI 생산성 도구
    • AI 검색 엔진
    • AI 비디오 도구
    • AI 글쓰기 도구
  • AI 기반 콘텐츠 제작
    • AI 오디오 도구
    • AI 디자인 도구
    • AI 이미지 배경 제거
    • AI 이미지 생성기
    • AI 이미지 도구
  • AI 개발
    • AI 프레임워크
    • AI 모델
    • AI 프로그래밍 도구
    • AI 프롬프트 도구
  • AI 분석 및 최적화
    • AI 콘텐츠 탐지 및 최적화 도구
    • AI 모델 벤치마크
  • AI 학습 자료
    • 인공지능을 배울 수 있는 웹사이트
  • AI 애플리케이션
    • AI 에이전트
    • AI 챗봇
    • AI 문서 도구
    • AI 오피스 도구
    • AI 프레젠테이션 도구
    • AI 생산성 도구
    • AI 검색 엔진
    • AI 비디오 도구
    • AI 글쓰기 도구
  • AI 기반 콘텐츠 제작
    • AI 오디오 도구
    • AI 디자인 도구
    • AI 이미지 배경 제거
    • AI 이미지 생성기
    • AI 이미지 도구
  • AI 개발
    • AI 프레임워크
    • AI 모델
    • AI 프로그래밍 도구
    • AI 프롬프트 도구
  • AI 분석 및 최적화
    • AI 콘텐츠 탐지 및 최적화 도구
    • AI 모델 벤치마크
  • AI 학습 자료
    • 인공지능을 배울 수 있는 웹사이트
  1. 집
  2. AI 분석 및 최적화
  3. AI 모델 벤치마크
  4. 기사 목록
MagicArena

AI 모델 벤치마크 매직아레나

MagicArena는 시각적 생성형 AI 모델을 인간과의 직접적인 비교를 통해 평가하고 순위를 매기는 경쟁력 있는 벤치마킹 플랫폼입니다.

78 조회수 0 댓글
AI 모델 벤치마크 2025년 11월 3일
AGI-Eval

AI 모델 벤치마크 AGI-Eval

AGI-Eval은 다양한 AI 대규모 언어 모델의 기능과 성능을 벤치마킹하기 위해 설계된 전문 평가 커뮤니티입니다.

44 조회수 0 댓글
AI 모델 벤치마크 2024년 12월 18일
H2O EvalGPT

AI 모델 벤치마크 H2O EvalGPT

An advanced evaluation system by H2O.ai that utilizes Elo rating methodologies to benchmark and rank Large Language Models (LLMs).

59 조회수 0 댓글
AI 모델 벤치마크 2023年10月29日
LLMEval3

AI 모델 벤치마크 LLMEval3

A professional evaluation benchmark from Fudan University’s NLP Lab designed to measure the performance and reliability of large language models.

63 조회수 0 댓글
AI 모델 벤치마크 2023年10月29日
MMBench

AI 모델 벤치마크 MMBench

MMBench is a comprehensive evaluation framework designed to measure the capabilities of multimodal large language models across a wide array of visual and textual tasks.

65 조회수 0 댓글
AI 모델 벤치마크 2023年10月29日
HELM

AI 모델 벤치마크 HELM

A standardized, holistic evaluation framework from Stanford University designed to measure the performance and safety of large language models.

102 조회수 0 댓글
AI 모델 벤치마크 2023年10月29日
OpenCompass

AI 모델 벤치마크 OpenCompass

OpenCompass is an open-source evaluation framework developed by the Shanghai AI Lab to provide standardized, comprehensive benchmarking for large language models.

77 조회수 0 댓글
AI 모델 벤치마크 2023年10月29日
FlagEval

AI 모델 벤치마크 FlagEval

An open-source evaluation framework developed by the Beijing Academy of Artificial Intelligence (BAAI) to standardize and scale LLM benchmarking.

88 조회수 0 댓글
AI 모델 벤치마크 2023年10月29日
LMArena

AI 모델 벤치마크 LMArena

A crowdsourced benchmarking platform where users battle-test Large Language Models through blind side-by-side comparisons.

89 조회수 0 댓글
AI 모델 벤치마크 2023年10月29日
MMLU

AI 모델 벤치마크 MMLU

MMLU is a comprehensive benchmark designed to evaluate the general knowledge and problem-solving capabilities of large language models across a vast array of disciplines.

81 조회수 0 댓글
AI 모델 벤치마크 2023年10月29日
  • 1
  • 2
  • »
나는 당신을 사랑합니다

AIToolsFly는 AI 도구, 생산성 플랫폼 및 디지털 리소스를 엄선하여 제공하는 디렉토리입니다. 사용자가 다양한 카테고리에서 최고의 도구를 빠르게 찾고 비교할 수 있도록 지원합니다.

특별명명

© 2026 AIToolsFly. 모든 권리 보유. 모든 콘텐츠는 정보 제공 목적으로만 사용됩니다. 상표 및 제품명은 해당 소유자의 자산입니다.