PubMedQA

185 瀏覽量

概述

PubMedQA 是一個專業級基準測試平台，旨在評估大型語言模型 (LLM) 和專用人工智慧系統在生物醫學研究領域的表現。它利用從 PubMed 摘要中提取的高品質問答對資料集，為人工智慧整合複雜醫學資訊並提供準確、基於證據的答案的能力提供了一個嚴格的測試平台。

PubMedQA 主要是基準測試工具和資料集，而非消費者導向的醫療診斷工具。使用者應注意，此排行榜上的模型分數僅代表其在特定資料集上的整體效能，可能無法反映其在所有實際臨床場景下的準確性。存取完整資料集可能需要遵守特定的研究許可協議。

免責聲明：功能、資料集版本和排行榜排名可能會隨時間而變化。請造訪 PubMedQA 官方網站查看最新數據。

資訊可能不完整或過時；請在官方網站上確認詳細資訊。

結尾

2023年10月29日

0

複製說明：內容可能來自第三方，並經人工智慧輔助處理。我們不保證其準確性。所有商標均為其各自所有者所有。

觸手AI藝術

CMMLU

評論（暫無評論）