हगिंग फेस द्वारा विकसित एक व्यापक, समुदाय-संचालित बेंचमार्क प्लेटफॉर्म, जो ओपन-सोर्स बड़े भाषा मॉडलों के प्रदर्शन को ट्रैक और तुलना करने के लिए बनाया गया है।
PubMedQA एक विशेषीकृत बायोमेडिकल प्रश्न-उत्तर डेटासेट और लीडरबोर्ड है जिसका उपयोग चिकित्सा क्षेत्र में एआई मॉडल की सटीकता का बेंचमार्क करने के लिए किया जाता है।