KI-Modell-Benchmarks HELM Ein standardisierter, ganzheitlicher Bewertungsrahmen der Stanford University, der entwickelt wurde, um die Leistungsfähigkeit und Sicherheit großer Sprachmodelle zu messen.