Stanford CRFM - AIToolsFly

Benchmark dei modelli di intelligenza artificiale TIMONE

Un quadro di valutazione olistico e standardizzato, sviluppato dall'Università di Stanford, progettato per misurare le prestazioni e la sicurezza di modelli linguistici complessi.