Benchmark dei modelli di intelligenza artificiale TIMONE Un quadro di valutazione olistico e standardizzato, sviluppato dall'Università di Stanford, progettato per misurare le prestazioni e la sicurezza di modelli linguistici complessi.