Benchmark dei modelli di intelligenza artificiale LMArena Una piattaforma di benchmarking collaborativa in cui gli utenti mettono alla prova modelli linguistici di grandi dimensioni attraverso confronti diretti e alla cieca.