LMSYS - AIToolsFly

Modelos de IA Vicuña de establo

StableVicuna es uno de los primeros chatbots de código abierto a gran escala que utiliza el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF, por sus siglas en inglés) para mejorar la alineación.