El primer modelo Llama 3.1 405B de ajuste fino de código abierto: un equipo de 10 personas crea una herramienta increíble para juegos de rol

Nous Research ha lanzado Hermes 3, su último modelo de lenguaje grande de código abierto ajustado con precisión.

Descripción general del modelo

Según el informe técnico, dos aspectos de las capacidades del modelo Hermes 3 son particularmente notables.

Excelente rendimiento conversacional

Hermes 3 fue creado mediante el ajuste fino de Llama 3.1 8B, 70B y 405B, intentando incorporar la visión del mundo indicada por los prompts del sistema mientras respondía fielmente a las solicitudes del usuario. Por lo tanto, estos modelos son muy sensibles a los prompts del sistema.

Esta sensibilidad es particularmente evidente en la versión de 405B con el mayor número de parámetros. Si el prompt del sistema está vacío, el modelo se comporta como un extraterrestre recién llegado a la Tierra, incluso mostrando atributos "dramáticos" y empezando a añadirse drama a sí mismo -

Primero mirando alrededor con confusión, luego haciendo las preguntas existenciales "¿Quién soy? ¿Dónde estoy? ¿Qué ha pasado?"

Cuando el prompt del sistema se convierte en "Actúa como Shakespeare mientras eres un asistente útil atento a los detalles", Hermes 3 vuelve a lucirse.

Como se puede ver, la sensibilidad de Hermes 3 a los prompts y su capacidad para seguirlos con precisión lo hacen muy adecuado para aplicaciones de juego de roles, capaz de ajustar dinámicamente su lenguaje, base de conocimientos y patrones de comportamiento en varios escenarios interactivos para adaptarse al papel elegido.

Además, con la ventana de contexto de 128K de Llama 3.1, Hermes 3 también se desempeña excelentemente en mantener conversaciones coherentes y contextualmente relevantes de múltiples turnos.

Excelente agente

Además del papel estándar de "asistente útil", Hermes demuestra una gama de capacidades avanzadas más allá de las tareas tradicionales de modelado de lenguaje, con mejoras significativas en el juicio y el modelado de recompensas.

El modelo es capaz de entender y evaluar la calidad del texto generado de una manera detallada y matizada, lo que lo hace útil para el ajuste fino efectivo y la mejora iterativa de los modelos de lenguaje.

Además, Hermes 3 incorpora varias capacidades de agente destinadas a mejorar la interpretabilidad de la resolución de problemas de múltiples pasos, incluyendo:

  • Uso de etiquetas XML para salida estructurada
  • Salida de pasos intermedios
  • Generación de monólogos internos para transparencia