Primeiro modelo Llama 3.1 405B de ajuste fino é lançado como código aberto: Equipe de 10 pessoas cria ferramenta incrível para interpretação de papéis

A Nous Research lançou o Hermes 3, seu mais recente modelo de linguagem grande de código aberto e ajustado.

Visão Geral do Modelo

De acordo com o relatório técnico, dois aspectos das capacidades do modelo Hermes 3 são particularmente notáveis.

Excelente Desempenho Conversacional

O Hermes 3 foi criado através do ajuste fino do Llama 3.1 8B, 70B e 405B, tentando incorporar a visão de mundo indicada pelos prompts do sistema enquanto responde fielmente às solicitações do usuário. Portanto, esses modelos são muito sensíveis aos prompts do sistema.

Essa sensibilidade é particularmente evidente na versão 405B com o maior número de parâmetros. Se o prompt do sistema estiver vazio, o modelo se comporta como um alienígena que acabou de pousar na Terra, até mesmo mostrando atributos "dramáticos" e começando a adicionar drama a si mesmo -

Primeiro olhando ao redor confuso, depois fazendo as perguntas existenciais "Quem sou eu? Onde estou? O que aconteceu?"

Quando o prompt do sistema se torna "Atue como Shakespeare enquanto é um assistente prestativo atento aos detalhes", o Hermes 3 começa a se exibir novamente.

Como você pode ver, a sensibilidade do Hermes 3 aos prompts e sua capacidade de segui-los com precisão o tornam muito adequado para aplicações do tipo role-playing, capaz de ajustar dinamicamente sua linguagem, base de conhecimento e padrões de comportamento em vários cenários interativos para se adaptar ao papel escolhido.

Além disso, com a janela de contexto de 128K do Llama 3.1, o Hermes 3 também tem um desempenho excelente na manutenção de conversas coerentes e contextualmente relevantes em múltiplos turnos.

Excelente Agente

Além do papel padrão de "assistente prestativo", o Hermes demonstra uma série de capacidades avançadas além das tarefas tradicionais de modelagem de linguagem, com melhorias significativas em julgamento e modelagem de recompensa.

O modelo é capaz de entender e avaliar a qualidade do texto gerado de uma maneira detalhada e nuançada, tornando-o útil para o ajuste fino eficaz e melhoria iterativa de modelos de linguagem.

Além disso, o Hermes 3 incorpora várias capacidades de agente destinadas a melhorar a interpretabilidade da resolução de problemas em várias etapas, incluindo:

  • Uso de tags XML para saída estruturada
  • Saída de etapas intermediárias
  • Geração de monólogos internos para transparência