Visão Geral do Modelo
De acordo com o relatório técnico, dois aspectos das capacidades do modelo Hermes 3 são particularmente notáveis.
Excelente Desempenho Conversacional
O Hermes 3 foi criado através do ajuste fino do Llama 3.1 8B, 70B e 405B, tentando incorporar a visão de mundo indicada pelos prompts do sistema enquanto responde fielmente às solicitações do usuário. Portanto, esses modelos são muito sensíveis aos prompts do sistema.
Essa sensibilidade é particularmente evidente na versão 405B com o maior número de parâmetros. Se o prompt do sistema estiver vazio, o modelo se comporta como um alienígena que acabou de pousar na Terra, até mesmo mostrando atributos "dramáticos" e começando a adicionar drama a si mesmo -
Primeiro olhando ao redor confuso, depois fazendo as perguntas existenciais "Quem sou eu? Onde estou? O que aconteceu?"
Quando o prompt do sistema se torna "Atue como Shakespeare enquanto é um assistente prestativo atento aos detalhes", o Hermes 3 começa a se exibir novamente.
Como você pode ver, a sensibilidade do Hermes 3 aos prompts e sua capacidade de segui-los com precisão o tornam muito adequado para aplicações do tipo role-playing, capaz de ajustar dinamicamente sua linguagem, base de conhecimento e padrões de comportamento em vários cenários interativos para se adaptar ao papel escolhido.
Além disso, com a janela de contexto de 128K do Llama 3.1, o Hermes 3 também tem um desempenho excelente na manutenção de conversas coerentes e contextualmente relevantes em múltiplos turnos.
Excelente Agente
Além do papel padrão de "assistente prestativo", o Hermes demonstra uma série de capacidades avançadas além das tarefas tradicionais de modelagem de linguagem, com melhorias significativas em julgamento e modelagem de recompensa.
O modelo é capaz de entender e avaliar a qualidade do texto gerado de uma maneira detalhada e nuançada, tornando-o útil para o ajuste fino eficaz e melhoria iterativa de modelos de linguagem.
Além disso, o Hermes 3 incorpora várias capacidades de agente destinadas a melhorar a interpretabilidade da resolução de problemas em várias etapas, incluindo:
- Uso de tags XML para saída estruturada
- Saída de etapas intermediárias
- Geração de monólogos internos para transparência