Обзор модели
Согласно техническому отчету, два аспекта возможностей модели Hermes 3 особенно примечательны.
Отличная производительность в разговорах
Hermes 3 был создан путем дообучения Llama 3.1 8B, 70B и 405B, пытаясь включить мировоззрение, указанное в системных промптах, при этом точно отвечая на запросы пользователей. Поэтому эти модели очень чувствительны к системным промптам.
Эта чувствительность особенно заметна в версии 405B с наибольшим количеством параметров. Если системный промпт пуст, модель ведет себя как инопланетянин, только что приземлившийся на Землю, даже проявляя "драматические" атрибуты и начиная добавлять драматизм самой себе -
Сначала оглядываясь в замешательстве, затем задавая экзистенциальные вопросы "Кто я? Где я? Что произошло?"
Когда системный промпт становится "Действуй как Шекспир, будучи при этом полезным ассистентом, внимательным к деталям", Hermes 3 снова начинает показывать себя.
Как видите, чувствительность Hermes 3 к промптам и способность точно следовать им делают его очень подходящим для приложений типа ролевых игр, способным динамически корректировать свой язык, базу знаний и модели поведения в различных интерактивных сценариях для адаптации к выбранной роли.
Более того, с контекстным окном Llama 3.1 в 128K, Hermes 3 также отлично справляется с поддержанием согласованных и контекстуально релевантных многоходовых разговоров.
Отличный агент
Помимо стандартной роли "полезного ассистента", Hermes демонстрирует ряд продвинутых возможностей, выходящих за рамки традиционных задач языкового моделирования, со значительными улучшениями в суждениях и моделировании вознаграждений.
Модель способна понимать и оценивать качество сгенерированного текста детально и нюансированно, что делает ее полезной для эффективной тонкой настройки и итеративного улучшения языковых моделей.
Кроме того, Hermes 3 включает несколько агентских возможностей, направленных на улучшение интерпретируемости решения многошаговых проблем, включая:
- Использование XML-тегов для структурированного вывода
- Вывод промежуточных шагов
- Генерация внутренних монологов для прозрачности