Первая модель с тонкой настройкой Llama 3.1 405B с открытым исходным кодом: инструмент для ролевых игр, созданный командой из 10 человек

Nous Research выпустила Hermes 3, свою новейшую доработанную модель большого языка с открытым исходным кодом.

Обзор модели

Согласно техническому отчету, два аспекта возможностей модели Hermes 3 особенно примечательны.

Отличная производительность в разговорах

Hermes 3 был создан путем дообучения Llama 3.1 8B, 70B и 405B, пытаясь включить мировоззрение, указанное в системных промптах, при этом точно отвечая на запросы пользователей. Поэтому эти модели очень чувствительны к системным промптам.

Эта чувствительность особенно заметна в версии 405B с наибольшим количеством параметров. Если системный промпт пуст, модель ведет себя как инопланетянин, только что приземлившийся на Землю, даже проявляя "драматические" атрибуты и начиная добавлять драматизм самой себе -

Сначала оглядываясь в замешательстве, затем задавая экзистенциальные вопросы "Кто я? Где я? Что произошло?"

Когда системный промпт становится "Действуй как Шекспир, будучи при этом полезным ассистентом, внимательным к деталям", Hermes 3 снова начинает показывать себя.

Как видите, чувствительность Hermes 3 к промптам и способность точно следовать им делают его очень подходящим для приложений типа ролевых игр, способным динамически корректировать свой язык, базу знаний и модели поведения в различных интерактивных сценариях для адаптации к выбранной роли.

Более того, с контекстным окном Llama 3.1 в 128K, Hermes 3 также отлично справляется с поддержанием согласованных и контекстуально релевантных многоходовых разговоров.

Отличный агент

Помимо стандартной роли "полезного ассистента", Hermes демонстрирует ряд продвинутых возможностей, выходящих за рамки традиционных задач языкового моделирования, со значительными улучшениями в суждениях и моделировании вознаграждений.

Модель способна понимать и оценивать качество сгенерированного текста детально и нюансированно, что делает ее полезной для эффективной тонкой настройки и итеративного улучшения языковых моделей.

Кроме того, Hermes 3 включает несколько агентских возможностей, направленных на улучшение интерпретируемости решения многошаговых проблем, включая:

  • Использование XML-тегов для структурированного вывода
  • Вывод промежуточных шагов
  • Генерация внутренних монологов для прозрачности