Модель Llama 3.1 с открытым исходным кодом появилась: бросая вызов господству закрытых AI

Область больших языковых моделей снова претерпела драматические изменения. Модель Llama 3.1 405B появилась неожиданно, превзойдя GPT-4 и Claude 3.5 Sonnet в нескольких оценках, став первым открытым ИИ, победившим ведущие закрытые модели. Цукерберг уверенно заявил, что открытый ИИ в конечном итоге победит, подобно успешному пути Linux.

Новый король открытого исходного кода Llama 3.1 405B официально запущен, превзойдя закрытые SOTA модели, такие как GPT-4o и Claude 3.5 Sonnet, в нескольких эталонных тестах.

Ключевые моменты семейства моделей Llama 3.1:

  • Производительность модели 405B сопоставима с лучшими закрытыми моделями
  • Открытый исходный код/бесплатное использование весов и кода, разрешено тонкая настройка, дистилляция и развертывание
  • 128k контекст, многоязычность, хорошие способности генерации кода и сложных рассуждений
  • API Llama Stack легко интегрируется

Meta также выпустила подробную техническую статью объемом более 90 страниц, охватывающую различные аспекты исследований больших моделей.

Генеральный директор Meta Цукерберг подчеркнул важность открытого исходного кода в AI и ослабил условия лицензирования, позволяя разработчикам использовать выходные данные Llama 3.1 для улучшения сторонних AI моделей.

Эксперты отрасли в целом считают это важной вехой в развитии AI:

  • Карпати назвал это первым случаем, когда передовая модель уровня GPT-4 стала доступна всем
  • Тянь Юаньдун заявил, что LLM с открытым исходным кодом теперь не уступают или даже превосходят закрытые LLM
  • Джим Фан назвал это историческим моментом, когда сила GPT-4 оказалась в наших руках

Выпуск Llama 3.1 знаменует собой новую эру моделей AI с открытым исходным кодом и, как ожидается, ускорит развитие всей экосистемы AI.

Ссылка