Модель Llama 3.1 с открытым исходным кодом появилась: бросая вызов господству закрытых AI

Новый король открытого исходного кода Llama 3.1 405B официально запущен, превзойдя закрытые SOTA модели, такие как GPT-4o и Claude 3.5 Sonnet, в нескольких эталонных тестах.

Ключевые моменты семейства моделей Llama 3.1:

Производительность модели 405B сопоставима с лучшими закрытыми моделями
Открытый исходный код/бесплатное использование весов и кода, разрешено тонкая настройка, дистилляция и развертывание
128k контекст, многоязычность, хорошие способности генерации кода и сложных рассуждений
API Llama Stack легко интегрируется

Meta также выпустила подробную техническую статью объемом более 90 страниц, охватывающую различные аспекты исследований больших моделей.

Генеральный директор Meta Цукерберг подчеркнул важность открытого исходного кода в AI и ослабил условия лицензирования, позволяя разработчикам использовать выходные данные Llama 3.1 для улучшения сторонних AI моделей.

Эксперты отрасли в целом считают это важной вехой в развитии AI:

Карпати назвал это первым случаем, когда передовая модель уровня GPT-4 стала доступна всем
Тянь Юаньдун заявил, что LLM с открытым исходным кодом теперь не уступают или даже превосходят закрытые LLM
Джим Фан назвал это историческим моментом, когда сила GPT-4 оказалась в наших руках

Выпуск Llama 3.1 знаменует собой новую эру моделей AI с открытым исходным кодом и, как ожидается, ускорит развитие всей экосистемы AI.

Ссылка