Новый король открытого исходного кода Llama 3.1 405B официально запущен, превзойдя закрытые SOTA модели, такие как GPT-4o и Claude 3.5 Sonnet, в нескольких эталонных тестах.
Ключевые моменты семейства моделей Llama 3.1:
- Производительность модели 405B сопоставима с лучшими закрытыми моделями
- Открытый исходный код/бесплатное использование весов и кода, разрешено тонкая настройка, дистилляция и развертывание
- 128k контекст, многоязычность, хорошие способности генерации кода и сложных рассуждений
- API Llama Stack легко интегрируется
Meta также выпустила подробную техническую статью объемом более 90 страниц, охватывающую различные аспекты исследований больших моделей.
Генеральный директор Meta Цукерберг подчеркнул важность открытого исходного кода в AI и ослабил условия лицензирования, позволяя разработчикам использовать выходные данные Llama 3.1 для улучшения сторонних AI моделей.
Эксперты отрасли в целом считают это важной вехой в развитии AI:
- Карпати назвал это первым случаем, когда передовая модель уровня GPT-4 стала доступна всем
- Тянь Юаньдун заявил, что LLM с открытым исходным кодом теперь не уступают или даже превосходят закрытые LLM
- Джим Фан назвал это историческим моментом, когда сила GPT-4 оказалась в наших руках
Выпуск Llama 3.1 знаменует собой новую эру моделей AI с открытым исходным кодом и, как ожидается, ускорит развитие всей экосистемы AI.