Meta выпустила самую мощную на сегодняшний день модель с открытым исходным кодом Llama 3.1 405B, которая поддерживает контекстную длину в 128K токенов и обучена на 15 триллионах токенов. Общее количество загрузок моделей Llama превысило 300 миллионов, а их производительность сопоставима с ведущими моделями, такими как GPT-4.
Этот шаг Meta рассматривается как поворотный момент в споре между открытым и закрытым исходным кодом. Цукерберг подчеркивает важность ИИ с открытым исходным кодом, считая, что это станет отраслевым стандартом. В отличие от OpenAI, которая держит технические детали в секрете, Meta опубликовала подробные технические документы.
В ответ OpenAI выпустила недорогую мини-версию GPT-4o. Это знаменует собой эскалацию ценовой войны в сфере ИИ в Кремниевой долине, где крупные компании выпускают модели дешевле, чем GPT-4.
Малые модели становятся инструментом для компаний ИИ для снижения затрат и повышения эффективности. Они быстрее в обработке простых задач, требуют меньше хранилища и энергии, а также дешевле. Для обычных пользователей малые модели являются "бюджетной альтернативой" крупным моделям с высоким соотношением цены и качества.
Низкие цены обусловлены снижением затрат. Значительно снижая стоимость использования ИИ, компании, такие как OpenAI, надеются расширить сферу применения ИИ. Малые модели могут стать новым трендом в области ИИ.