Meta выпустила модель с открытым исходным кодом, содержащую 405 миллиардов параметров: официально представлена Llama 3.1

Ниже приводится открытое письмо Цукерберга, переведенное "AI Emergence":

"Открытый исходный код ИИ - путь вперед"

В ранние дни высокопроизводительных вычислений все крупные технологические компании того времени активно инвестировали в разработку собственных закрытых версий Unix. В то время было трудно представить какой-либо другой способ разработки такого продвинутого программного обеспечения.

Тем не менее, открытый Linux в конечном итоге стал популярным - изначально потому, что позволял разработчикам модифицировать его код по своему усмотрению и был дешевле; со временем он стал более продвинутым, более безопасным и имел гораздо более широкую экосистему, поддерживающую больше функций, чем любой закрытый Unix. Сегодня Linux является отраслевым стандартом для облачных вычислений и операционных систем, работающих на большинстве мобильных устройств - мы все получаем выгоду от его превосходных продуктов.

Я считаю, что искусственный интеллект будет развиваться аналогичным образом. Сегодня несколько технологических компаний разрабатывают ведущие модели с закрытым исходным кодом. Но открытый исходный код быстро сокращает этот разрыв. В прошлом году Llama 2 могла конкурировать только с моделями старого поколения, отстающими от передовых. В этом году Llama 3 конкурирует с современными моделями и лидирует в некоторых областях. Начиная со следующего года, мы ожидаем, что будущие Llama станут самыми передовыми в отрасли. Но даже до этого Llama уже лидирует в открытости, модифицируемости и экономической эффективности.

Сегодня мы делаем следующий шаг к тому, чтобы сделать ИИ с открытым исходным кодом отраслевым стандартом. Мы выпускаем Llama 3.1 405B - первую модель ИИ с открытым исходным кодом на ведущем отраслевом уровне - вместе с новыми и улучшенными моделями Llama 3.1 70B и 8B. Помимо лучшего соотношения цены и производительности по сравнению с моделями с закрытым исходным кодом, тот факт, что модель 405B имеет открытый исходный код, сделает ее лучшим выбором для тонкой настройки и извлечения меньших моделей.

Помимо выпуска этих моделей, мы сотрудничаем с рядом компаний для развития более широкой экосистемы. Amazon, Databricks и Nvidia запускают полные наборы сервисов для поддержки разработчиков в тонкой настройке и совершенствовании их собственных моделей. Инновационные компании, такие как Groq (стартап по производству чипов для ИИ), создали сервисы с низкой задержкой и низкой стоимостью для всех новых моделей.

Эти модели будут доступны на всех основных облачных платформах, включая AWS, Azure, Google, Oracle и другие. Scale.AI, Dell, Deloitte и другие готовы помочь предприятиям развернуть Llama и обучить собственные модели, используя свои данные. По мере роста сообщества и разработки новых сервисов другими компаниями мы сможем коллективно сделать Llama отраслевым стандартом и принести преимущества ИИ каждому.

Meta привержена ИИ с открытым исходным кодом. Я расскажу, почему я считаю, что открытый исходный код - лучший стек разработки для людей, почему открытие исходного кода Llama полезно для Meta, почему ИИ с открытым исходным кодом полезен для мира, и почему, благодаря этому, сообщество открытого исходного кода будет существовать в долгосрочной перспективе.

Почему ИИ с открытым исходным кодом полезен для разработчиков

Когда я общаюсь с разработчиками, генеральными директорами и правительственными чиновниками по всему миру, я обычно слышу следующие темы:

Нам нужно обучать, тонко настраивать и совершенствовать наши собственные модели.

У каждой организации разные потребности, и модели разного размера могут наилучшим образом удовлетворить эти потребности, будучи обученными или тонко настроенными с использованием конкретных данных. Задачи на устройствах и задачи классификации требуют меньших моделей, в то время как более сложные задачи требуют больших моделей.

Теперь вы сможете использовать современные модели Llama, продолжать обучать их на своих данных, а затем уточнять их до оптимального размера модели - без того, чтобы мы или кто-либо еще видели ваши данные.

Нам нужно контролировать свою судьбу и не быть связанными закрытым поставщиком.

Многие организации не хотят полагаться на модели, которые они не могут запускать и контролировать. Они не хотят, чтобы поставщики моделей с закрытым исходным кодом могли изменять свои модели, менять условия использования или даже полностью прекращать их обслуживание. Они также не хотят быть привязанными к одному облаку, имеющему эксклюзивные права на определенную модель. Открытый исходный код предоставляет экосистему инструментов, совместимых со многими компаниями, между которыми вы можете легко переключаться.

Нам нужно защищать наши данные.

Многие организации имеют дело с конфиденциальными данными, которые нуждаются в защите и не могут передаваться в модели с закрытым исходным кодом через облачные API. Другие организации просто не доверяют свои данные поставщикам моделей с закрытым исходным кодом. Открытый исходный код решает эти проблемы, позволяя запускать модели где угодно. Широко признано, что программное обеспечение с открытым исходным кодом более безопасно, поскольку разработка более прозрачна.

Нам нужна эффективная и доступная операционная модель.

Разработчики могут запускать вывод на Llama 3.1 405B на собственной инфраструктуре примерно за 50% стоимости использования моделей с закрытым исходным кодом, таких как GPT-4o, для пользовательских и офлайн-задач вывода.

Мы делаем ставку на экосистему, которая может стать долгосрочным стандартом.

Многие люди видят, что открытый исходный код развивается быстрее, чем модели с закрытым исходным кодом, и они хотят построить архитектуру своих систем таким образом, чтобы получить наибольшее долгосрочное преимущество.

Почему ИИ с открытым исходным кодом полезен для Meta

Бизнес-модель Meta заключается в создании лучших впечатлений и услуг для людей. Для этого нам нужно обеспечить постоянный доступ к лучшим технологиям, а не быть запертыми в закрытых экосистемах конкурентов, которые ограничивали бы то, что мы можем создать.

Один из моих формирующих опытов - это то, как наши сервисы ограничены тем, что Apple позволяет нам создавать на их платформе. То, как они облагают налогом разработчиков, произвольные правила, которые они применяют, и все инновации продуктов, которые они блокируют от выпуска, ясно показывают, что Meta и многие другие компании могли бы свободно создавать лучшие сервисы для людей, если бы мы могли создавать лучшие версии наших продуктов без того, чтобы конкуренты могли ограничивать то, что мы можем создать.

Философски, это главная причина, по которой я так твердо верю в создание экосистем с открытым исходным кодом для следующего поколения вычислений в ИИ и AR/VR.

Люди часто спрашивают меня, не беспокоюсь ли я о том, что отдаю технологическое преимущество, открывая исходный код Llama, но я думаю, что это игнорирует некоторые важные причины:

Во-первых, чтобы обеспечить доступ к лучшим технологиям, а не быть запертыми в закрытой экосистеме в долгосрочной перспективе, Llama должна эволюционировать в полноценную экосистему, включающую инструменты, улучшения эффективности, оптимизацию кремния и другие интеграции. Если бы мы были единственной компанией, использующей Llama, эта экосистема не развивалась бы, и мы были бы не лучше, чем закрытые варианты Unix.

Во-вторых, я ожидаю, что конкуренция будет усиливаться по мере роста интеллекта, что означает, что в этот момент открытие исходного кода какой-либо конкретной модели не даст преимущества перед следующей моделью с большими преимуществами. Путь для Llama стать отраслевым стандартом - это последовательная конкуренция, эффективность и открытие исходного кода поколение за поколением моделей.

В-третьих, ключевое отличие Meta от поставщиков моделей с закрытым исходным кодом заключается в том, что