Meta開源4050億參數大模型:Llama 3.1正式發布

Meta迅速動員開源社群,為OpenAI施加競爭壓力。

以下是扎克伯格的公開信,由"AI Emergence"翻譯:

"開源人工智能是前進的道路"

在高性能計算的早期,當時的主要科技公司都大量投資開發自己的閉源Unix版本。當時很難想像還有其他方式來開發如此先進的軟件。

然而,開源的Linux最終變得流行 - 最初是因為它允許開發者按自己的意願修改代碼,而且更便宜;隨著時間推移,它變得更先進、更安全,並擁有比任何閉源Unix更廣泛的生態系統,支持更多功能。如今,Linux是雲計算的行業標準基礎,也是運行大多數移動設備的操作系統 - 我們都從其優秀的產品中受益。

我相信人工智能將以類似的方式發展。今天,一些科技公司正在開發領先的閉源模型。但開源正在迅速縮小這個差距。去年,Llama 2只能與落後於前沿的舊一代模型競爭。今年,Llama 3與最先進的模型競爭,並在某些領域領先。從明年開始,我們預計未來的Llama將成為業界最先進的。但即使在那之前,Llama在開放性、可修改性和成本效益方面已經領先。

今天,我們正在邁出下一步,使開源人工智能成為行業標準。我們正在發布Llama 3.1 405B - 第一個達到行業領先水平的開源人工智能模型 - 以及新的和改進的Llama 3.1 70B和8B模型。除了與閉源模型相比具有更好的成本/性能比之外,405B模型是開源的這一事實將使其成為微調和提取較小模型的最佳選擇。

除了發布這些模型外,我們還與一系列公司合作開發更廣泛的生態系統。亞馬遜、Databricks和英偉達正在推出全套服務,以支持開發者微調和完善自己的模型。像Groq(一家人工智能芯片初創公司)這樣的創新公司為所有新模型建立了低延遲、低成本的推理服務。

這些模型將在所有主要雲平台上可用,包括AWS、Azure、Google、Oracle等。Scale.AI、Dell、德勤等公司已準備好幫助企業部署Llama並使用自己的數據訓練定制模型。隨著社區的發展和更多公司開發新服務,我們可以共同使Llama成為行業標準,並將人工智能的好處帶給每個人。

Meta致力於開源人工智能。我將概述為什麼我認為開源是對人們最好的開發堆棧,為什麼開源Llama對Meta有好處,為什麼開源人工智能對世界有好處,以及為什麼,因為這一點,開源社區將長期存在。

為什麼開源人工智能對開發者有好處

當我與世界各地的開發者、CEO和政府官員交談時,我通常會聽到以下主題:

我們需要訓練、微調和完善我們自己的模型。

每個組織都有不同的需求,不同大小的模型可以最好地滿足這些需求,通過特定數據進行訓練或微調。設備上的任務和分類任務需要較小的模型,而更複雜的任務需要較大的模型。

現在,你將能夠使用最先進的Llama模型,繼續用你自己的數據訓練它們,然後將它們完善到你的最佳大小模型 - 而我們或其他任何人都不會看到你的數據。

我們需要控制自己的命運,而不受閉源供應商的束縛。

許多組織不想依賴他們無法運行和控制的模型。他們不希望閉源模型提供商能夠改變他們的模型、改變使用條款,甚至完全停止服務。他們也不想被鎖定在擁有特定模型獨家權利的單一雲平台上。開源提供了一個與許多公司兼容的工具生態系統,你可以輕鬆在它們之間切換。

我們需要保護我們的數據。

許多組織處理需要保護的敏感數據,這些數據不能通過雲API傳輸到閉源模型。其他組織simply不信任閉源模型提供商處理他們的數據。開源通過允許你在任何地方運行模型來解決這些問題。人們普遍認為開源軟件更安全,因為開發過程更透明。

我們需要一個高效且負擔得起的運營模型。

開發者可以在自己的基礎設施上運行Llama 3.1 405B的推理,成本約為使用像GPT-4o這樣的閉源模型進行面向用戶和離線推理任務的50%。

我們正在押注一個可以成為長期標準的生態系統。

許多人看到開源的發展速度比閉源模型更快,他們希望以一種能給他們帶來最大長期優勢的方式構建系統架構。

為什麼開源人工智能對Meta有好處

Meta的商業模式是為人們建立最好的體驗和服務。為此,我們需要確保我們始終能夠獲得最好的技術,而不是被鎖定在競爭對手的封閉生態系統中,這會限制我們能夠建立的東西。

我的一個重要經歷是我們的服務如何受到蘋果允許我們在其平台上構建的限制。他們對開發者徵稅的方式、他們應用的任意規則,以及他們阻止發布的所有產品創新,都清楚地表明,如果我們能夠在不受競爭對手限制的情況下構建最好版本的產品,Meta和許多其他公司就能為人們提供更好的服務。

從哲學上講,這是我如此堅定地相信為下一代計算在人工智能和AR/VR領域建立開源生態系統的主要原因。

人們經常問我是否擔心通過開源Llama放棄技術優勢,但我認為這忽視了一些重要原因:

首先,為了確保我們能夠長期獲得最好的技術,而不是被鎖定在封閉的生態系統中,Llama需要發展成為一個完整的生態系統,包括工具、效率改進、硅優化和其他集成。如果我們是唯一使用Llama的公司,這個生態系統就不會發展,我們的處境不會比封閉的Unix變體好。

其次,我預計隨著智能的增長,競爭將會加劇,這意味著在那時,開源任何特定模型都不會放棄對下一個具有更大優勢的模型的優勢。Llama成為行業標準的道路是通過持續競爭、高效和一代又一代地開源模型。

第三,Meta與閉源模型提供商的一個關鍵區別是