扎克伯格談AI未來:智能體將超人類,回應蘋果公開信

開放原始碼代表著技術發展的方向。

在7月24日凌晨,Meta發布了目前最強大的開源大模型Llama 3.1。同時,扎克伯格接受了"The Rundown AI"創始人Rowan Cheung的採訪,討論了Llama 3.1以及他對AI發展的看法。

扎克伯格認為,從長遠來看,開源模型創造的生態比封閉模型更安全。他預測AI智能體最終會像電子郵件和社交帳號一樣,成為企業必備的工具。他表示:"最終,AI智能體甚至可能會比人類還多,人們會以各種方式與之互動。顯然,這也是一個巨大的商機。"

以下是採訪的主要內容:

Rowan Cheung: 馬克,非常感謝你來做這次訪談。今天Meta發了重磅AI模型,你能概述一下發布的內容及其重要性嗎?

馬克·扎克伯格: 今天我們發布的是Llama 3.1,我們發布了三個模型。這是我們首次發布4050億參數的模型。這是目前為止最複雜的開源模型。和一些領先的封閉模型相比,它很有競爭力,在某些領域上的表現甚至還超越了封閉模型。

我非常期待看到人們如何利用它,特別是現在我們的社區政策允許人們使用Llama作為教師模型來進行蒸餾和微調,基本上可以用它創建任何其他模型。

除此之外,我們還將4050億參數模型蒸餾成了更新、更領先的700億和80億參數模型。這些模型的性能也非常好,性價比也很高。我很期待看到大家如何使用這些模型。

我認為這是開源AI的重要時刻。我想了挺長一段時間,我認為開源AI會成為行業標準,我認為它會遵循Linux的發展路徑。

在Linux流行之前,有很多公司想著有自己的封閉版Unix,當時沒有任何複雜的開源項目。人們會覺得,封閉開發模式是唯一一種可以做複雜產品的開發方式。

起初,Linux的立足點是建立在它更便宜,而且開發者可以定制化的基礎上。隨著生態的發展,它有更多的審查,變得更安全、更高級。更多的夥伴在Linux基礎上建立了更多功能,最後讓它變得和其他封閉Unix一樣好用。

現在,我認為Llama 3.1有機會成為開源AI標準,使開源成為AI行業標準。即使它在性能上還沒有超越封閉模型,但在成本和可定制性上有很大的優勢。我認為這些是開發者們會利用的優勢。

我們正在專注搭建一個合作夥伴生態系統,圍繞著它,我們將看到很多不同的功能被搭建起來。

Rowan Cheung: 我看到了所有的基準測試,結果令人難以置信。顯然,這是第一個4050億參數的開源前沿模型。有沒有哪些具體的實際應用案例,是你特別期待人們會用這個模型來構建的?

馬克·扎克伯格: 我最期待看到的是,人們用它來蒸餾和精調自己的模型。就像你所說的,這是第一個開源前沿級模型,但它不是第一個前沿級模型。之前已經有其他具有這種能力的模型。

人們會想要直接在4050億參數模型上進行推理,因為我們估計它比GPT-4o便宜50%。對於很多人來說,這能帶來些影響。

然而,我認為這個模型真正新穎的地方在於,它是開源權重的,能夠將其蒸餾成任何你想要的大小,用於合成數據生成,作為教師模型使用。

對於未來,我們不認為它會是屬於單一事物的。就像,OpenAI的願景是搭建一個"大AI",Anthropic和Google也有類似的願景。

但那從來不是我們的願景。我們的願景是未來應該有許多不同的模型。我認為每個創業公司、大企業、每個政府都想擁有自己的定制模型。

當封閉系統比開源好很多時,使用封閉模型的確更方便。雖然開源模型可以自定義,但在性能上還是有差距。

現在情況不同了。開源模型在性能上的差距基本上已經追上。你會看到更多人有動力去定制和構建適合自己需求的模型,用自己的數據訓練,合適自己規模的模型。

他們也會有工具去這樣做,因為Amazon的AWS和Databricks等公司正在構建完整的服務套件,用於蒸餾和微調開源模型。

在我看來,這是現在的新情況。我們很期待這個趨勢能被推進到什麼程度。這是世界上前所未有的新能力,因為以前沒有一個開源或開源權重模型達到過這種複雜程度。

Rowan Cheung: 這的確是一件大事。你們將如何教育開發者使用這些工具?更廣泛來說,Meta是否有計劃或策略去向世界科普開源模型和它的重要性?

馬克·扎克伯格: 在Llama 3.1之前,Meta在這方面投資的根本原因是,我們要確定自己能用上領先的模型。由於我們的歷史,特別是移動端的歷史,我們不想依賴某個競爭對手的基礎技術。所以我們為自己構建了模型。

在Llama 3.1之前,我們本能地認為,如果我們開源,它會吸引來一個社區圍繞它成長,擴展其功能,使其對所有人更有價值,包括我們自己。因為最終,這不僅僅是一項技術,它是一個生態系統。為了讓它對我們更有用,還需要一個廣泛的生態系統。

Lama 3.1帶來的一個大變化是,我們不再只是為自己構建,然後扔出去讓開發者使用,而是更積極地建立合作夥伴關係,確保有一整個生態系統的公司,都可以用這個模型去做有趣的事情,並以我們無法做到的方式為開發者服務。

我們不是雲服務提供商,不是AWS、Google或Azure,所以開發者不會來找我們構建他們的東西,但我們要確保所有這些雲服務商都能夠很好地使用這個模型。

這不僅涉及到托管和推理,還包括一些新功能,比如蒸餾和微調,這些功能在封閉模型中不太容易實現,所以我們必須與合作夥伴進行具體工作來實現這些功能。

與此同時,也會有像Groq這樣專注於超低延遲推理的公司。我很開心能把它交到Groq手上,他們現在在用它來建新東西。

還有一系列企業,比如Dell、Scale AI、Deloitte或Accenture,他們與全球企業合作進行技術部署。我認為這些公司會幫助構建定制模型。

無論是大企業還是政府,很多公司都希望擁有自己的模型並能訓練自己數據。不少公司不願意通過API將數據傳給Google或OpenAI,並不是因為這些公司存在隱私問題。

那更像人們愛用WhatsApp端到端加密那樣,他們希望在結構設計上就是安全的,數據也可以保留在自己手上。

我認為這方面也會有一個市場建立起來。我對此非常興奮。

這次我們在建立生態系統方面採取了更積極的態度,因為我認為這是它成長並對每個人創造更多價值的方法。

Rowan Cheung: 我喜歡你們與開發者社區的緊密聯繫。我自己也是社區的一員,知道大家確實需要這些私有和本地模型。接下來聊聊你的公開信,除了Meta的公告,你還發表了一封信,第一部分重點介紹了開源對開發者的好處,感覺說得很準。你能多談談開源AI對社會的廣泛影響嗎?

馬克·扎克伯格: 我的觀點是,開源是實現一個好的AI未來的重要因素。AI會帶來很多生產力和創造力的提升,希望還能幫助我們做研究等等。

我認為,開源是確保AI可以惠及所有人,讓人人都能使用的重要部分,而不是讓AI僅僅鎖在少數大公司手中。

同時,我認為開源將是更安全、更可靠的AI開發方式。

現在有一種關於開源安全性的爭論——"開源真的安全嗎?"

我的看法不同。我認為開源不僅安全,還比封閉開發更安全。

我們可以將風險分為"無意"和"有意"兩種。"無意"的風險是系統以某種方式失控,這也是大多數科幻小說中AI失控的情景。

我認為開源在這方面更安全,因為有更多的審查、更透明。所有開發者使用它時,也會有安全指引和安全工具,也有很多審查和測試壓力,就像傳統的開源軟件一樣。和封閉模型相比,問題會被更快地發現和解決。