01 訓練大型模型很昂貴,Meta 如何賺回成本?
Meta 的印鈔機業務——資訊流和推薦系統,正在被大型模型"動搖"
黃仁勳:Mark,歡迎你第一次來到 SIGGRAPH。你能相信嗎?作為計算機領域的先驅之一,現代計算的推動者,我居然要邀請你來 SIGGRAPH,很高興你能來。
祖克柏:是啊,應該會很有趣。你已經講了大約五個小時了吧?
黃仁勳:是的,這就是 SIGGRAPH,這裡 90% 都是博士。SIGGRAPH 最棒的地方在於,這是一個結合了計算機圖形學、圖像處理、人工智慧和機器人技術的展會。多年來,許多公司在這裡展示和揭示了令人驚嘆的東西,比如迪士尼、皮克斯、Adobe、Epic Games,當然還有英偉達。
今年在這裡做了很多工作:我們在人工智慧和模擬(simulation)的交叉領域發表了 20 篇論文;我們正在使用 AI 來幫助模擬(simulation)這件事以更大規模、更快速度運行。例如,可微分物理(differentiable physics),我們正在使用模擬來為人工智慧創建模擬環境,用於合成數據生成,這兩個領域正在真正融合。
Meta,其實在 AI 方面做了令人驚嘆的工作。我覺得有趣的是,當媒體寫到 Meta 在過去幾年突然投入 AI 時,好像不知道 FAIR(Facebook AI Research,Meta 的人工智慧研究部門,成立於 2013 年)過往的成就。事實上,我們都在使用來自 Meta 開源的深度學習框架 PyTorch(人工智慧研究和開發中不可或缺的工具),並且,Meta 在計算機視覺、語言模型、即時翻譯方面的工作都是開創性的。
我想問你的第一個問題是,你如何看待 Meta 在生成式 AI 的進展?它將如何增強你們的業務或引入新的能力?
祖克柏:相比你們,我們還是新手。但是,Meta 參加 SIGGRAPH 已經有八年了。在 2018 年,我們最早展示了一些手部追蹤工作,用於我們的 VR 和混合現實頭顯。我們也已經討論了很多在編解碼器化身(codec avatars)方面取得的進展,用以在消費級頭顯裡展示的逼真化身(avatar)。
還有我們在顯示系統方面所做的大量工作,一些未來的原型和研究,讓混合現實頭顯能夠變得非常薄。我想要的是,非常先進的光學堆疊、顯示系統和整合系統。
所以很高興能來到這裡,今年,不僅僅是談論元宇宙,還有關於 AI 的一切。如你所說,我們在開始 Reality Labs(Meta 元宇宙研發部門)之前,就成立了 FAIR,那時候我們還叫 Facebook,現在當然叫 Meta。所以在 AI 上,我們有多年的積累。
關於生成式 AI,這是一場有趣的革命,我認為它最終會徹底改變我們所做的所有產品。### 比如,Instagram 和 Facebook 的資訊流和推薦系統,我們已經演化了數十年,AI 還將進一步改變它。
最初的資訊流只是有關朋友的聯繫,在這種情況下,資訊流的排序是關鍵。因為如果有人做了非常重要的事情,比如你表弟生了孩子之類的,你希望它出現在頂部。如果我們把它埋在你的資訊流的某個角落,你會非常生氣。
但### 過去幾年,資訊流已經發展到另一個階段,你需要的內容展示更多是關於公共內容。在這種情況下,推薦系統變得超級重要。因為不僅僅是來自朋友的幾百、幾千個貼文等著被展示到你面前,而是有數百萬條內容,這變成了一個非常有趣的推薦問題。
而有了生成式 AI,我們很快會進入一個新階段。今天你在 Instagram 上看到的大部分內容都是推薦給你的、世界上有人寫下的、與你興趣相匹配的內容,無論你是否關注了這些人。但在未來,### 其中一些將是創作者使用工具創建的新內容,甚至有些內容將是為你即時創建的,或者是通過綜合現有的不同內容而產生的。
這只是一個例子,說明我們正在做的核心業務將如何演變,它已經演變了 20 年了,但很少有人意識到。
揭秘 Llama4,讓 AI 助手在 Meta 全家桶中"解鎖"智能體
黃仁勳:不過,人們意識到,世界上最大的計算系統之一就是推薦系統。
祖克柏:這是一個完全不同的路徑,它不完全是人們現在談論的生成式 AI。儘管它都是 Transformer 架構,都在構建越來越通用的系統,將非結構化數據嵌入到特徵中。
但兩種方式產生了質的差別,過去我們為不同類型的內容訓練不同的模型,比如一個模型用於 Meta 短視頻 APP Reels 的排序和推薦,另一個模型用於長視頻的排序和推薦。然後,你需要做一些產品工作,使系統能夠內聯顯示任何內容。
隨著你創建越來越多的通用推薦模型,它就變得越來越好,因為你可以從更廣泛的內容池子中抽取,而不是像從不同池子裡抽取一樣低效率。
現在,隨著模型變得更大更通用,它會變得越來越好。### 我夢想有一天,Facebook 或 Instagram 的全部內容,就像一個單一的 AI 模型在驅動,它統一了所有這些不同的內容類型和系統。在現實中,不同的時間段 APP 有不同的推薦目標,其中一些只是為了向你展示你今天想看的有趣內容,但有些是幫助你建立你的長期人脈網絡,在這種情況下,這些多模態模型往往更擅長識別模式、弱信號等。
黃仁勳:原來 AI 在你的公司中用得如此深入。你們一直在構建 GPU 基礎設施,運行這些大型推薦系統已經有很長時間了。
祖克柏:實際上在使用 GPU 方面有點慢。
黃仁勳:是的,你好像承認錯誤一樣,不必主動提出來(哈哈)。
現在,用 AI 真正酷的地方在於,當我使用 WhatsApp 時,我感覺我在與 WhatsApp"合作"。想像我在打字,它順著我打字的意思接著生成圖像。當我改變我的用詞,它又生成其他圖像。比如我輸入,一個老中國人在日落時享受一杯威士忌,旁邊有三隻狗;它就生成一張相當不錯的圖片。
祖克柏:一方面,我認為生成式 AI 將成為我們長期以來所有工作流程和產品的一個巨大升級。
但另一方面,所有這些全新的東西可以被創造、生成出來。就像 Meta AI 這樣的 AI 助手,可以幫助你完成不同的任務。在我們的世界裡,它將會是非常具有創造性的,它將能夠隨著時間的推移回答任何問題。
未來,當我們從 Llama 3 的模型切換至 Llama 4 及以後的版本,我認為 Meta AI 就不再只像一個聊天機器人,你問一句他答一句了。取而代之地,他會在理解你的意圖後,在多個時間框架內自主工作。比如,你一開始給了他一個意圖,它會啟動,在幾週或幾個月的計算任務後,他會回來告訴你結果,我認為這將非常強大。
黃仁勳:就像你說的,今天的 AI,是一來一回、有問有答的方式,但顯然,人類的思考不是這樣。當我們被給予一個任務或一個問題時,我們會考慮多個選項,可能會想出一個決策樹,我們在腦海中模擬運行,每個決定的不同結果是什麼。像這樣的規劃、決策,未來 AI 也能做類似的事情。
當你談到對創作者 AI 的願景時,我聽了非常興奮,不妨告訴大家你的計劃。
祖克柏:我們已經談論過一點,但我們今天正在更廣泛地推出它。我不認為只會有一個 AI 模型,這是行業中一些其他公司的做法,建立一個中心化的智能體。
我們不一樣,我們會有 Meta AI 助手供你使用,但我們### 想讓所有使用 Meta 產品的人都有自己創建智能體的能力。無論是,平台上的數百萬創作者,還是數億小企業,都能快速建立一個業務智能體,能夠與你的客戶互動,比如銷售和服務客戶等。
所以 Meta 現在開始推出更多的是,我們稱之為### AI Studio,它是一套工具,最終將使每個創作者都能建立某種 AI 版本的自己,作為一種代理或助手,社群成員可以與之互動。
如果你是一個創作者,想與你的社群有更多的互動,你其實是受到時間、精力限制的。更好的選擇是能讓人們創建這些 AI,它可以基於你的語料把它訓練成你想要的方式,來代表你。你非常清楚,不是在與創作者本人互動,但這是另一種有趣的方式,就像真人創作者在這些社交系統上發布內容一樣,能夠有代理來做這件事。
同樣,我認為人們會為自己的業務創建這些智能體。