AI大模型的方向劃分
目前大多數企業利用AI的方式是使用通用語言大模型,用本行業數據訓練後稱為差異化應用。但這可能是取巧之舉。Zapier聯合創始人Mike Knoop認為,擴大語言大模型本質上只能推動"記憶"這種智力形式的發展,與智能有區別。它無法理解企業的場景和需求,因此也無法充分發揮AI的價值。
另外,GPU算力投入增加與語言大模型能力提升的曲線可能存在邊際收益遞減。當公開簡易數據用盡後,再想依靠通用語言大模型在AI領域彎道超車將成為幻想。
對企業而言更為不利。企業在追求新技術過程中常常本末倒置,最初想解決具體問題,結果變成概念追逐戰,反而忘記了最根本的問題。
解決這個問題的方法掌握在AI企業手中。Benchmark合夥人Sarah Tavel認為,最佳發展方向是基於客戶具體需求開展大模型創業。Scale AI聯合創始人Alex Wang則認為,數據是AI模型性能的瓶頸,而非算法或計算。數據最終來自多個垂直行業,意味著AI企業應深入行業領域,開發符合企業需求的行業大模型。
這個過程有兩個關鍵點:
-
數據問題:AI公司需要"讀懂"用戶和行業。許多公司擁有大量未被充分利用的數據語料。
-
管理和迭代問題:由於行業和場景多樣,目前難以支持一家公司橫跨所有領域建造大模型。
第四範式和Zapier的Mike Knoop都將關鍵指向自動化。技術方面,AutoML、程序合成和神經架構搜索都涉及自動化和優化過程,以減少人工干預,提高效率和效果。Mike Knoop認為AGI探索需要基於程序合成和神經架構搜索,而第四範式創始人戴文淵則提到,構建無數個行業大模型的底座技術是AutoML。
戴文淵稱AutoML是"一個失敗的藝術",它能發揮更大價值是因為第四範式經歷過眾多場景,懂得如何讓數據和模型向特定場景需求靠攏。成功轉化為成果,失敗變成養料,基於自動化加速迭代。如Alex Wang所說:"機器學習是一種垃圾輸入、垃圾輸出的框架。"但有高質量行業數據和不斷糾錯能力,最終將實現行業大模型的可靠落地。
做不同的AI模型,想法、途徑和前景
以OpenAI為代表的一些專注通用大模型的企業,發展趨於橫向,大模型就是一切。商業模式上,它們單純售賣大模型能力。相比之下,第四範式、Glean等公司走另一條路,利用AI技術幫企業在某些方面做決策以提升整體工作效果。它們的商業模式也不同。
Glean提供基於AI技術打造的企業搜索和知識管理平台,集成多個第三方應用功能,成為工作流的一部分。它還可幫企業用自身數據訓練專屬AI模型,基於Glean自主打造的"可信知識模型"。
第四範式則更深入到行業核心業務問題的預測管理。其行業大模型平台先知AIOS 5.0基於各行各業場景的X模態數據,構建行業基座大模型。在能力層面側重於"Predict the Next X",X代表各大行業的邏輯和結果。在使用層面提供低門檻建模工具、科學家創新服務體系等能力,實現端到端的行業大模型構建、部署、管理服務。
這是中國AI公司基於產業背景發展的典型案例。戴文淵認為,中國有大量場景和數據優勢,覆蓋足夠多場景後,拼接這些模型可能也實現了AGI。相比之下,許多流行的行業大模型仍是行業大語言模型,大而不精。劃分到更精準場景後,雖然表面上需要建立很多個大模型,但每個精準場景的數據量負載有限,加上自動化技術的幫助,反而另闢蹊徑實現了AGI在應用層面的發展。
Mike Knoop認為,AGI之所以在狂飆突進後遇到上行阻礙,是因為過度依賴語言大模型,將AGI定義為能完成大多數工作的系統。但AGI實際上應更側重高效獲取新能力,解決各種場景下的開放性問題。
英偉達CEO黃仁勳提到,隨著大模型發展,計算機從指令驅動轉向意圖驅動,"將來的應用程序所做的和執行的都會與我們做事的方式相似,組建專家團隊,使用工具、推理、計劃和執行我們的任務"。這一邏輯本身就意味著通用性,大模型正在進入物理世界,因為物理世界的決策同樣有跡可循。
類似的例子如Palantir,原本是一家To G的大數據公司,基於數據分析和建模仿真輔助決策。生成式AI技術使其處理數據方式發生轉變,在自動化與數據決策方面進步顯著,加速了AI To B業務的開拓。第四範式則在每個具有確定性的場景中建立行業大模型,助力企業掌握自己的應用,做出有效決策。