中国AI企业的创新之路

许多公司现在都声称自己在人工智能领域有所涉足,但是仅仅跟随潮流并不意味着能够创造长期价值。

AI大模型的方向划分

目前大多数企业利用AI的方式是使用通用语言大模型,用本行业数据训练后称为差异化应用。但这可能是取巧之举。Zapier联合创始人Mike Knoop认为,扩大语言大模型本质上只能推动"记忆"这种智力形式的发展,与智能有区别。它无法理解企业的场景和需求,因此也无法充分发挥AI的价值。

另外,GPU算力投入增加与语言大模型能力提升的曲线可能存在边际收益递减。当公开简易数据用尽后,再想依靠通用语言大模型在AI领域弯道超车将成为幻想。

对企业而言更为不利。企业在追求新技术过程中常常本末倒置,最初想解决具体问题,结果变成概念追逐战,反而忘记了最根本的问题。

解决这个问题的方法掌握在AI企业手中。Benchmark合伙人Sarah Tavel认为,最佳发展方向是基于客户具体需求开展大模型创业。Scale AI联合创始人Alex Wang则认为,数据是AI模型性能的瓶颈,而非算法或计算。数据最终来自多个垂直行业,意味着AI企业应深入行业领域,开发符合企业需求的行业大模型。

这个过程有两个关键点:

  1. 数据问题:AI公司需要"读懂"用户和行业。许多公司拥有大量未被充分利用的数据语料。

  2. 管理和迭代问题:由于行业和场景多样,目前难以支持一家公司横跨所有领域建造大模型。

第四范式和Zapier的Mike Knoop都将关键指向自动化。技术方面,AutoML、程序合成和神经架构搜索都涉及自动化和优化过程,以减少人工干预,提高效率和效果。Mike Knoop认为AGI探索需要基于程序合成和神经架构搜索,而第四范式创始人戴文渊则提到,构建无数个行业大模型的底座技术是AutoML。

戴文渊称AutoML是"一个失败的艺术",它能发挥更大价值是因为第四范式经历过众多场景,懂得如何让数据和模型向特定场景需求靠拢。成功转化为成果,失败变成养料,基于自动化加速迭代。如Alex Wang所说:"机器学习是一种垃圾输入、垃圾输出的框架。"但有高质量行业数据和不断纠错能力,最终将实现行业大模型的可靠落地。

做不同的AI模型,想法、途径和前景

以OpenAI为代表的一些专注通用大模型的企业,发展趋于横向,大模型就是一切。商业模式上,它们单纯售卖大模型能力。相比之下,第四范式、Glean等公司走另一条路,利用AI技术帮企业在某些方面做决策以提升整体工作效果。它们的商业模式也不同。

Glean提供基于AI技术打造的企业搜索和知识管理平台,集成多个第三方应用功能,成为工作流的一部分。它还可帮企业用自身数据训练专属AI模型,基于Glean自主打造的"可信知识模型"。

第四范式则更深入到行业核心业务问题的预测管理。其行业大模型平台先知AIOS 5.0基于各行各业场景的X模态数据,构建行业基座大模型。在能力层面侧重于"Predict the Next X",X代表各大行业的逻辑和结果。在使用层面提供低门槛建模工具、科学家创新服务体系等能力,实现端到端的行业大模型构建、部署、管理服务。

这是中国AI公司基于产业背景发展的典型案例。戴文渊认为,中国有大量场景和数据优势,覆盖足够多场景后,拼接这些模型可能也实现了AGI。相比之下,许多流行的行业大模型仍是行业大语言模型,大而不精。划分到更精准场景后,虽然表面上需要建立很多个大模型,但每个精准场景的数据量负载有限,加上自动化技术的帮助,反而另辟蹊径实现了AGI在应用层面的发展。

Mike Knoop认为,AGI之所以在狂飙突进后遇到上行阻碍,是因为过度依赖语言大模型,将AGI定义为能完成大多数工作的系统。但AGI实际上应更侧重高效获取新能力,解决各种场景下的开放性问题。

英伟达CEO黄仁勋提到,随着大模型发展,计算机从指令驱动转向意图驱动,"将来的应用程序所做的和执行的都会与我们做事的方式相似,组建专家团队,使用工具、推理、计划和执行我们的任务"。这一逻辑本身就意味着通用性,大模型正在进入物理世界,因为物理世界的决策同样有迹可循。

类似的例子如Palantir,原本是一家To G的大数据公司,基于数据分析和建模仿真辅助决策。生成式AI技术使其处理数据方式发生转变,在自动化与数据决策方面进步显著,加速了AI To B业务的开拓。第四范式则在每个具有确定性的场景中建立行业大模型,助力企业掌握自己的应用,做出有效决策。