大模型挑战社交媒体与XR:扎克伯格与黄仁勋对话

打造价值百亿美元的开源大模型是一种精心设计的商业策略。

以下是翻译:

01 训练大模型很贵,Meta如何赚回本钱?

Meta的印钞机业务——信息流和推荐系统,正在被大模型"动摇"

黄仁勋:Mark,欢迎你第一次来到SIGGRAPH。你能相信吗?作为计算机领域的先驱之一,现代计算的推动者,我居然要邀请你来SIGGRAPH,很高兴你能来。

扎克伯格:是啊,应该会很有趣。你已经讲了大约五个小时了吧?

黄仁勋:是的,这就是SIGGRAPH,这里90%都是博士。SIGGRAPH最棒的地方在于,这是一个结合了计算机图形学、图像处理、人工智能和机器人技术的展会。多年来,许多公司在这里展示和揭示了令人惊叹的东西,比如迪士尼、皮克斯、Adobe、Epic Games,当然还有英伟达。

今年在这里做了很多工作:我们在人工智能和仿真(simulation)的交叉领域发表了20篇论文;我们正在使用AI来帮助仿真或者说模拟(simulation)这件事以更大规模、更快速度运行。例如,可微分物理(differentiable physics),我们正在使用仿真来为人工智能创建模拟环境,用于合成数据生成,这两个领域正在真正融合。

Meta,其实在AI方面做了令人惊叹的工作。我觉得有趣的是,当媒体写到Meta在过去几年突然投入AI时,好像不知道FAIR(Facebook AI Research,Meta的人工智能研究部门,成立于2013年)过往的成就。事实上,我们都在使用来自Meta开源的深度学习框架PyTorch(人工智能研究和开发中不可或缺的工具),并且,Meta在计算机视觉、语言模型、实时翻译方面的工作都是开创性的。

我想问你的第一个问题是,你如何看待Meta在生成式AI的进展?它将如何增强你们的业务或引入新的能力?

扎克伯格:相比你们,我们还是新手。但是,Meta参加SIGGRAPH已经有八年了。在2018年,我们最早展示了一些手部追踪工作,用于我们的VR和混合现实头显。我们也已经讨论了很多在编解码器化身(codec avatars)方面取得的进展,用以在消费级头显里展示的逼真化身(avatar)。

还有我们在显示系统方面所做的大量工作,一些未来的原型和研究,让混合现实头显能够变得非常薄。我想要的是,非常先进的光学堆栈、显示系统和集成系统。

所以很高兴能来到这里,今年,不仅仅是谈论元宇宙,还有关于AI的一切。如你所说,我们在开始Reality Labs(Meta元宇宙研发部门)之前,就成立了FAIR,那时候我们还叫Facebook,现在当然叫Meta。所以在AI上,我们有多年的积累。

关于生成式AI,这是一场有趣的革命,我认为它最终会彻底改变我们所做的所有产品。### 比如,Instagram和Facebook的信息流和推荐系统,我们已经演化了数十年,AI还将进一步改变它。

最初的信息流只是有关朋友的联系,在这种情况下,信息流的排序是关键。因为如果有人做了非常重要的事情,比如你表弟生了孩子之类的,你希望它出现在顶部。如果我们把它埋在你的信息流的某个角落,你会非常生气。

但### 过去几年,信息流已经发展到另一个阶段,你需要的内容展示更多是关于公共内容。在这种情况下,推荐系统变得超级重要。因为不仅仅是来自朋友的几百、几千个帖子等着被展示到你面前,而是有数百万条内容,这变成了一个非常有趣的推荐问题。

而有了生成式AI,我们很快会进入一个新阶段。今天你在Instagram上看到的大部分内容都是推荐给你的、世界上有人写下的、与你兴趣相匹配的内容,无论你是否关注了这些人。但在未来,### 其中一些将是创作者使用工具创建的新内容,甚至有些内容将是为你即时创建的,或者是通过综合现有的不同内容而产生的。

这只是一个例子,说明我们正在做的核心业务将如何演变,它已经演变了20年了,但很少有人意识到。

揭秘Llama4,让AI助手在Meta全家桶中"解锁"智能体

黄仁勋:不过,人们意识到,世界上最大的计算系统之一就是推荐系统。

扎克伯格:这是一个完全不同的路径,它不完全是人们现在谈论的生成式AI。尽管它都是Transformer架构,都在构建越来越通用的系统,将非结构化数据嵌入到特征中。

但两种方式产生了质的差别,过去我们为不同类型的内容训练不同的模型,比如一个模型用于Meta短视频APP Reels的排序和推荐,另一个模型用于长视频的排序和推荐。然后,你需要做一些产品工作,使系统能够内联显示任何内容。

随着你创建越来越多的通用推荐模型,它就变得越来越好,因为你可以从更广泛的内容池子中抽取,而不是像从不同池子里抽取一样低效率。

现在,随着模型变得更大更通用,它会变得越来越好。### 我梦想有一天,Facebook或Instagram的全部内容,就像一个单一的AI模型在驱动,它统一了所有这些不同的内容类型和系统。在现实中,不同的时间段APP有不同的推荐目标,其中一些只是为了向你展示你今天想看的有趣内容,但有些是帮助你建立你的长期人脉网络,在这种情况下,这些多模态模型往往更擅长识别模式、弱信号等。

黄仁勋:原来AI在你的公司中用得如此深入。你们一直在构建GPU基础设施,运行这些大型推荐系统已经有很长时间了。

扎克伯格:实际上在使用GPU方面有点慢。

黄仁勋:是的,你好像承认错误一样,不必主动提出来(哈哈)。

现在,用AI真正酷的地方在于,当我使用WhatsApp时,我感觉我在与WhatsApp"合作"。想象我在打字,它顺着我打字的意思接着生成图像。当我改变我的用词,它又生成其他图像。比如我输入,一个老中国人在日落时享受一杯威士忌,旁边有三只狗;它就生成一张相当不错的图片。

扎克伯格:一方面,我认为生成式AI将成为我们长期以来所有工作流程和产品的一个巨大升级。

但另一方面,所有这些全新的东西可以被创造、生成出来。就像Meta AI这样的AI助手,可以帮助你完成不同的任务。在我们的世界里,它将会是非常具有创造性的,它将能够随着时间的推移回答任何问题。

未来,当我们从Llama 3的模型切换至Llama 4及以后的版本,我认为Meta AI就不再只像一个聊天机器人,你问一句他答一句了。取而代之地,他会在理解你的意图后,在多个时间框架内自主工作。比如,你一开始给了他一个意图,它会启动,在几周或几个月的计算任务后,他会回来告诉你结果,我认为这将非常强大。

黄仁勋:就像你说的,今天的AI,是一来一回、有问有答的方式,但显然,人类的思考不是这样。当我们被给予一个任务或一个问题时,我们会考虑多个选项,可能会想出一个决策树,我们在脑海中模拟运行,每个决定的不同结果是什么。像这样的规划、决策,未来AI也能做类似的事情。

当你谈到对创作者AI的愿景时,我听了非常兴奋,不妨告诉大家你的计划。

扎克伯格:我们已经谈论过一点,但我们今天正在更广泛地推出它。我不认为只会有一个AI模型,这是行业中一些其他公司的做法,建立一个中心化的智能体。

我们不一样,我们会有Meta AI助手供你使用,但我们### 想让所有使用Meta产品的人都有自己创建智能体的能力。无论是,平台上的数百万创作者,还是数亿小企业,都能快速建立一个业务智能体,能够与你的客户互动,比如销售和服务客户等。

所以Meta现在开始推出更多的是,我们称之为### AI Studio,它是一套工具,最终将使每个创作者都能建立某种AI版本的自己,作为一种代理或助手,社区成员可以与之互动。

如果你是一个创作者,想与你的社区有更多的互动,你其实是受到时间、精力限制的。更好的选择是能让人们创建这些AI,它可以基于你的语料把它训练成你想要的方式,来代表你。你非常清楚,不是在与创作者本人互动,但这是另一种有趣的方式,就像真人创作者在这些社交系统上发布内容一样,能够有代理来做这件事。

同样,我认为人们会为自己的业务创建这些智能体。