大模型挑战社交媒体与XR：扎克伯格与黄仁勋对话

以下是翻译：

01 训练大模型很贵，Meta如何赚回本钱？

Meta的印钞机业务——信息流和推荐系统，正在被大模型"动摇"

黄仁勋：Mark，欢迎你第一次来到SIGGRAPH。你能相信吗？作为计算机领域的先驱之一，现代计算的推动者，我居然要邀请你来SIGGRAPH，很高兴你能来。

扎克伯格：是啊，应该会很有趣。你已经讲了大约五个小时了吧？

黄仁勋：是的，这就是SIGGRAPH，这里90%都是博士。SIGGRAPH最棒的地方在于，这是一个结合了计算机图形学、图像处理、人工智能和机器人技术的展会。多年来，许多公司在这里展示和揭示了令人惊叹的东西，比如迪士尼、皮克斯、Adobe、Epic Games，当然还有英伟达。

今年在这里做了很多工作：我们在人工智能和仿真（simulation）的交叉领域发表了20篇论文；我们正在使用AI来帮助仿真或者说模拟（simulation）这件事以更大规模、更快速度运行。例如，可微分物理（differentiable physics），我们正在使用仿真来为人工智能创建模拟环境，用于合成数据生成，这两个领域正在真正融合。

Meta，其实在AI方面做了令人惊叹的工作。我觉得有趣的是，当媒体写到Meta在过去几年突然投入AI时，好像不知道FAIR（Facebook AI Research，Meta的人工智能研究部门，成立于2013年）过往的成就。事实上，我们都在使用来自Meta开源的深度学习框架PyTorch（人工智能研究和开发中不可或缺的工具），并且，Meta在计算机视觉、语言模型、实时翻译方面的工作都是开创性的。

我想问你的第一个问题是，你如何看待Meta在生成式AI的进展？它将如何增强你们的业务或引入新的能力？

扎克伯格：相比你们，我们还是新手。但是，Meta参加SIGGRAPH已经有八年了。在2018年，我们最早展示了一些手部追踪工作，用于我们的VR和混合现实头显。我们也已经讨论了很多在编解码器化身（codec avatars）方面取得的进展，用以在消费级头显里展示的逼真化身（avatar）。

还有我们在显示系统方面所做的大量工作，一些未来的原型和研究，让混合现实头显能够变得非常薄。我想要的是，非常先进的光学堆栈、显示系统和集成系统。

所以很高兴能来到这里，今年，不仅仅是谈论元宇宙，还有关于AI的一切。如你所说，我们在开始Reality Labs（Meta元宇宙研发部门）之前，就成立了FAIR，那时候我们还叫Facebook，现在当然叫Meta。所以在AI上，我们有多年的积累。

关于生成式AI，这是一场有趣的革命，我认为它最终会彻底改变我们所做的所有产品。### 比如，Instagram和Facebook的信息流和推荐系统，我们已经演化了数十年，AI还将进一步改变它。

最初的信息流只是有关朋友的联系，在这种情况下，信息流的排序是关键。因为如果有人做了非常重要的事情，比如你表弟生了孩子之类的，你希望它出现在顶部。如果我们把它埋在你的信息流的某个角落，你会非常生气。

但### 过去几年，信息流已经发展到另一个阶段，你需要的内容展示更多是关于公共内容。在这种情况下，推荐系统变得超级重要。因为不仅仅是来自朋友的几百、几千个帖子等着被展示到你面前，而是有数百万条内容，这变成了一个非常有趣的推荐问题。

而有了生成式AI，我们很快会进入一个新阶段。今天你在Instagram上看到的大部分内容都是推荐给你的、世界上有人写下的、与你兴趣相匹配的内容，无论你是否关注了这些人。但在未来，### 其中一些将是创作者使用工具创建的新内容，甚至有些内容将是为你即时创建的，或者是通过综合现有的不同内容而产生的。

这只是一个例子，说明我们正在做的核心业务将如何演变，它已经演变了20年了，但很少有人意识到。

揭秘Llama4，让AI助手在Meta全家桶中"解锁"智能体

黄仁勋：不过，人们意识到，世界上最大的计算系统之一就是推荐系统。

扎克伯格：这是一个完全不同的路径，它不完全是人们现在谈论的生成式AI。尽管它都是Transformer架构，都在构建越来越通用的系统，将非结构化数据嵌入到特征中。

但两种方式产生了质的差别，过去我们为不同类型的内容训练不同的模型，比如一个模型用于Meta短视频APP Reels的排序和推荐，另一个模型用于长视频的排序和推荐。然后，你需要做一些产品工作，使系统能够内联显示任何内容。

随着你创建越来越多的通用推荐模型，它就变得越来越好，因为你可以从更广泛的内容池子中抽取，而不是像从不同池子里抽取一样低效率。

现在，随着模型变得更大更通用，它会变得越来越好。### 我梦想有一天，Facebook或Instagram的全部内容，就像一个单一的AI模型在驱动，它统一了所有这些不同的内容类型和系统。在现实中，不同的时间段APP有不同的推荐目标，其中一些只是为了向你展示你今天想看的有趣内容，但有些是帮助你建立你的长期人脉网络，在这种情况下，这些多模态模型往往更擅长识别模式、弱信号等。

黄仁勋：原来AI在你的公司中用得如此深入。你们一直在构建GPU基础设施，运行这些大型推荐系统已经有很长时间了。

扎克伯格：实际上在使用GPU方面有点慢。

黄仁勋：是的，你好像承认错误一样，不必主动提出来（哈哈）。

现在，用AI真正酷的地方在于，当我使用WhatsApp时，我感觉我在与WhatsApp"合作"。想象我在打字，它顺着我打字的意思接着生成图像。当我改变我的用词，它又生成其他图像。比如我输入，一个老中国人在日落时享受一杯威士忌，旁边有三只狗；它就生成一张相当不错的图片。

扎克伯格：一方面，我认为生成式AI将成为我们长期以来所有工作流程和产品的一个巨大升级。

但另一方面，所有这些全新的东西可以被创造、生成出来。就像Meta AI这样的AI助手，可以帮助你完成不同的任务。在我们的世界里，它将会是非常具有创造性的，它将能够随着时间的推移回答任何问题。

未来，当我们从Llama 3的模型切换至Llama 4及以后的版本，我认为Meta AI就不再只像一个聊天机器人，你问一句他答一句了。取而代之地，他会在理解你的意图后，在多个时间框架内自主工作。比如，你一开始给了他一个意图，它会启动，在几周或几个月的计算任务后，他会回来告诉你结果，我认为这将非常强大。

黄仁勋：就像你说的，今天的AI，是一来一回、有问有答的方式，但显然，人类的思考不是这样。当我们被给予一个任务或一个问题时，我们会考虑多个选项，可能会想出一个决策树，我们在脑海中模拟运行，每个决定的不同结果是什么。像这样的规划、决策，未来AI也能做类似的事情。

当你谈到对创作者AI的愿景时，我听了非常兴奋，不妨告诉大家你的计划。

扎克伯格：我们已经谈论过一点，但我们今天正在更广泛地推出它。我不认为只会有一个AI模型，这是行业中一些其他公司的做法，建立一个中心化的智能体。

我们不一样，我们会有Meta AI助手供你使用，但我们### 想让所有使用Meta产品的人都有自己创建智能体的能力。无论是，平台上的数百万创作者，还是数亿小企业，都能快速建立一个业务智能体，能够与你的客户互动，比如销售和服务客户等。

所以Meta现在开始推出更多的是，我们称之为### AI Studio，它是一套工具，最终将使每个创作者都能建立某种AI版本的自己，作为一种代理或助手，社区成员可以与之互动。

如果你是一个创作者，想与你的社区有更多的互动，你其实是受到时间、精力限制的。更好的选择是能让人们创建这些AI，它可以基于你的语料把它训练成你想要的方式，来代表你。你非常清楚，不是在与创作者本人互动，但这是另一种有趣的方式，就像真人创作者在这些社交系统上发布内容一样，能够有代理来做这件事。

同样，我认为人们会为自己的业务创建这些智能体。