Meta开源4050亿参数大模型:Llama 3.1正式发布

Meta快速调动开源社区,给OpenAI带来竞争压力。

以下是扎克伯格的公开信,由"AI Emergence"翻译:

"开源AI是前进的道路"

在高性能计算的早期,当时的主要科技公司都大量投资开发自己的闭源Unix版本。当时很难想象还有其他方式来开发如此先进的软件。

然而,开源的Linux最终变得流行起来 - 最初是因为它允许开发者按自己的意愿修改代码,而且更便宜;随着时间推移,它变得更先进、更安全,并拥有比任何闭源Unix更广泛的生态系统,支持更多功能。如今,Linux是云计算的行业标准基础,也是运行大多数移动设备的操作系统 - 我们都从其优质产品中受益。

我相信人工智能将以类似的方式发展。今天,一些科技公司正在开发领先的闭源模型。但开源正在迅速缩小这个差距。去年,Llama 2只能与落后于前沿的旧一代模型竞争。今年,Llama 3与最先进的模型竞争,并在某些领域处于领先地位。从明年开始,我们预计未来的Llama将成为业内最先进的。但即使在那之前,Llama在开放性、可修改性和成本效益方面已经处于领先地位。

今天,我们正在迈出下一步,使开源AI成为行业标准。我们正在发布Llama 3.1 405B - 第一个达到行业领先水平的开源AI模型 - 以及新的和改进的Llama 3.1 70B和8B模型。除了与闭源模型相比具有更好的成本/性能比之外,405B模型是开源的这一事实将使其成为微调和提取较小模型的最佳选择。

除了发布这些模型外,我们还与一系列公司合作开发更广泛的生态系统。亚马逊、Databricks和英伟达正在推出全套服务,以支持开发者微调和完善自己的模型。像Groq(一家AI芯片初创公司)这样的创新公司为所有新模型构建了低延迟、低成本的推理服务。

这些模型将在所有主要云平台上可用,包括AWS、Azure、Google、Oracle等。Scale.AI、Dell、德勤等公司已准备好帮助企业部署Llama并使用自己的数据训练定制模型。随着社区的发展和更多公司开发新服务,我们可以共同使Llama成为行业标准,让每个人都能享受AI的好处。

Meta致力于开源AI。我将概述为什么我认为开源是对人们最好的开发堆栈,为什么开源Llama对Meta有利,为什么开源AI对世界有利,以及为什么,正因如此,开源社区将长期存在。

为什么开源AI对开发者有利

当我与世界各地的开发者、CEO和政府官员交谈时,我通常听到以下主题:

我们需要训练、微调和完善我们自己的模型。

每个组织都有不同的需求,不同规模的模型可以最好地满足这些需求,通过特定数据进行训练或微调。设备上的任务和分类任务需要较小的模型,而更复杂的任务需要较大的模型。

现在,你将能够使用最先进的Llama模型,继续用自己的数据训练它们,然后将它们完善到最佳规模的模型 - 无需我们或任何其他人看到你的数据。

我们需要控制自己的命运,而不受闭源供应商的约束。

许多组织不想依赖他们无法运行和控制的模型。他们不希望闭源模型提供商能够改变他们的模型、改变使用条款,甚至完全停止服务。他们也不想被锁定在拥有特定模型独家权利的单一云平台上。开源提供了一个与许多公司兼容的工具生态系统,你可以轻松在它们之间切换。

我们需要保护我们的数据。

许多组织处理需要保护的敏感数据,这些数据不能通过云API传输到闭源模型。其他组织simply不信任闭源模型提供商处理他们的数据。开源通过允许你在任何地方运行模型来解决这些问题。人们普遍认为开源软件更安全,因为开发过程更透明。

我们需要高效且负担得起的运营模式。

开发者可以在自己的基础设施上运行Llama 3.1 405B的推理,成本约为使用GPT-4o等闭源模型进行面向用户和离线推理任务的50%。

我们押注于可以成为长期标准的生态系统。

许多人看到开源的发展速度快于闭源模型,他们希望以一种能给他们带来最大长期优势的方式构建系统架构。

为什么开源AI对Meta有利

Meta的商业模式是为人们构建最佳体验和服务。为此,我们需要确保始终能够获得最佳技术,而不是被锁定在竞争对手的封闭生态系统中,这会限制我们能够构建的内容。

我的一个重要经历是我们的服务如何受到苹果允许我们在其平台上构建内容的限制。他们对开发者征税的方式、他们应用的任意规则,以及他们阻止发布的所有产品创新,都清楚地表明,如果我们能够在不受竞争对手限制的情况下构建最佳版本的产品,Meta和许多其他公司将能够为人们提供更好的服务。

从哲学角度来看,这是我如此坚定地相信为下一代AI和AR/VR计算构建开源生态系统的主要原因。

人们经常问我是否担心通过开源Llama放弃技术优势,但我认为这忽视了一些重要原因:

首先,为了确保我们能够长期获得最佳技术,而不是被锁定在封闭的生态系统中,Llama需要发展成为一个完整的生态系统,包括工具、效率改进、硅优化和其他集成。如果我们是唯一使用Llama的公司,这个生态系统就不会发展,我们的处境不会比闭源Unix变体好。

其次,我预计随着智能的增长,竞争将会加剧,这意味着在那时,开源任何特定模型都不会放弃对下一个具有更大优势的模型的优势。Llama成为行业标准的道路是通过持续竞争、高效和开源一代又一代的模型。

第三,Meta与闭源模型提供商的一个关键区别是