中美推进人工智能监管:寻求创新与管控平衡

人工智能产业链的各个环节都有可能降低市场准入门槛。

美国司法部与联邦贸易委员会(FTC)达成协议,将分头调查微软、OpenAI 和 Nvidia是否存在反竞争行为。

与此同时,随着欧盟《人工智能法案》出台,欧盟委员会对人工智能调查的兴趣日益浓厚。2024年3月和5月,欧盟委员会分别向Google、Facebook 和 TikTok、微软发出了正式的信息请求,要求提供有关生成人工智能带来的风险和缓解措施。2024年7月16日,英国竞争和市场管理局(CMA)宣布启动针对"微软聘请Inflection AI 核心团队"的调查,以确定此次招聘是否等同于"并购"。

这种竞争检查之所以如此紧迫,一方面,是因为竞争监管机构不希望再次被大型科技公司打得措手不及;另一方面,在人工智能大模型发展的内在条件上,似乎就带有"集中"和"限制"的属性。因此,不管是欧盟还是美国,都似乎更倾向于在科技公司成功占据了AI市场主导地位之前,进行"事前干预"。

人工智能发展内在"反竞争"属性?

1、云基础设施和计算能力的壁垒

一些专家认为,人工智能的寡头垄断市场几乎不可避免。

对于AI初创公司来说,模型训练是一项昂贵的固定成本,也是其进入人工智能市场的主要障碍。仅靠投资人烧钱的方式很难持续承担这些成本。

而只有最大的大型科技公司(主要是谷歌、亚马逊、微软和 Meta 以及苹果和 Nvidia,统称为 GAMMAN)才拥有所需的云基础设施和计算能力,以满足最大型 AI 模型的训练需求。GAMMAN 对关键资产的控制,将较小的初创企业限制在从属角色。

这就解释了为什么人工智能初创企业往往愿意寻求与大型科技公司达成合作协议。比如,最典型的就是OpenAI与微软的合作,用计算基础设施的使用权换取 GAMMAN 对其最新模型的使用权。又或者,AI 初创公司也可以远离技术前沿线,专注于在特定任务上表现良好的小型 AI 模型,为大型模型"打基础",以创建具有专有数据的应用程序。

2、获取有版权数据的壁垒

许多高质量的文本、音频和图片 AI 训练数据集都受版权保护。作者原则上可以对其作品的使用收取许可费。这将引发额外的成本导致的训练数据供应缩减。这还将增加模型训练的成本,并减少模型开发者之间的竞争。

欧盟《人工智能法案》要求模型开发者遵守《版权指令》中规定的《欧盟版权法》,特别是第 4 条,该条授予商业研究的版权例外,但允许版权持有人选择退出此例外。在美国存在一定的法律不确定,有几起案件悬而未决。如果法院裁定不适用合理使用例外,人工智能投资者将面临惩罚性法定赔偿的风险。为了避免这种情况,最大的人工智能公司已经与大型媒体公司签署了数据许可协议。例如,OpenAI 与《纽约时报》、贝塔斯曼媒体集团和 Reddit 新闻平台签署了协议。

如果各国严格执行版权法,人工智能模型获取训练数据的困难就增加了,规模较小的人工智能开发商和初创公司可能没有财力支付版权许可,以至于被完全挤出市场。

3、接触用户途径的便利性

AI 模型开发者需要商业渠道来创造收入,以支付训练和运行模型的成本。

一些初创公司从头开始建立自己的商业模式,而且还比较成功。例如,OpenAI创建了一个收费的GPT应用商店,还向专业版 ChatGPT 的用户收取订阅费。在 ChatGPT 推出一年内就覆盖了 1 亿多用户。

然而,对于那些网络效应较弱甚至没有网络效应的人工智能初创企业来说,从头开始建立商业模式是很困难的。一种更简单的创收途径是与 GAMMAN 合作,将人工智能模型嵌入到他们成熟的商业模式中。例如,谷歌正在将自己的和第三方的人工智能模型嵌入其搜索引擎和其他服务中,对部分人工智能驱动服务的访问收取高价。

所以,尚未形成商业模式的初创企业也愿意与 GAMMAN 合作,将AI模型嵌入其价值链下游端——现有的 GAMMAN 面向用户的服务中;作为回报,初创企业在价值链上游端进行反向合作,GAMMAN 授予初创企业访问计算基础设施和可能的训练数据的权限。

GAMMAN 和 AI 初创企业之间的"竞合"协议是否属于 "并购"?

基于以上原因,想要保持技术前沿地位的 AI 初创公司需要与 GAMMAN 签署竞合协议,以克服训练成本和获取客户的障碍。GAMMAN 可以沿着整个 AI 价值链进行垂直整合,而初创企业主要覆盖价值链的投入和中间部分。

竞争管理机构对这些交易和协议持怀疑态度,担心竞合协议可能会成为 GAMMAN 施加影响力并减少 AI 初创公司竞争的木马。其中一个重要的法律问题在于,GAMMAN从战略投资到挖走初创公司创始人和技术人才等行为,是否是一种只在规避反垄断监管的新的并购方式——"准并购"?

但竞争管理机构的几项调查迄今为止尚未找到任何确凿证据。

尽管欧盟委员会于2024年4月得出结论,认为微软对OpenAI的投资安排不属于收购,但它仍在继续调查是否对该安排展开正式的反垄断调查,理由是该安排可能会对欧盟内部市场产生扭曲影响。德国也是类似,在2023 年 11 月确定该安排不受德国合并控制,但如果微软未来增加对 OpenAI 的影响力,它保留了重新审查的可能性。

美国反垄断执法机构如今也加入调查的行列。

生成式人工智能反垄断调查的突破口

如果"准并购"的概念在法律上难以突破,那么监管机构很可能将从生成式人工智能所依赖的一个或多个关键构件的控制寻求突破。

1、数据

与硬件不同,训练数据是非竞争性的,可以同时被许多人使用。然而,许多高质量训练数据来源都受版权和许可费用的约束。

特别是在专业领域或数据监管更为严格的领域(如医疗保健或金融)尤其如此。预训练或微调一个在这些领域拥有深厚专业知识的模型可能需要访问大量数据,而这些数据并不广泛可用,而且对于市场新参与者来说很难收集。

当然,仅仅拥有大量数据并不违法。然而,反垄断执法机构可能对公司对数据的控制进行特别关注,以分辨其是否可能减少数据的供应、造成获取的障碍、阻碍公平竞争的充分发展。

2、人才

生成式人工智能的另一个重要投入是劳动力专业知识。开发生成式模型需要大量工程和研究人员,他们必须具备特定且相对稀缺的技能,并且对机器学习、自然语言处理和计算机视觉有深入的了解。公司能够获得和留住的人才可能不仅在生成式人工智能的发展路径上发挥关键作用,而且在发展速度上也发挥关键作用。

由于人才稀缺,实力雄厚的公司可能会有动机锁定员工,从而扼杀来自实际或潜在竞争对手的竞争。为了确保市场竞争和创新,必须允许具有创新想法的人才自由流动,而且至关重要的是,不要受到竞业禁止条款的阻碍。

英国CMA在7月宣布对微软聘请Inflection AI(OpenAI的竞争对手)核心团队所进行调查,就属于此类。另外,美国FTC于2024年 4 月 23 日宣布的全面禁止所有员工(包括高级管理人员)签署新的竞业禁止协议,也是为了促进IT人才的流动。不过很快就被法官挑战其合法性,前景尚不明朗。

3、计算资源

生成式人工智能系统通常需要大量计算资源。计算通常需要专用硬件,例如带有图形处理单元 (GPU ) 等专用芯片的计算机,或者通过云计算服务来获取计算资源。然而,芯片的运行维护成本和云服务价格都很昂贵,目前也只有少数公司提供,这增加了反竞争行为的风险。

如今,一些专用芯片市场已经高度集中,而且对服务器芯片的需求可能会超过供应。例如,对可用于训练 AI 的服务器芯片的需求激增导致短缺,促使 AWS、微软、谷歌和甲骨文等主要云服务器提供商"限制向客户提供产品"。而高度集中的市场中的公司更容易采取不公平的竞争手段或其他反垄断法违规行为。

2022年,美国联邦贸易委员会针对英伟达(Nvidia)的诉讼进行两个多月后,英伟达放弃了对 Arm 的收购。FTC 认为,这笔交易将使英伟达能够压制创新的竞争技术,并使英伟达能够不公平地削弱 Arm 的许可业务竞争对手的地位。