OpenAI意欲何为
OpenAI为什么要与这些媒体公司合作?
显然,通过这样做,它可以获得授权的训练数据,用来建立强大的新人工智能模型,这些模型的写作能力将不亚于《华尔街日报》的记者。
OpenAI的目的是提高ChatGPT的性能,并最终希望将这些工具商业化,再出售给这些媒体或该领域的其他媒体。
对于像Vox这样为YouTube制作视频内容、为Netflix制作授权纪录片和连续剧的数字媒体机构,OpenAI可以将其作品用于训练生成式人工智能视频模型Sora。
为什么OpenAI甘愿付费?
OpenAI之前为了训练大模型,毫不客气地抓取了几乎互联网上全部的公共帖子。
此举招致了艺术家、创意人士,甚至是《纽约时报》等媒体公司的强烈抵制。
这使得OpenAI不再坚持"合法抓取公开数据,以实现变革"的立场,他们在数据伦理上受到了挑战。
因此,OpenAI去年推出了一段代码,网站所有者可以将自己的网站添加到名单中,以阻止它对网站进行搜刮,用于训练。
OpenAI最近还宣布将创建一款新产品——媒体管理器(Media Manager),艺术家、创作者和出版商可以用它来标记他们打算或已经在网上发布的作品,表示他们不希望看到这些作品被AI工具爬取并用于训练模型。
不过,这要到2025年才会实现,而且内容创建者并不一定会买账。
因此,对风头正盛的OpenAI来说,付钱让出版商闭嘴并接受人工智能抓取和训练,不是一笔亏本的生意。
一来可以让自己摆脱困境,获得所需的数据,二来也向投资者和用户有了交代,显示自己对版权法和道德规范的遵守。
而内容所有者在这个过程中,并没有得到真正的回报。
媒体出版商究竟能否获益
出版商无一例外地都宣布了OpenAI内容许可协议,他们确实得到了一些东西,其中最重要的不是金钱,而是"位置"。
具体来说,几乎所有出版商都指出,ChatGPT将在其输出中显示他们的文章。
因此,如果用户输入"总结最新科技新闻",则可能会显示来自《Business Insider》、《The Verge》(Vox旗下)、《华尔街日报》或其他任何包含在交易中的出版物的文章摘要,以及来源链接。
这仅仅是一种可能的设想,确切的协议或技术文档并没有被公开分享。
此外,目前还不清楚ChatGPT会如何使用来自媒体的内容,如果它采用"机器人式的"风格在原始文本的基础上进行概括,就可能会抹杀原作者本身创作的艺术性。
而且,由于用户在ChatGPT上已经阅读了经过概述的新闻,那他们就不会选择访问首发文章的网站,从而会使得这些出版物失去流量。这对于出版物来说,则意味着失去付费用户或者是商业价值。
这就是为什么The Information创始人Jessica Lessin、前Gawker记者Hamilton Nolan和前Vice记者Edward Onswego, Jr.等资深从业人士都指出,在与OpenAI的交易中,出版商承担了残酷后果。
毕竟,如果读者追求的是纯粹的信息,而ChatGPT提供给他们的就是纯粹的信息,那么他们访问首发媒体还有什么用,更不用说花钱订阅了。
用户会选择成为ChatGPT Plus,每个月向OpenAI交20美元,而不再光顾生产内容的媒体。
历史的重演
现在所发生的一切不禁让人想起谷歌新闻刚推出的时候,那是2006年,Facebook和Twitter等社交平台的用户数量和受欢迎程度开始增长,并迅速成为出版商的主要推荐流量来源。
在过去的15-20年里,基本维持着这样的情况。不过,由于这些平台背后的科技巨头的管理和不断调整算法,流量起起伏伏。
当某个科技平台突然改变算法,导致受众消失时,那些在某个平台或策略上投入过多精力的网站很快就会发现自己无所适从。
当然,变化还在不断发生,可以说最大的变化现在正摆在技术平台和出版商面前:生成式人工智能。
随着谷歌将自己错误的人工智能概述摘要结果放在搜索结果页面的顶部,并推低了指向出版商和新闻文章的直接链接,越来越多的人可能会选择采用ChatGPT,作为新闻来源或聚合器。
新闻出版商和母公司的高管或许感到被逼到了墙角:游戏正在再次改变,人工智能正在到来,并取代了人们在网上获取新闻的传统方式。那么为什么不与颠覆者合作,尝试乘风破浪呢?
只不过,正如上文所述的简短历史课所显示的那样,科技公司总是随机地、不可预测地改变战略和工具,这让媒体公司懊恼不已。
虽然OpenAI现在正在与出版商友好相处