OpenAI意欲何為
OpenAI為什麼要與這些媒體公司合作?
顯而易見的是,通過這樣做,它可以獲得授權的訓練數據,用來建立強大的新人工智能模型,這些模型的寫作能力將會不亞於《華爾街日報》的記者。
OpenAI的目的就是要提高ChatGPT的性能,並最終希望將這些工具商業化,再出售給這些媒體或者是該領域的其他媒體。
對於像Vox這樣為YouTube製作視頻內容、為Netflix製作授權紀錄片和連續劇的數字媒體機構,OpenAI 可以將其作品用於訓練生成式人工智能視頻模型Sora。
為什麼OpenAI甘願付費?
OpenAI之前為了訓練大模型,可是毫不客氣地抓取了幾乎互聯網上全部的公共帖子。
此舉招致了藝術家、創意人士,甚至是《紐約時報》等媒體公司的強烈抵制。
這使得OpenAI不再堅持「合法抓取公開數據,以實現變革」的立場,他們在數據倫理上受到了挑戰。
因此,OpenAI去年推出了一段代碼,網站所有者可以將其自己的網站添加到名單中,以阻止它對網站進行搜刮,用於訓練。
OpenAI 最近還宣布將創建一款新產品——媒體管理器(Media Manager),藝術家、創作者和出版商可以用它來標記他們打算或已經在網上發布的作品,表示他們不希望看到這些作品被 AI 工具爬取並用於訓練模型。
不過,這要到 2025 年才會實現,而且內容創建者並不一定會買賬。
因此,對風頭正盛的OpenAI 來說,付錢讓出版商閉嘴並接受人工智能抓取和訓練,不是一筆虧本的生意。
一來可以讓自己擺脫困境,獲得所需的數據,二來也向投資者和用戶有了交代,顯示自己對版權法和道德規範的遵守。
而內容所有者在這個過程中,並沒有得到真正的回報。
媒體出版商究竟能否獲益
出版商無一例外地都宣布了OpenAI內容許可協議,他們確實得到了一些東西,其中最重要的不是金錢,而是「位置」。
具體來說,幾乎所有出版商都指出,ChatGPT 將在其輸出中顯示他們的文章。
因此,如果用戶輸入「總結最新科技新聞」,則可能會顯示來自《Business Insider》、《The Verge》(Vox 旗下)、《華爾街日報》或其他任何包含在交易中的出版物的文章摘要,以及來源鏈接。
這僅僅是一種可能的設想,確切的協議或技術文檔並沒有被公開分享。
此外,目前還不清楚ChatGPT會如何使用來自媒體的內容,如果它採用「機器人式的」風格在原始文本的基礎上進行概括,就可能會抹殺原作者本身創作的藝術性。
而且,由於用戶在ChatGPT上已經閱讀了經過概述的新聞,那他們就不會選擇訪問首發文章的網站,從而會使得這些出版物失去流量。這對於出版物來說,則意味著失去付費用戶或者是商業價值。
這就是為什麼The Information創始人Jessica Lessin、前Gawker記者Hamilton Nolan和前 Vice 記者Edward Onswego, Jr.等資深從業人士都指出,在與OpenAI的交易中,出版商承擔了殘酷後果。
畢竟,如果讀者追求的是純粹的信息,而ChatGPT提供給他們的就是純粹的信息,那麼他們訪問首發媒體還有什麼用,更不用說花錢訂閱了。
用戶會選擇成為ChatGPT Plus,每個月向OpenAI交20美元,而不再光顧生產內容的媒體。
歷史的重演
現在所發生的一切不禁讓人想起谷歌新聞剛推出的時候,那是2006年,Facebook和Twitter等社交平台的用戶數量和受歡迎程度開始增長,並迅速成為出版商的主要推薦流量來源。
在過去的15-20年裡,基本維持著這樣的情況。不過,由於這些平台背後的科技巨頭的管理和不斷調整算法,流量起起伏伏。
當某個科技平台突然改變算法,導致受眾消失時,那些在某個平台或策略上投入過多精力的網站很快就會發現自己無所適從。
當然,變化還在不斷發生,可以說最大的變化現在正擺在技術平台和出版商面前:生成式人工智能。
隨著谷歌將自己錯誤的人工智能概述摘要結果放在搜索結果頁面的頂部,並推低了指向出版商和新聞文章的直接鏈接,越來越多的人可能會選擇採用 ChatGPT,作為新聞來源或聚合器。
新聞出版商和母公司的高管或許感到被逼到了牆角:遊戲正在再次改變,人工智能正在到來,並取代了人們在網上獲取新聞的傳統方式。那麼為什麼不與顛覆者合作,嘗試乘風破浪呢?
只不過,正如上文所述的簡短歷史課所顯示的那樣,科技公司總是隨機地、不可預測地改變戰略和工具,這讓媒體公司懊惱不已。
雖然OpenAI現在正在與出版商友好相處