AI女友升級:GPT-4版"Her"展現多才多藝魅力

她已經到了。

GPT-4o語音功能終於如期而至,科幻版Her走進現實。一些灰度測試到的用戶已經開始嘗試這項新功能。目前,OpenAI只提供了4種預設語音。此外,GPT-4o新模型的輸出token也大幅增加至64K,是之前的16倍。

趕在7月結束前,GPT-4o語音模式開啟了灰度測試,部分ChatGPT Plus用戶已獲得使用權限。OpenAI表示,高級語音模式提供了更加自然、實時的對話體驗,用戶可以隨意打斷,系統甚至能感知和回應用戶的情緒。預計今年秋季,所有ChatGPT Plus用戶都能使用這項功能。

此外,視頻和屏幕共享等更強大的功能也將在稍後推出。用戶將能夠開啟攝像頭與ChatGPT進行"面對面"交流。

一些獲得灰度測試資格的用戶已經開始探索GPT-4o語音模式的各種應用場景。例如,有人將其用作"外語教練",幫助練習口語。ChatGPT能夠糾正用戶的發音,如Croissant(羊角麵包)和Baguette(法式長棍)等單詞。

與此同時,GPT-4o的輸出token大幅增加。OpenAI最近在官方網頁中悄然推出了測試版新模型gpt-4o-64k-output-alpha,將輸出token從最初的4000個增加到64000個。這意味著用戶可以一次性獲得約4個完整的長篇電影劇本。

OpenAI表示,之所以現在才推出GPT-4o語音功能,是因為過去幾個月一直在進行安全性和質量測試。他們與100多名紅隊成員對GPT-4o的語音能力進行了45種語言的測試。為保護用戶隱私,系統只使用4種"預設聲音"進行對話,並創建了一個系統來阻止其他聲音的輸出。此外,還採取了內容過濾措施,阻止生成暴力和涉及版權的內容。

OpenAI計劃在8月初發布一份詳細報告,介紹GPT-4o的能力、局限性和安全評估結果。

用戶分享了GPT-4o語音模式的多種應用案例,包括表演節奏口技、以不同情緒講笑話、模仿動物叫聲等。測試顯示,ChatGPT高級語音模式響應速度快,幾乎沒有延遲,能夠準確模仿各種聲音和口音。

除了語音功能,支持更大token輸出的GPT-4o也隨之推出。OpenAI宣布向測試者提供GPT-4o Alpha版本,每次請求支持最多輸出64K token,相當於200頁小說。測試者可以通過"gpt-4o-64k-output-alpha"訪問GPT-4o的長輸出功能。

新模型的價格有所上漲,每百萬輸入token 6美元,每百萬輸出token 18美元。雖然輸出token是GPT-4o的16倍,但價格也上漲了3美元。

研究員Simon Willison表示,長輸出主要用於數據轉換用例,如將文檔從一種語言翻譯成另一種語言,或從文檔中提取結構化數據。在此之前,最長輸出模型是GPT-4o mini,為16K token。

鏈接到原文