谷歌正式宣佈推出語音模式Gemini Live,即將在Gemini移動應用程式中上線。這標誌著谷歌和OpenAI在AI語音助手領域的競爭再次升級。
Gemini Live是一款全新的移動對話體驗,支援自然語言交流,使用真人般的聲音和節奏回應。它提供10種聲音選擇,支援免提功能,可以隨時打斷和更改話題。目前英語版本已在安卓裝置上推出,iOS版本和更多語言支援將在未來幾週內推出。
與OpenAI相比,谷歌在推出速度和潛在用戶規模上都佔優勢。Gemini Live將面向全球30多億安卓用戶和22億iOS用戶。不過在現場演示中,Gemini Live出現了兩次小插曲,顯示其功能仍有待完善。
谷歌表示,Gemini重新定義了AI助手,能與多個谷歌應用程式和工具集成,完成各種任務。未來還將推出更多擴展功能,包括Keep、Tasks等。
在安卓系統中,用戶可以通過長按電源鍵或語音喚醒Gemini。它能理解螢幕內容,與正在使用的應用交互。谷歌還引入了新模型Gemini 1.5 Flash,以提高回應速度和質量。
此外,谷歌還推出了基於Imagen 3的AI生圖應用Pixel Studio。
總的來說,谷歌正全力推進AI助手的發展,試圖在與OpenAI和蘋果的競爭中佔得先機。