谷歌正式宣布推出语音模式Gemini Live,即将在Gemini移动应用程序中上线。这标志着谷歌和OpenAI在AI语音助手领域的竞争再次升级。
Gemini Live是一款全新的移动对话体验,支持自然语言交流,使用真人般的声音和节奏回应。它提供10种声音选择,支持免提功能,可以随时打断和更改话题。目前英语版本已在安卓设备上推出,iOS版本和更多语言支持将在未来几周内推出。
与OpenAI相比,谷歌在推出速度和潜在用户规模上都占优势。Gemini Live将面向全球30多亿安卓用户和22亿iOS用户。不过在现场演示中,Gemini Live出现了两次小插曲,显示其功能仍有待完善。
谷歌表示,Gemini重新定义了AI助手,能与多个谷歌应用程序和工具集成,完成各种任务。未来还将推出更多扩展功能,包括Keep、Tasks等。
在安卓系统中,用户可以通过长按电源键或语音唤醒Gemini。它能理解屏幕内容,与正在使用的应用交互。谷歌还引入了新模型Gemini 1.5 Flash,以提高响应速度和质量。
此外,谷歌还推出了基于Imagen 3的AI生图应用Pixel Studio。
总的来说,谷歌正全力推进AI助手的发展,试图在与OpenAI和苹果的竞争中占得先机。