Google официально объявил о запуске голосового режима Gemini Live, который скоро станет доступен в мобильном приложении Gemini. Это знаменует собой новый этап конкуренции между Google и OpenAI в области голосовых AI-ассистентов.
Gemini Live - это совершенно новый мобильный разговорный опыт, поддерживающий общение на естественном языке с использованием человекоподобного голоса и ритма речи. Он предлагает выбор из 10 голосов, поддерживает функцию hands-free и позволяет прерывать и менять тему в любое время. В настоящее время английская версия доступна на устройствах Android, а версия для iOS и поддержка большего количества языков будут выпущены в ближайшие недели.
По сравнению с OpenAI, Google имеет преимущество как в скорости запуска, так и в потенциальном масштабе пользователей. Gemini Live будет доступен более чем 3 миллиардам пользователей Android и 2,2 миллиардам пользователей iOS по всему миру. Однако во время живой демонстрации Gemini Live дважды столкнулся с небольшими проблемами, что указывает на необходимость дальнейшего совершенствования его функций.
Google заявляет, что Gemini переопределяет понятие AI-ассистента, интегрируясь с несколькими приложениями и инструментами Google для выполнения различных задач. В будущем планируется добавить еще больше расширенных функций, включая Keep, Tasks и другие.
На устройствах Android пользователи могут активировать Gemini, удерживая кнопку питания или используя голосовое пробуждение. Он способен понимать содержимое экрана и взаимодействовать с используемыми приложениями. Google также представил новую модель Gemini 1.5 Flash для повышения скорости и качества ответов.
Кроме того, Google запустил AI-приложение для генерации изображений Pixel Studio, основанное на Imagen 3.
В целом, Google активно продвигает развитие своего AI-ассистента, стремясь получить преимущество в конкуренции с OpenAI и Apple.