A Google anunciou oficialmente o lançamento do modo de voz Gemini Live, que estará disponível em breve no aplicativo móvel Gemini. Isso marca uma nova escalada na competição entre Google e OpenAI no campo dos assistentes de voz com IA.
Gemini Live é uma experiência de conversação móvel totalmente nova que suporta comunicação em linguagem natural, respondendo com voz e ritmo semelhantes aos humanos. Oferece 10 opções de voz, suporta função mãos-livres e permite interrupções e mudanças de tópico a qualquer momento. A versão em inglês já está disponível em dispositivos Android, com versões para iOS e suporte a mais idiomas chegando nas próximas semanas.
Comparado à OpenAI, o Google tem vantagens em termos de velocidade de lançamento e escala potencial de usuários. Gemini Live estará disponível para mais de 3 bilhões de usuários Android e 2,2 bilhões de usuários iOS em todo o mundo. No entanto, durante a demonstração ao vivo, Gemini Live teve dois pequenos contratempos, indicando que suas funcionalidades ainda precisam ser aperfeiçoadas.
O Google afirma que Gemini redefine os assistentes de IA, podendo se integrar com vários aplicativos e ferramentas do Google para realizar diversas tarefas. Mais funções expandidas serão lançadas no futuro, incluindo Keep, Tasks e outros.
No sistema Android, os usuários podem acessar Gemini pressionando longamente o botão de energia ou por ativação por voz. Ele pode entender o conteúdo da tela e interagir com o aplicativo em uso. O Google também introduziu um novo modelo, Gemini 1.5 Flash, para melhorar a velocidade e qualidade das respostas.
Além disso, o Google lançou Pixel Studio, um aplicativo de geração de imagens por IA baseado no Imagen 3.
No geral, o Google está avançando com força total no desenvolvimento de assistentes de IA, tentando ganhar vantagem na competição com OpenAI e Apple.