Google anuncia oficialmente el lanzamiento de Gemini Live, un modo de voz que estará disponible próximamente en la aplicación móvil Gemini. Esto marca una nueva escalada en la competencia entre Google y OpenAI en el campo de los asistentes de voz con IA.
Gemini Live es una experiencia de conversación móvil completamente nueva que admite comunicación en lenguaje natural, respondiendo con una voz y ritmo similares a los humanos. Ofrece 10 opciones de voz, admite funcionalidad manos libres y permite interrupciones y cambios de tema en cualquier momento. La versión en inglés ya está disponible en dispositivos Android, mientras que la versión para iOS y el soporte para más idiomas se lanzarán en las próximas semanas.
En comparación con OpenAI, Google tiene ventaja en términos de velocidad de lanzamiento y escala potencial de usuarios. Gemini Live estará disponible para más de 3 mil millones de usuarios de Android y 2.2 mil millones de usuarios de iOS en todo el mundo. Sin embargo, durante la demostración en vivo, Gemini Live experimentó dos pequeños contratiempos, lo que indica que sus funciones aún necesitan perfeccionamiento.
Google afirma que Gemini redefine los asistentes de IA, pudiendo integrarse con múltiples aplicaciones y herramientas de Google para realizar diversas tareas. En el futuro, se lanzarán más funciones extendidas, incluyendo Keep, Tasks y otras.
En el sistema Android, los usuarios pueden acceder a Gemini manteniendo presionado el botón de encendido o mediante activación por voz. Puede entender el contenido de la pantalla e interactuar con la aplicación en uso. Google también ha introducido un nuevo modelo, Gemini 1.5 Flash, para mejorar la velocidad y calidad de respuesta.
Además, Google ha lanzado Pixel Studio, una aplicación de generación de imágenes por IA basada en Imagen 3.
En general, Google está avanzando a toda velocidad en el desarrollo de asistentes de IA, tratando de ganar ventaja en la competencia con OpenAI y Apple.