Google annonce officiellement le lancement de Gemini Live, un mode vocal qui sera bientôt disponible dans l'application mobile Gemini. Cela marque une nouvelle escalade dans la concurrence entre Google et OpenAI dans le domaine des assistants vocaux IA.
Gemini Live est une nouvelle expérience de conversation mobile qui prend en charge la communication en langage naturel, répondant avec une voix et un rythme semblables à ceux d'un humain. Il offre 10 choix de voix, prend en charge la fonction mains libres, et permet d'interrompre et de changer de sujet à tout moment. La version anglaise est déjà disponible sur les appareils Android, tandis que la version iOS et le support pour plus de langues seront lancés dans les semaines à venir.
Par rapport à OpenAI, Google a l'avantage en termes de vitesse de lancement et d'échelle potentielle d'utilisateurs. Gemini Live sera disponible pour plus de 3 milliards d'utilisateurs Android et 2,2 milliards d'utilisateurs iOS dans le monde. Cependant, lors de la démonstration en direct, Gemini Live a connu deux petits incidents, montrant que ses fonctionnalités nécessitent encore des améliorations.
Google affirme que Gemini redéfinit l'assistant IA, capable de s'intégrer à plusieurs applications et outils Google pour accomplir diverses tâches. D'autres fonctionnalités étendues seront lancées à l'avenir, y compris Keep, Tasks, etc.
Sur le système Android, les utilisateurs peuvent accéder à Gemini en appuyant longuement sur le bouton d'alimentation ou par réveil vocal. Il peut comprendre le contenu de l'écran et interagir avec l'application en cours d'utilisation. Google a également introduit un nouveau modèle, Gemini 1.5 Flash, pour améliorer la vitesse et la qualité des réponses.
De plus, Google a lancé Pixel Studio, une application de génération d'images IA basée sur Imagen 3.
Dans l'ensemble, Google pousse activement le développement de son assistant IA, cherchant à prendre l'avantage dans la compétition avec OpenAI et Apple.