OpenAI a enfin lancé officiellement la version Alpha du mode vocal avancé (Advanced Voice Mode) de GPT-4o à certains utilisateurs Plus.
Cette nouvelle fonctionnalité permet aux utilisateurs d'interrompre la conversation à tout moment, et le système peut également percevoir et répondre aux fluctuations émotionnelles des utilisateurs. Cependant, les fonctionnalités de partage vidéo et d'écran, très attendues, seront lancées plus tard.
OpenAI prévoit d'augmenter progressivement le nombre d'utilisateurs de test, et s'attend à ce que tous les membres Plus puissent expérimenter cette fonctionnalité cet automne.
Certains internautes étrangers ont déjà obtenu l'accès au test et ont partagé leurs expériences d'utilisation :
-
Comme outil d'apprentissage des langues :
- GPT-4o peut servir de partenaire de pratique linguistique, faisant preuve de patience et de minutie.
- Il peut passer facilement d'une langue à l'autre, comme le français, l'espagnol, l'ourdou, etc.
- Les performances en chinois ont encore une marge d'amélioration, sonnant un peu mécanique.
-
Fonctions de divertissement :
- Capable de comprendre et de raconter des blagues.
- Peut raconter des histoires effrayantes et simuler les effets sonores correspondants.
- Capable de réciter des virelangues et de faire du beatbox.
-
Fonction de compréhension vidéo (expérimentée par un petit nombre d'utilisateurs) :
- Capable de comprendre le contenu vidéo en temps réel et d'interagir.
- Peut effectuer des traductions vidéo en temps réel.
Actuellement, GPT-4o propose quatre options de voix : Juniper, Breeze, Cove et Ember, toutes provenant d'acteurs de doublage professionnels. OpenAI a également développé de nouveaux filtres pour empêcher la génération de musique ou de contenu audio susceptible d'enfreindre les droits d'auteur.
Bien que le rythme de lancement des produits d'OpenAI soit instable, ses capacités technologiques restent largement reconnues. Les utilisateurs ont des attentes élevées pour les nouvelles fonctionnalités d'OpenAI, tout en espérant que l'entreprise pourra rapidement lancer une version complète et davantage de produits innovants.
[Exemple de notification officielle d'OpenAI]