OpenAI a récemment lancé GPT-4o mini, une version plus petite et plus rentable de leur modèle GPT-4o. Voici les points clés concernant GPT-4o mini :
-
Il surpasse GPT-3.5 Turbo dans les tests d'intelligence textuelle et de raisonnement multimodal, et dépasse même GPT-4 sur le classement des chatbots LMSYS.
-
Il prend en charge une fenêtre de contexte de 128K tokens et peut produire jusqu'à 16K tokens par requête, lui permettant de se souvenir de conversations plus longues et de générer des réponses plus longues par rapport à GPT-3.5 Turbo.
-
Le prix est significativement inférieur à celui de GPT-3.5 Turbo :
- 0,15 $ par million de tokens d'entrée (environ 1,09 RMB)
- 0,60 $ par million de tokens de sortie (environ 4,36 RMB)
- Plus de 60% moins cher que GPT-3.5 Turbo
-
Il remplacera GPT-3.5 Turbo pour les utilisateurs gratuits de ChatGPT.
-
Il alimentera les fonctionnalités d'IA d'Apple sur les appareils mobiles et les Mac à partir de cet automne, bien que probablement toujours via un traitement dans le cloud plutôt que sur l'appareil.
-
Il prend actuellement en charge l'entrée/sortie de texte via API, avec un support pour l'image, la vidéo et l'audio à venir ultérieurement.
-
Il partage des améliorations dans la génération de tokens avec GPT-4o, le rendant plus efficace pour le traitement de texte non anglais.
-
Les tests montrent qu'il surpasse des modèles "économiques" similaires comme Gemini 1.5 Flash et Claude 3 Haiku dans des domaines tels que le raisonnement mathématique et la génération de code.
-
L'accent mis sur un modèle plus petit et plus rentable représente un changement pour OpenAI, probablement en réponse à la demande des développeurs pour de telles options.
-
De nombreuses entreprises se tournent vers des modèles d'IA plus petits pour réduire les coûts tout en répondant toujours aux besoins de performance.
OpenAI vise à équilibrer le fait de repousser les limites des capacités de l'IA avec la fourniture d'options plus accessibles pour les développeurs et les applications. GPT-4o mini représente leur entrée dans l'espace des modèles "plus petits mais capables" que d'autres entreprises ont déjà exploré.