La nouvelle version de GPT-4o mini réduit le prix à 1 yuan/million de tokens, une initiative qui place à nouveau OpenAI en tête de la compétition avec d'autres entreprises d'IA.
OpenAI a lancé son modèle le plus économique, GPT-4o mini, le soir du 18 juillet. Le prix de l'API pour l'entrée est de 15 cents (environ 1,09 yuan) par million de tokens, et le prix de sortie est de 60 cents (environ 4,36 yuans) par million de tokens, soit plus de 60% moins cher que GPT-3.5 Turbo. Malgré la baisse de prix, les capacités de GPT-4o mini ont considérablement augmenté, obtenant un bon score de 82% au test MMLU et surpassant GPT-4 dans les préférences de chat sur le classement LMSYS.
Comparé aux petits modèles d'autres entreprises, GPT-4o mini se démarque en termes de rapport qualité-prix :
- Gemini 1.5 Flash de Google : prix d'entrée 2,5 yuans/million de tokens, prix de sortie 7,6 yuans/million de tokens
- Claude 3 Haiku d'Anthropic : prix d'entrée 1,8 yuan/million de tokens, prix de sortie 9 yuans/million de tokens
GPT-4o mini surpasse complètement ces concurrents en termes de performance.
Les entreprises d'IA nationales comme Deep Exploration, Zhipu AI, ByteDance, Alibaba Cloud, Baidu, Tencent Cloud et iFlytek ont également considérablement réduit leurs prix en juin, mais leur avantage de prix a maintenant été affaibli. Par exemple :
- Qwen-Turbo d'Alibaba Cloud : prix d'entrée 2 yuans/million de tokens, prix de sortie 6 yuans/million de tokens
- Série ERNIE 3.5 de Baidu : prix d'entrée et de sortie 12 yuans/million de tokens
- Doubao-pro-128k de ByteDance : prix d'entrée 5 yuans/million de tokens, prix de sortie 9 yuans/million de tokens
Sam Altman, PDG d'OpenAI, a déclaré que GPT-4o mini "se dirige vers une intelligence trop bon marché pour être mesurée". Comparé au modèle GPT-3 text-davinci-003 de 2022, le coût des tokens de GPT-4o mini a diminué de 99%.
GPT-4o mini présente les caractéristiques suivantes :
- Capacité de traitement de contexte de 128k tokens
- Prise en charge des entrées textuelles et visuelles
- Prise en charge de 16k tokens de sortie
- Extension future à l'entrée/sortie vidéo et audio
Dans plusieurs tests de référence mondiaux faisant autorité, GPT-4o mini surpasse GPT-3.5 Turbo et d'autres petits modèles :
- Test d'intelligence textuelle et de raisonnement MMLU : 82,0%
- Test de raisonnement mathématique MGSM : 87,0%
- Test de performance de codage HumanEval : 87,2%
- Évaluation du raisonnement multimodal MMMU : 59,4%
GPT-4o mini est déjà disponible gratuitement sur ChatGPT et devrait progressivement remplacer GPT-3.5. OpenAI prévoit de lancer la fonction de fine-tuning pour GPT-4o mini dans les prochains jours.
Andrej Karpathy, expert en IA, estime que la compétition sur la taille des grands modèles de langage s'intensifie, mais montre une tendance à la régression. Il prédit l'émergence future de modèles très petits mais puissants.
OpenAI affirme que GPT-4o mini hérite des mêmes mécanismes de sécurité stricts que GPT-4o et est le premier modèle à appliquer l'approche de hiérarchie d'instructions d'OpenAI, démontrant une capacité de défense plus forte dans l'API.
L'intensification de la guerre des prix des grands modèles et l'émergence de petits modèles hautement performants favoriseront une intégration plus large de l'IA dans les scénarios quotidiens, tout en poussant l'industrie à repenser la manière de déployer l'IA.