A nova versão do GPT-4o mini reduz o preço para 1 yuan/milhão de tokens, uma medida que coloca a OpenAI novamente à frente na competição com outras empresas de IA.
A OpenAI lançou seu modelo mais econômico, o GPT-4o mini, na noite de 18 de julho. O preço da API de entrada do modelo é de 15 centavos (cerca de 1,09 yuan) por milhão de tokens, e o preço de saída é de 60 centavos (cerca de 4,36 yuan) por milhão de tokens, mais de 60% mais barato que o GPT-3.5 Turbo. Apesar da redução de preço, as capacidades do GPT-4o mini foram significativamente aprimoradas, alcançando uma boa pontuação de 82% no teste MMLU e superando o GPT-4 na preferência de chat no ranking LMSYS.
Em comparação com modelos menores de outras empresas, o GPT-4o mini se destaca em termos de custo-benefício:
- Gemini 1.5 Flash do Google: preço de entrada de 2,5 yuan/milhão de tokens, preço de saída de 7,6 yuan/milhão de tokens
- Claude 3 Haiku da Anthropic: preço de entrada de 1,8 yuan/milhão de tokens, preço de saída de 9 yuan/milhão de tokens
O GPT-4o mini supera completamente esses concorrentes em desempenho.
Empresas de IA domésticas como Deep Exploration, Zhipu AI, ByteDance, Alibaba Cloud, Baidu, Tencent Cloud e iFlytek também reduziram significativamente seus preços em junho, mas agora sua vantagem de preço foi enfraquecida. Por exemplo:
- Qwen-Turbo da Alibaba Cloud: preço de entrada de 2 yuan/milhão de tokens, preço de saída de 6 yuan/milhão de tokens
- Série ERNIE 3.5 da Baidu: preço de entrada e saída de 12 yuan/milhão de tokens
- Doubao-pro-128k da ByteDance: preço de entrada de 5 yuan/milhão de tokens, preço de saída de 9 yuan/milhão de tokens
O CEO da OpenAI, Sam Altman, afirmou que o GPT-4o mini está "caminhando para uma inteligência tão barata que é impossível medir". Comparado ao modelo GPT-3 text-davinci-003 de 2022, o custo de tokens do GPT-4o mini foi reduzido em 99%.
O GPT-4o mini possui as seguintes características:
- Capacidade de processamento de contexto de 128k tokens
- Suporte para entrada de texto e visual
- Suporte para 16k tokens de saída
- Expansão futura para entrada/saída de vídeo e áudio
Em vários testes de referência globais autoritativos, o GPT-4o mini superou o GPT-3.5 Turbo e outros modelos menores:
- Teste de inteligência e raciocínio de texto MMLU: 82,0%
- Teste de raciocínio matemático MGSM: 87,0%
- Teste de desempenho de codificação HumanEval: 87,2%
- Avaliação de raciocínio multimodal MMMU: 59,4%
O GPT-4o mini já está disponível gratuitamente no ChatGPT e espera-se que substitua gradualmente o GPT-3.5. A OpenAI planeja lançar a funcionalidade de ajuste fino do GPT-4o mini nos próximos dias.
O especialista em IA Andrej Karpathy acredita que a competição pelo tamanho dos grandes modelos de linguagem está se intensificando, mas mostrando uma tendência regressiva. Ele prevê o surgimento de modelos muito pequenos, mas poderosos no futuro.
A OpenAI afirma que o GPT-4o mini herda os mesmos mecanismos rigorosos de proteção de segurança do GPT-4o e é o primeiro modelo a aplicar a abordagem de hierarquia de instruções da OpenAI, demonstrando capacidades defensivas mais fortes na API.
A intensificação da guerra de preços dos grandes modelos e o surgimento de modelos pequenos de alto desempenho impulsionarão uma integração mais ampla da IA em cenários cotidianos, ao mesmo tempo em que incentivam a indústria a repensar as formas de implementação da IA.