OpenAI encerra o serviço ChatGPT-3.5

Preços do GPT-4 caem drasticamente! Dez grandes empresas de IA entram em competição acirrada, quem tem o poder de desafiar a posição da OpenAI?

A nova versão do GPT-4o mini reduz o preço para 1 yuan/milhão de tokens, uma medida que coloca a OpenAI novamente à frente na competição com outras empresas de IA.

A OpenAI lançou seu modelo mais econômico, o GPT-4o mini, na noite de 18 de julho. O preço da API de entrada do modelo é de 15 centavos (cerca de 1,09 yuan) por milhão de tokens, e o preço de saída é de 60 centavos (cerca de 4,36 yuan) por milhão de tokens, mais de 60% mais barato que o GPT-3.5 Turbo. Apesar da redução de preço, as capacidades do GPT-4o mini foram significativamente aprimoradas, alcançando uma boa pontuação de 82% no teste MMLU e superando o GPT-4 na preferência de chat no ranking LMSYS.

Em comparação com modelos menores de outras empresas, o GPT-4o mini se destaca em termos de custo-benefício:

  • Gemini 1.5 Flash do Google: preço de entrada de 2,5 yuan/milhão de tokens, preço de saída de 7,6 yuan/milhão de tokens
  • Claude 3 Haiku da Anthropic: preço de entrada de 1,8 yuan/milhão de tokens, preço de saída de 9 yuan/milhão de tokens

O GPT-4o mini supera completamente esses concorrentes em desempenho.

Empresas de IA domésticas como Deep Exploration, Zhipu AI, ByteDance, Alibaba Cloud, Baidu, Tencent Cloud e iFlytek também reduziram significativamente seus preços em junho, mas agora sua vantagem de preço foi enfraquecida. Por exemplo:

  • Qwen-Turbo da Alibaba Cloud: preço de entrada de 2 yuan/milhão de tokens, preço de saída de 6 yuan/milhão de tokens
  • Série ERNIE 3.5 da Baidu: preço de entrada e saída de 12 yuan/milhão de tokens
  • Doubao-pro-128k da ByteDance: preço de entrada de 5 yuan/milhão de tokens, preço de saída de 9 yuan/milhão de tokens

O CEO da OpenAI, Sam Altman, afirmou que o GPT-4o mini está "caminhando para uma inteligência tão barata que é impossível medir". Comparado ao modelo GPT-3 text-davinci-003 de 2022, o custo de tokens do GPT-4o mini foi reduzido em 99%.

O GPT-4o mini possui as seguintes características:

  1. Capacidade de processamento de contexto de 128k tokens
  2. Suporte para entrada de texto e visual
  3. Suporte para 16k tokens de saída
  4. Expansão futura para entrada/saída de vídeo e áudio

Em vários testes de referência globais autoritativos, o GPT-4o mini superou o GPT-3.5 Turbo e outros modelos menores:

  • Teste de inteligência e raciocínio de texto MMLU: 82,0%
  • Teste de raciocínio matemático MGSM: 87,0%
  • Teste de desempenho de codificação HumanEval: 87,2%
  • Avaliação de raciocínio multimodal MMMU: 59,4%

O GPT-4o mini já está disponível gratuitamente no ChatGPT e espera-se que substitua gradualmente o GPT-3.5. A OpenAI planeja lançar a funcionalidade de ajuste fino do GPT-4o mini nos próximos dias.

O especialista em IA Andrej Karpathy acredita que a competição pelo tamanho dos grandes modelos de linguagem está se intensificando, mas mostrando uma tendência regressiva. Ele prevê o surgimento de modelos muito pequenos, mas poderosos no futuro.

A OpenAI afirma que o GPT-4o mini herda os mesmos mecanismos rigorosos de proteção de segurança do GPT-4o e é o primeiro modelo a aplicar a abordagem de hierarquia de instruções da OpenAI, demonstrando capacidades defensivas mais fortes na API.

A intensificação da guerra de preços dos grandes modelos e o surgimento de modelos pequenos de alto desempenho impulsionarão uma integração mais ampla da IA em cenários cotidianos, ao mesmo tempo em que incentivam a indústria a repensar as formas de implementação da IA.