La nueva versión de GPT-4o mini ha reducido su precio a 1 yuan por millón de tokens, una medida que vuelve a poner a OpenAI a la cabeza en la competencia con otras empresas de IA.
OpenAI lanzó el 18 de julio por la noche su modelo más económico, GPT-4o mini. El precio de la API de entrada de este modelo es de 15 centavos (aproximadamente 1,09 yuanes) por millón de tokens, y el precio de salida es de 60 centavos (aproximadamente 4,36 yuanes) por millón de tokens, más de un 60% más barato que GPT-3.5 Turbo. A pesar de la reducción de precio, las capacidades de GPT-4o mini han mejorado significativamente, obteniendo un buen resultado del 82% en la prueba MMLU y superando a GPT-4 en la preferencia de chat en el ranking LMSYS.
En comparación con los modelos pequeños de otras empresas, GPT-4o mini muestra un excelente rendimiento en términos de relación calidad-precio:
- Gemini 1.5 Flash de Google: precio de entrada 2,5 yuanes/millón de tokens, precio de salida 7,6 yuanes/millón de tokens
- Claude 3 Haiku de Anthropic: precio de entrada 1,8 yuanes/millón de tokens, precio de salida 9 yuanes/millón de tokens
GPT-4o mini supera completamente a estos competidores en rendimiento.
Las empresas de IA nacionales como Deep Exploration, Zhipu AI, ByteDance, Alibaba Cloud, Baidu, Tencent Cloud e iFlytek también redujeron significativamente sus precios en junio, pero ahora su ventaja de precio se ha debilitado. Por ejemplo:
- Qwen-Turbo de Alibaba Cloud: precio de entrada 2 yuanes/millón de tokens, precio de salida 6 yuanes/millón de tokens
- Serie ERNIE 3.5 de Baidu: precio de entrada y salida 12 yuanes/millón de tokens
- Doubao-pro-128k de ByteDance: precio de entrada 5 yuanes/millón de tokens, precio de salida 9 yuanes/millón de tokens
Sam Altman, CEO de OpenAI, afirma que GPT-4o mini está "avanzando hacia una inteligencia tan barata que es inconmensurable". En comparación con el modelo GPT-3 text-davinci-003 de 2022, el costo de tokens de GPT-4o mini se ha reducido en un 99%.
GPT-4o mini tiene las siguientes características:
- Capacidad de procesamiento de contexto de 128k tokens
- Admite entrada de texto y visual
- Admite 16k tokens de salida
- Se ampliará en el futuro para entrada/salida de video y audio
En varias pruebas de referencia globales autorizadas, GPT-4o mini supera a GPT-3.5 Turbo y otros modelos pequeños:
- Prueba de inteligencia y razonamiento de texto MMLU: 82.0%
- Prueba de razonamiento matemático MGSM: 87.0%
- Prueba de rendimiento de codificación HumanEval: 87.2%
- Evaluación de razonamiento multimodal MMMU: 59.4%
GPT-4o mini ya está disponible gratuitamente en ChatGPT y se espera que reemplace gradualmente a GPT-3.5. OpenAI planea lanzar la función de ajuste fino de GPT-4o mini en los próximos días.
El experto en IA Andrej Karpathy cree que la competencia por el tamaño de los modelos de lenguaje grande se está intensificando, pero muestra una tendencia regresiva. Predice que en el futuro aparecerán modelos muy pequeños pero potentes.
OpenAI afirma que GPT-4o mini hereda los mismos mecanismos de seguridad estrictos que GPT-4o y es el primer modelo en aplicar el enfoque de jerarquía de instrucciones de OpenAI, mostrando capacidades defensivas más fuertes en la API.
La intensificación de la guerra de precios de los grandes modelos y la aparición de modelos pequeños de alto rendimiento impulsarán una integración más amplia de la IA en escenarios cotidianos, al tiempo que obligarán a la industria a repensar la forma de implementar la IA.