OpenAI lanzó recientemente GPT-4o mini, una versión más pequeña y rentable de su modelo GPT-4o. Estos son los puntos clave sobre GPT-4o mini:
-
Supera a GPT-3.5 Turbo en inteligencia de texto y razonamiento multimodal, e incluso supera a GPT-4 en la clasificación de chatbots de LMSYS.
-
Admite una ventana de contexto de 128K tokens y puede generar hasta 16K tokens por solicitud, permitiéndole recordar conversaciones más largas y generar respuestas más extensas en comparación con GPT-3.5 Turbo.
-
El precio es significativamente más bajo que GPT-3.5 Turbo:
- $0.15 por millón de tokens de entrada (aproximadamente 1.09 RMB)
- $0.60 por millón de tokens de salida (aproximadamente 4.36 RMB)
- Más del 60% más barato que GPT-3.5 Turbo
-
Reemplazará a GPT-3.5 Turbo para usuarios gratuitos en ChatGPT.
-
Impulsará las funciones de IA de Apple en dispositivos móviles y Macs a partir de este otoño, aunque probablemente aún mediante procesamiento en la nube en lugar de en el dispositivo.
-
Actualmente admite entrada/salida de texto a través de API, con soporte para imágenes, video y audio próximamente.
-
Comparte mejoras en la generación de tokens con GPT-4o, haciéndolo más eficiente para el procesamiento de texto en idiomas distintos al inglés.
-
Las pruebas comparativas muestran que supera a modelos "económicos" similares como Gemini 1.5 Flash y Claude 3 Haiku en áreas como razonamiento matemático y generación de código.
-
El enfoque en un modelo más pequeño y rentable es un cambio para OpenAI, probablemente en respuesta a la demanda de los desarrolladores por tales opciones.
-
Muchas empresas están optando por modelos de IA más pequeños para reducir costos mientras siguen cumpliendo con las necesidades de rendimiento.
OpenAI busca equilibrar el avance de las capacidades de IA con la provisión de opciones más accesibles para desarrolladores y aplicaciones. GPT-4o mini representa su entrada en el espacio de modelos "más pequeños pero capaces" que otras empresas ya han estado explorando.