Новая версия GPT-4o mini снизила цену до 1 юаня за миллион токенов, что снова вывело OpenAI вперед в конкуренции с другими AI-компаниями.
OpenAI запустила свою самую экономичную модель GPT-4o mini вечером 18 июля. Цена API для ввода составляет 15 центов (около 1,09 юаня) за миллион токенов, а цена вывода - 60 центов (около 4,36 юаня) за миллион токенов, что более чем на 60% дешевле, чем GPT-3.5 Turbo. Несмотря на снижение цены, возможности GPT-4o mini значительно улучшились, достигнув 82% в тесте MMLU и превзойдя GPT-4 в рейтинге LMSYS по предпочтениям в чате.
По сравнению с небольшими моделями других компаний, GPT-4o mini показывает отличное соотношение цены и качества:
- Gemini 1.5 Flash от Google: 2,5 юаня за миллион токенов на входе, 7,6 юаня за миллион токенов на выходе
- Claude 3 Haiku от Anthropic: 1,8 юаня за миллион токенов на входе, 9 юаней за миллион токенов на выходе
GPT-4o mini превосходит этих конкурентов по всем показателям.
Китайские AI-компании, такие как Deep Seeking, Zhipu AI, ByteDance, Alibaba Cloud, Baidu, Tencent Cloud и iFlytek, также значительно снизили цены в июне, но теперь их ценовое преимущество ослабло. Например:
- Qwen-Turbo от Alibaba Cloud: 2 юаня за миллион токенов на входе, 6 юаней за миллион токенов на выходе
- Серия ERNIE 3.5 от Baidu: 12 юаней за миллион токенов как на входе, так и на выходе
- Doubao-pro-128k от ByteDance: 5 юаней за миллион токенов на входе, 9 юаней за миллион токенов на выходе
Генеральный директор OpenAI Сэм Альтман заявил, что GPT-4o mini "движется к интеллекту, который слишком дешев, чтобы его измерять". По сравнению с моделью GPT-3 text-davinci-003 2022 года, стоимость токенов GPT-4o mini снизилась на 99%.
GPT-4o mini обладает следующими характеристиками:
- Способность обрабатывать контекст в 128k токенов
- Поддержка текстового и визуального ввода
- Поддержка вывода 16k токенов
- В будущем планируется расширение до ввода/вывода видео и аудио
В нескольких авторитетных глобальных тестах GPT-4o mini превзошла GPT-3.5 Turbo и другие небольшие модели:
- Тест MMLU на текстовый интеллект и рассуждение: 82,0%
- Тест MGSM на математические рассуждения: 87,0%
- Тест HumanEval на производительность кодирования: 87,2%
- Оценка мультимодальных рассуждений MMMU: 59,4%
GPT-4o mini уже бесплатно доступна в ChatGPT и, как ожидается, постепенно заменит GPT-3.5. OpenAI планирует запустить функцию тонкой настройки GPT-4o mini в ближайшие дни.
AI-эксперт Андрей Карпати считает, что конкуренция в размерах больших языковых моделей усиливается, но наблюдается обратная тенденция. Он предсказывает появление очень маленьких, но мощных моделей в будущем.
OpenAI заявляет, что GPT-4o mini унаследовала такие же строгие механизмы безопасности, как и GPT-4o, и является первой моделью, применяющей подход OpenAI к иерархии инструкций, демонстрируя более сильные защитные возможности в API.
Усиление ценовой войны больших моделей и появление небольших высокопроизводительных моделей будет способствовать более широкому внедрению AI в повседневные сценарии, а также заставит отрасль переосмыслить способы внедрения AI.