OpenAI недавно выпустила GPT-4o mini, уменьшенную и более экономичную версию своей модели GPT-4o. Вот ключевые моменты о GPT-4o mini:
-
Она превосходит GPT-3.5 Turbo в тестах на текстовый интеллект и мультимодальные рассуждения, и даже превосходит GPT-4 в рейтинге чат-ботов LMSYS.
-
Она поддерживает контекстное окно в 128K токенов и может выводить до 16K токенов за запрос, позволяя запоминать более длинные разговоры и генерировать более длинные ответы по сравнению с GPT-3.5 Turbo.
-
Цены значительно ниже, чем у GPT-3.5 Turbo:
- $0.15 за миллион входных токенов (около 1.09 юаней)
- $0.60 за миллион выходных токенов (около 4.36 юаней)
- Более чем на 60% дешевле, чем GPT-3.5 Turbo
-
Она заменит GPT-3.5 Turbo для бесплатных пользователей в ChatGPT.
-
Она будет обеспечивать работу функций ИИ Apple на мобильных устройствах и Mac начиная с этой осени, хотя, вероятно, все еще через облачную обработку, а не на устройстве.
-
В настоящее время она поддерживает текстовый ввод/вывод через API, с поддержкой изображений, видео и аудио в будущем.
-
Она использует улучшения в генерации токенов, как и GPT-4o, делая ее более эффективной для обработки нетекстовых данных на английском языке.
-
Тесты показывают, что она превосходит аналогичные "бюджетные" модели, такие как Gemini 1.5 Flash и Claude 3 Haiku, в таких областях, как математические рассуждения и генерация кода.
-
Акцент на меньшей, более экономичной модели - это изменение для OpenAI, вероятно, в ответ на спрос разработчиков на такие варианты.
-
Многие компании переходят на меньшие модели ИИ для снижения затрат при сохранении необходимой производительности.
OpenAI стремится сбалансировать расширение границ возможностей ИИ с предоставлением более доступных вариантов для разработчиков и приложений. GPT-4o mini представляет их выход в пространство "меньших, но способных" моделей, которое другие компании уже исследовали.