GPT-4o mini оценка: Компактная модель демонстрирует отличные результаты, соотношение цены и качества становится ключом к успеху

Предстоящая презентация iOS 18 от компании Apple.

OpenAI недавно выпустила GPT-4o mini, уменьшенную и более экономичную версию своей модели GPT-4o. Вот ключевые моменты о GPT-4o mini:

  • Она превосходит GPT-3.5 Turbo в тестах на текстовый интеллект и мультимодальные рассуждения, и даже превосходит GPT-4 в рейтинге чат-ботов LMSYS.

  • Она поддерживает контекстное окно в 128K токенов и может выводить до 16K токенов за запрос, позволяя запоминать более длинные разговоры и генерировать более длинные ответы по сравнению с GPT-3.5 Turbo.

  • Цены значительно ниже, чем у GPT-3.5 Turbo:

    • $0.15 за миллион входных токенов (около 1.09 юаней)
    • $0.60 за миллион выходных токенов (около 4.36 юаней)
    • Более чем на 60% дешевле, чем GPT-3.5 Turbo
  • Она заменит GPT-3.5 Turbo для бесплатных пользователей в ChatGPT.

  • Она будет обеспечивать работу функций ИИ Apple на мобильных устройствах и Mac начиная с этой осени, хотя, вероятно, все еще через облачную обработку, а не на устройстве.

  • В настоящее время она поддерживает текстовый ввод/вывод через API, с поддержкой изображений, видео и аудио в будущем.

  • Она использует улучшения в генерации токенов, как и GPT-4o, делая ее более эффективной для обработки нетекстовых данных на английском языке.

  • Тесты показывают, что она превосходит аналогичные "бюджетные" модели, такие как Gemini 1.5 Flash и Claude 3 Haiku, в таких областях, как математические рассуждения и генерация кода.

  • Акцент на меньшей, более экономичной модели - это изменение для OpenAI, вероятно, в ответ на спрос разработчиков на такие варианты.

  • Многие компании переходят на меньшие модели ИИ для снижения затрат при сохранении необходимой производительности.

OpenAI стремится сбалансировать расширение границ возможностей ИИ с предоставлением более доступных вариантов для разработчиков и приложений. GPT-4o mini представляет их выход в пространство "меньших, но способных" моделей, которое другие компании уже исследовали.