GPT-4o mini评测:小型模型表现出色,性价比成为制胜关键

苹果公司即将举行的iOS 18发布会。

OpenAI最近发布了GPT-4o mini,这是他们GPT-4o模型的一个更小、更具成本效益的版本。以下是关于GPT-4o mini的要点:

  • 它在文本智能和多模态推理基准测试中优于GPT-3.5 Turbo,甚至在LMSYS聊天机器人排行榜上超过了GPT-4。

  • 它支持128K令牌的上下文窗口,每次请求可以输出多达16K个令牌,与GPT-3.5 Turbo相比,能够记住更长的对话并生成更长的回复。

  • 定价显著低于GPT-3.5 Turbo:

    • 每百万输入令牌0.15美元(约1.09人民币)
    • 每百万输出令牌0.60美元(约4.36人民币)
    • 比GPT-3.5 Turbo便宜60%以上
  • 它将在ChatGPT中取代GPT-3.5 Turbo为免费用户提供服务。

  • 从今年秋季开始,它将为Apple移动设备和Mac上的AI功能提供支持,尽管可能仍然通过云处理而非设备本地处理。

  • 目前通过API支持文本输入/输出,后续将支持图像、视频和音频。

  • 它与GPT-4o共享令牌生成的改进,使其在非英语文本处理方面更加高效。

  • 基准测试显示,它在数学推理和代码生成等领域优于类似的"性价比"模型,如Gemini 1.5 Flash和Claude 3 Haiku。

  • 专注于更小、更具成本效益的模型是OpenAI的一个转变,可能是为了响应开发者对此类选项的需求。

  • 许多公司正在转向更小的AI模型,以降低成本同时仍能满足性能需求。

OpenAI旨在平衡推动AI能力的边界与为开发者和应用程序提供更易获取的选项。GPT-4o mini代表了他们进入其他公司已经在探索的"更小但有能力"模型空间的尝试。