GPT-4o mini评测：小型模型表现出色，性价比成为制胜关键

OpenAI最近发布了GPT-4o mini，这是他们GPT-4o模型的一个更小、更具成本效益的版本。以下是关于GPT-4o mini的要点：

它在文本智能和多模态推理基准测试中优于GPT-3.5 Turbo，甚至在LMSYS聊天机器人排行榜上超过了GPT-4。
它支持128K令牌的上下文窗口，每次请求可以输出多达16K个令牌，与GPT-3.5 Turbo相比，能够记住更长的对话并生成更长的回复。
定价显著低于GPT-3.5 Turbo：
- 每百万输入令牌0.15美元（约1.09人民币）
- 每百万输出令牌0.60美元（约4.36人民币）
- 比GPT-3.5 Turbo便宜60%以上
它将在ChatGPT中取代GPT-3.5 Turbo为免费用户提供服务。
从今年秋季开始，它将为Apple移动设备和Mac上的AI功能提供支持，尽管可能仍然通过云处理而非设备本地处理。
目前通过API支持文本输入/输出，后续将支持图像、视频和音频。
它与GPT-4o共享令牌生成的改进，使其在非英语文本处理方面更加高效。
基准测试显示，它在数学推理和代码生成等领域优于类似的"性价比"模型，如Gemini 1.5 Flash和Claude 3 Haiku。
专注于更小、更具成本效益的模型是OpenAI的一个转变，可能是为了响应开发者对此类选项的需求。
许多公司正在转向更小的AI模型，以降低成本同时仍能满足性能需求。

OpenAI旨在平衡推动AI能力的边界与为开发者和应用程序提供更易获取的选项。GPT-4o mini代表了他们进入其他公司已经在探索的"更小但有能力"模型空间的尝试。

苹果公司即将举行的iOS 18发布会。