GPT-4o mini評測：小型模型表現出色，性價比成為制勝關鍵

OpenAI 最近發布了 GPT-4o mini，這是他們 GPT-4o 模型的一個更小、更具成本效益的版本。以下是關於 GPT-4o mini 的重點：

在文本智能和多模態推理基準測試中表現優於 GPT-3.5 Turbo，甚至在 LMSYS 聊天機器人排行榜上超越了 GPT-4。
支持 128K 令牌的上下文窗口，每次請求可輸出最多 16K 令牌，與 GPT-3.5 Turbo 相比，可以記住更長的對話並生成更長的回應。
定價顯著低於 GPT-3.5 Turbo：
- 每百萬輸入令牌 $0.15（約 1.09 人民幣）
- 每百萬輸出令牌 $0.60（約 4.36 人民幣）
- 比 GPT-3.5 Turbo 便宜 60% 以上
它將取代 ChatGPT 中免費用戶的 GPT-3.5 Turbo。
從今年秋天開始，它將為 Apple 的移動設備和 Mac 上的 AI 功能提供支持，不過可能仍然是通過雲處理而非設備本地處理。
目前通過 API 支持文本輸入/輸出，之後將支持圖像、視頻和音頻。
它與 GPT-4o 共享令牌生成的改進，使其在非英語文本處理方面更加高效。
基準測試顯示，它在數學推理和代碼生成等領域的表現優於類似的"性價比"模型，如 Gemini 1.5 Flash 和 Claude 3 Haiku。
專注於更小、更具成本效益的模型是 OpenAI 的一個轉變，可能是為了回應開發者對此類選項的需求。
許多公司正在轉向更小的 AI 模型，以降低成本同時仍滿足性能需求。

OpenAI 旨在平衡推動 AI 能力的界限與為開發者和應用程序提供更易獲得的選擇。GPT-4o mini 代表了他們進入其他公司已經在探索的"更小但有能力"模型領域。

蘋果公司即將舉行的iOS 18發佈會。