GPT-4o mini評測:小型模型表現出色,性價比成為制勝關鍵

蘋果公司即將舉行的iOS 18發佈會。

OpenAI 最近發布了 GPT-4o mini,這是他們 GPT-4o 模型的一個更小、更具成本效益的版本。以下是關於 GPT-4o mini 的重點:

  • 在文本智能和多模態推理基準測試中表現優於 GPT-3.5 Turbo,甚至在 LMSYS 聊天機器人排行榜上超越了 GPT-4。

  • 支持 128K 令牌的上下文窗口,每次請求可輸出最多 16K 令牌,與 GPT-3.5 Turbo 相比,可以記住更長的對話並生成更長的回應。

  • 定價顯著低於 GPT-3.5 Turbo:

    • 每百萬輸入令牌 $0.15(約 1.09 人民幣)
    • 每百萬輸出令牌 $0.60(約 4.36 人民幣)
    • 比 GPT-3.5 Turbo 便宜 60% 以上
  • 它將取代 ChatGPT 中免費用戶的 GPT-3.5 Turbo。

  • 從今年秋天開始,它將為 Apple 的移動設備和 Mac 上的 AI 功能提供支持,不過可能仍然是通過雲處理而非設備本地處理。

  • 目前通過 API 支持文本輸入/輸出,之後將支持圖像、視頻和音頻。

  • 它與 GPT-4o 共享令牌生成的改進,使其在非英語文本處理方面更加高效。

  • 基準測試顯示,它在數學推理和代碼生成等領域的表現優於類似的"性價比"模型,如 Gemini 1.5 Flash 和 Claude 3 Haiku。

  • 專注於更小、更具成本效益的模型是 OpenAI 的一個轉變,可能是為了回應開發者對此類選項的需求。

  • 許多公司正在轉向更小的 AI 模型,以降低成本同時仍滿足性能需求。

OpenAI 旨在平衡推動 AI 能力的界限與為開發者和應用程序提供更易獲得的選擇。GPT-4o mini 代表了他們進入其他公司已經在探索的"更小但有能力"模型領域。