OpenAIは最近、GPT-4oモデルのより小型で費用対効果の高いバージョンであるGPT-4o miniをリリースしました。以下がGPT-4o miniに関する主要なポイントです:
-
テキスト知能とマルチモーダル推論のベンチマークでGPT-3.5 Turboを上回り、LMSYSチャットボットリーダーボードではGPT-4さえも凌駕しています。
-
128Kトークンのコンテキストウィンドウをサポートし、1リクエストあたり最大16Kトークンを出力できるため、GPT-3.5 Turboと比較してより長い会話を記憶し、より長い応答を生成できます。
-
価格はGPT-3.5 Turboよりも大幅に低くなっています:
- 入力トークン100万個あたり0.15ドル(約1.09人民元)
- 出力トークン100万個あたり0.60ドル(約4.36人民元)
- GPT-3.5 Turboより60%以上安価
-
ChatGPTの無料ユーザー向けにGPT-3.5 Turboの代替となります。
-
今秋からAppleのモバイルデバイスとMacのAI機能を支えますが、おそらくまだオンデバイスではなくクラウド処理を通じて行われるでしょう。
-
現在、APIを通じてテキスト入力/出力をサポートしており、画像、動画、音声のサポートは後日追加される予定です。
-
GPT-4oとトークン生成の改善を共有しており、非英語テキスト処理がより効率的になっています。
-
ベンチマークでは、数学的推論やコード生成などの分野で、Gemini 1.5 FlashやClaude 3 Haikuなどの類似の「バリュー」モデルを上回る性能を示しています。
-
より小型で費用対効果の高いモデルに焦点を当てることは、OpenAIにとって方向転換であり、おそらく開発者からのそのようなオプションへの需要に応えたものです。
-
多くの企業が、コスト削減と性能要件の両立を目指して、より小型のAIモデルへ移行しています。
OpenAIは、AIの能力の限界を押し広げることと、開発者やアプリケーションにとってよりアクセスしやすいオプションを提供することのバランスを取ることを目指しています。GPT-4o miniは、他の企業がすでに探求している「小型だが高性能」なモデル領域への参入を表しています。