マスク氏のxAIが新モデルを発表:顕著な進歩を遂げるも、リーダーの地位には至らず

Grokの画像生成機能には制限がなく、ユーザーは政治家の画像を自由に作成できますが、ChatGPTはこのような内容の生成を拒否します。

「Grokの進歩はロケットのようだ。」マスクはXで興奮してGrok-2の到来を発表しました。

現地時間8月14日、xAIはGrok-2とGrok-2miniという2つのAIモデルのベータ版をリリースしました。Grok-2は同社の推論能力が最も高い言語モデルであり、軽量モデルのGrok-2miniはGrok-2の「兄弟製品」で、小さなパラメータ数で強力な機能の実現を目指しています。

xAIはブログ記事で、Grok-2の早期プレビュー版がGrok-1.5と比較して大きな進歩を遂げ、チャット、コーディング、推論の面で最先端の機能を持っていると述べています。

同社によると、Grok-2の初期バージョンは「sus-column-r」という名前でテストされ、LMSYSランキングでAnthropicのClaude 3.5 SonnetやOpenAIのGPT-4-Turboを上回る性能を示したとのことです。LMSYSランキングは、大規模言語モデル間でランダムな匿名の一対一「対戦」を行い、ELOレーティングシステムに基づいてランキングを算出します。

sus-column-r(Grok 2初期バージョン)は現在公開されており、12,000以上のコミュニティ投票により、総合ランキングで3位を獲得し、GPT-4oと同等の評価を得ています。コーディングで2位、難しいプロンプトで4位、数学でも2位を獲得しました。

xAIはまた、AIチューターシステムを通じてGrokと新モデルの相互作用パフォーマンスをテストし、Grok-2は指示に従う能力と正確で真実の情報を提供する能力という2つの重要な分野での能力を重点的に評価しました。Grok-2は、検索した内容の推論やツールの使用能力において顕著な進歩を示し、例えば欠落情報の正確な識別、イベントシーケンスを通じた推論、関連性のない投稿の破棄などができるようになりました。

さらに、xAIは一連の学術ベンチマークを通じてGrok-2モデルを評価しました。これらのベンチマークには推論、読解力、数学、科学、コーディングが含まれます。同社は「大学院レベルの科学知識、常識、数学コンテストの問題などの分野で他の最先端モデルと同等の性能を示している」と述べています。

マスクはxAIを買収したソーシャルメディア「X」と深く結びつけています。Grok-2とGrok-2miniはXの拡張検索機能、投稿の深い理解、返信機能の改善をサポートします。ただし、以前xAIがXユーザーのデータを訓練に使用したことで反対を受けたことがあります。

今回の更新の大きな特徴は、Grok-2モデルがX上で画像を生成できることです。その画像生成モデルは最近話題のFlux.1モデルを使用していますが、現在はXのPremiumおよびPremium+ユーザーに限定されています。

Grokの画像生成機能に制限がないため、多くのユーザーがこれを利用して政治家の画像を作成しています。例えば、あるユーザーがGrok-2を使用してアメリカ初代大統領ワシントンの画像を生成し、その投稿がマスクによって再投稿されました。一方、OpenAIのChatGPTはこのような画像の生成を拒否し、政治的リスクを回避しています。

注目すべきは、Grok-2とGrok-2miniが現在もテスト段階にあることです。同社は、今月後半に企業APIを通じて開発者にこれら2つのモデルを提供する予定です。近日公開予定のAPIは新しいカスタム技術スタック上に構築され、グローバルな低遅延アクセスを実現するためのマルチリージョン推論デプロイメントを可能にし、同時に強制的な多要素認証、トラフィック統計データ、高度な請求分析などの強化されたセキュリティ機能を提供します。

OpenAIとの決別後、マスクは2029年に汎用人工知能が実現すると予測し、彼が設立したxAIの最終目標は、消費者、企業、さらにはすべての人がAI製品を使用し、有用なツールになることです。AIを通じて複雑な科学的・数学的問題を解決し、宇宙を「理解」することを目指しています。

xAIの動きも加速しています。同社は2024年1月に初めての資金調達を行い、1.35億ドルを調達しました。5月には60億ドルのシリーズB資金調達を完了し、企業価値も以前の180億ドルから250億ドルに急上昇し、アメリカの新たなAIユニコーン企業となりました。

7月には、マスクはxAIチームが「メンフィス・スーパークラスター」でトレーニングを開始したと述べました。このクラスターは10万個の液冷H100 GPUで構成されており、今年12月までに「あらゆる指標で世界最強のAI」を訓練することを目標としています。

彼の野心はそれにとどまらず、xAIが「計算力のスーパーファクトリー」というスーパーコンピューターを構築する計画を明かし、その規模は市場で最も強力な競合他社の4倍になると予想しています。

大規模モデルの「後発者」として、マスクはxAIが人工知能分野に新たなブレークスルーとイノベーションをもたらすことができると考えており、同時に競争が業界全体の進歩を促進し、1社が人工知能分野で支配的な地位を占める単極世界の形成を避けるのに役立つと強調しています。

しかし、最新の2つのモデルを見る限り、業界を超える革新性は示されておらず、依然として追随者の役割にとどまっています。Grok-2がOpenAI、Google、その他の技術企業との競争で突破口を開くためには、より強力な製品を提示する必要があります。