自社構築クラスターへの自信が高まる
5月、The Informationは、マスクが2025年秋までにオラクルと協力して10万台のH100を搭載したスーパーコンピュータークラスターを構築する計画を報じました。xAIはオラクルのサーバーをリースするために100億ドルを投資すると言われていました。
最近、マスクはオラクルとのスーパーコンピュータークラスター協力の終了に関するニュースについて言及しました。彼は、xAIがGrok-2の訓練のためにオラクルから24,000台のH100のリソースを取得したと述べ、xAIとオラクル間のサーバーリース協力が継続していることを確認しました。
しかし、10万台のH100 GPUクラスターについては、自社で構築することを選択し、最速のペースで推進し、わずか19日で10万枚のカードの設置を完了したと報告されています。
デルとスーパーマイクロがマスクの新たなパートナーとなりました。両社のCEOは最近、ツイッターで協力関係にあることを表明し、データセンターの写真を添えています。
マスク自身がクラスター構築過程で現場を訪れました。彼はまた、ツイッターでGrokがメンフィスで訓練中であり、Grok-2は8月にリリースされると明かしました。
注目すべきは、オラクルが以前クラスターの設置場所の電力供給について懸念を示していたことです。推定では、10万台のH100には電力網から150メガワットの電力割り当てが必要ですが、マスクはこの問題を解決したようです。
最新の情報によると、クラスターは現在8メガワットを有しています。8月1日に契約を締結した後、50メガワットを確保する予定です。現在、32,000枚のカードがオンラインで、第4四半期には100%がオンラインになる見込みで、GPT-5スケールのモデルの訓練と実行をサポートするのに十分です。
結論として、AI大手は自社で計算能力を持つことがより信頼できると考え、現金を燃やす価値があると判断しています。推定コストでは、H100は1台約3万〜4万ドルです。マスクのスーパーコンピュータークラスターは40億ドル(290億元以上)と評価されています。
以前の報道では、マイクロソフトとOpenAIが「Stargate」と呼ばれる1,000億ドルのデータセンタープロジェクトを計画していると伝えられていました。内部関係者によると、オラクルとマイクロソフトは10万台のB200 GPUを含む取引を締結しつつあり、クラスターは来年の夏までに準備できる可能性があります。
さらに、Metaは豪華なスーパーコンピュータークラスターを持っていると噂されており、AWSなどのクラウドプロバイダーはさらに多くの投資をデータセンターに行っています。