马斯克囤积10万H100芯片 打造顶级AI超算备战新模型

总价值超过290亿元

对自建集群更有信心

5月,The Information报道称马斯克计划与甲骨文合作,到2025年秋季建造一个拥有10万台H100的超级计算机集群。据说xAI将投资100亿美元租用甲骨文的服务器。

最近,马斯克回应了终止与甲骨文合作建设超级计算机集群的消息。他表示,xAI从甲骨文获得了24,000台H100的资源来训练Grok-2,确认了xAI与甲骨文之间正在进行的服务器租赁合作。

然而,对于10万台H100 GPU集群,他们选择自己建造,并以最快的速度推进,据报道仅用19天就完成了10万张卡的安装。

戴尔和超微成为马斯克的新合作伙伴。两家公司的CEO最近在Twitter上表示他们正在合作,并附上了数据中心的照片。

马斯克在集群建设过程中亲自到现场视察。他还在Twitter上透露,Grok正在孟菲斯训练,Grok-2将于8月发布。

值得注意的是,甲骨文此前曾对集群位置的电力供应表示担忧。估计10万台H100需要从电网分配150兆瓦的电力,但马斯克似乎已经解决了这个问题。

最新消息显示,该集群目前拥有8兆瓦。8月1日签署协议后,他们将拥有50兆瓦。现在,32,000张卡已上线,预计第四季度将100%上线 - 足以支持训练和运行GPT-5规模的模型。

总之,AI巨头认为将计算力掌握在自己手中更可靠,值得烧钱。估计每台H100的成本约为3万至4万美元。马斯克的超级计算机集群价值40亿美元(超过290亿人民币)。

早前有报道称,微软和OpenAI计划投资1000亿美元的数据中心项目,代号"星门"。内部人士透露,甲骨文和微软正在达成一项涉及10万台B200 GPU的交易,该集群可能在明年夏天准备就绪。

此外,有传言称Meta拥有一个豪华的超级计算机集群,而像AWS这样的云提供商在数据中心的投资更多。