在英偉達 CEO 黃仁勛提出開發可與亞馬遜 AWS 競爭的云服務愿景兩年多之后,他已逐步放棄與這些大型云廠商直接競爭。知情人士及一份內部備忘錄顯示,上周他對公司云業務團隊進行了重組。
根據多位知情人士及內部備忘錄,這次重組重新安排了英偉達云業務部門負責人及其他相關高管,一些員工則離職。
根據備忘錄,Alexis Black Bjorlin 這位 2023 年從 Meta 加入英偉達的高管,將在公司內部擔任新的角色。英偉達云團隊(由數百人組成)將并入英偉達的工程與運營組織,該組織由軟件工程高級副總裁 Dwight Diercks 領導,并向黃仁勛匯報。
云團隊 DGX Cloud 將主要服務于英偉達工程師對芯片的需求,用于開發開源 AI 模型,而不再專注于向外部企業客戶銷售云服務。
在此次重組中,英偉達較新的云服務 DGX Cloud Lepton 也將并入工程團隊。該服務允許云提供商在英偉達運營的市場中列出未使用的服務器容量,但啟動速度并不快。
黃仁勛在 2023 年 3 月英偉達年度開發者與客戶大會上首次推出 DGX Cloud 服務。該計劃旨在開辟新的收入來源,并與租用英偉達芯片的 AI 開發者建立直接聯系(這些開發者通常通過 AWS、谷歌和微軟租用芯片)。
英偉達的賣點是,通過 DGX Cloud 使用其芯片能比云提供商自行配置的性能更好。
實際上,英偉達擔心隨著谷歌、微軟和亞馬遜各自開發 AI 芯片,客戶對英偉達芯片的依賴會下降,并可能轉向這些替代品。直接與 AI 開發者建立關系,是英偉達對沖風險的策略。
該計劃在紙面上具有很大潛力,英偉達也宣傳了早期客戶,如 ServiceNow、SAP 和 Amdocs。為了創建云服務,英偉達租用了主要云提供商的服務器,并按自家嚴格規格定制后,再租給 AI 開發者。
面臨的挑戰
多位前 DGX 團隊員工表示,團隊難以吸引客戶。此外,由于 DGX Cloud 實際運行在 AWS 等不同云提供商的數據中心,要為客戶提供故障排查支持非常困難:對某一設施的修復可能不適用于其他廠商的設施。
黃仁勛也不愿意擴大業務規模,以免觸怒那些也是英偉達最大芯片客戶的云提供商。此外,英偉達已采取多項措施為 CoreWeave、Lambda 等年輕云服務提供商提供資金支持,這些企業在某種程度上與 DGX Cloud 競爭。
今年早些時候,英偉達已逐步退出這一新興云業務。此前,該業務曾向投資者承諾可創造 1500 億美元收入,超過 AWS 年收入。
盡管 Google 等嘗試搶占市場份額,英偉達在 AI 芯片銷售上仍然占據絕對主導地位。AWS 對其 Trainium AI 芯片進行了大幅折扣,并與 OpenAI 討論交易方案,使 OpenAI 也可使用 Trainium 芯片。Meta 平臺也在考慮投入數十億美元購買谷歌的 AI 芯片(Tensor Processing Unit)。
英偉達也是 AWS、谷歌等云提供商購買的英偉達服務器的最大租用方之一。雖然英偉達曾嘗試將這些服務器租給 DGX Cloud 客戶,但同樣也用于開發包括機器人和自動駕駛技術在內的多種 AI 模型。公司表示,未來幾年計劃花費 260 億美元租用這些服務器。
英偉達發言人表示:“我們將繼續投資 DGX Cloud,為前沿研發提供世界級基礎設施,并為我們的云合作伙伴提供成功所需的軟件能力。我們的目標一直是將 DGX Cloud 作為學習如何為生態系統合作伙伴構建系統的平臺,這一點不會改變。”