据多位知情人士及一份内部备忘录透露,两年多前,英伟达首席执行官黄仁勋曾提出愿景,计划打造一项可与亚马逊云科技(AWS)抗衡的云计算服务;如今,英伟达已放弃与这类企业的直接竞争,并于上周对公司云计算团队进行了重组。
知情人士称,上周发布的一份员工备忘录通报了此次重组计划,英伟达云计算部门负责人及数位相关高管被调任新职,另有部分高管离职。
备忘录显示,2023 年从Meta加盟英伟达、直接向黄仁勋汇报的高管Alexis Black Bjorlin,计划在公司内部调任新岗位。英伟达目前正将旗下数百人规模的云计算团队,并入由高级副总裁Dwight Diercks执掌的工程与运营部门,Diercks同时也向黄仁勋汇报工作。
备忘录及该部门内部人士均表示,这支名为DGX Cloud的团队今后将优先满足英伟达工程师对自家芯片的需求 —— 这些芯片主要用于开源人工智能模型的开发,不再以向外部企业客户销售云计算服务为核心目标。
作为重组的一部分,英伟达较新推出的云计算服务DGX Cloud Lepton也将并入工程团队。该服务原本旨在帮助云服务供应商,在英伟达运营的交易平台上挂牌出售闲置的英伟达服务器算力,但自推出以来,业务推进速度始终较为缓慢。
2023 年 3 月,黄仁勋在英伟达年度旗舰开发者与客户大会上,首次推出了 DGX Cloud服务。这项业务的初衷是为英伟达开辟新的收入来源,同时助力公司与人工智能开发者建立直接合作关系 —— 此前这类开发者主要通过亚马逊云科技、谷歌、微软等云服务商租赁英伟达芯片。
英伟达当时的核心卖点是,相较于云服务商对芯片的配置方案,通过 DGX Cloud服务使用的芯片性能表现更优。
事实上,英伟达当时已察觉到潜在风险:随着谷歌、微软、亚马逊等企业纷纷自研人工智能芯片,市场对英伟达芯片的依赖度可能下降,客户或将被这些替代产品分流。而与人工智能开发者建立直接合作关系,正是英伟达应对这一风险的对冲策略。
至少在理论层面,该计划具备巨大潜力。英伟达当时还高调宣传了 ServiceNow、SAP、Amdocs等早期客户。为打造这项云计算服务,英伟达先是向主流云服务商租赁服务器,再按照自身严苛标准完成定制化改造,之后再转租给人工智能开发者使用。
战略重心的冲突
多位该部门内部人士表示,DGX Cloud团队一直面临客户增长乏力的困境。另有知情人士指出,由于 DGX Cloud服务实际部署在亚马逊云科技等多家云服务商的数据中心,技术支持工作面临诸多阻碍 —— 针对某一家数据中心的故障修复方案,往往无法适用于其他云服务商的机房。
一位知情人士透露,黄仁勋始终不愿大举扩张这项业务,以免触怒亚马逊云科技等核心客户 —— 这些企业都是英伟达芯片的采购大户。不仅如此,英伟达还通过多种财务支持方式,扶持 CoreWeave、Lambda 等新兴云服务商,而这些企业的业务范围与 DGX Cloud形成了直接竞争。
英伟达曾向投资者承诺,这项新兴云计算业务未来有望创造 1500 亿美元的年收入,这一规模超过了亚马逊云科技当前的年营收。但今年早些时候,英伟达已逐步缩减了该业务的投入力度。
尽管谷歌等企业试图抢占市场份额,但英伟达在人工智能芯片市场的绝对主导地位依然稳固。目前,亚马逊云科技已大幅下调其自研 Trainium 人工智能芯片的租赁价格,同时正与主要使用英伟达芯片的人工智能开发企业 OpenAI 洽谈合作,推动对方同时采用 Trainium 芯片。此外,Meta也在考虑斥资数十亿美元采购谷歌的TPU。
这些科技企业之间的业务联系盘根错节,另一例证是:英伟达如今已成为亚马逊云科技、谷歌等云服务商的 “大客户”—— 它向这些企业租赁了大量搭载英伟达芯片的服务器。英伟达一方面尝试将部分服务器算力转租给 DGX Cloud客户,另一方面也利用这些服务器开展各类人工智能模型的研发工作,覆盖技术、自动驾驶技术等多个领域。
英伟达曾公开表示,计划在未来几年内投入 260 亿美元,用于租赁此类服务器。
英伟达发言人对此表示:“我们将持续投入 DGX Cloud服务,为前沿研发工作提供世界级的基础设施支撑,同时为云服务合作伙伴提供助力其发展的软件技术支持。我们的核心目标始终是通过试点和培育 DGX Cloud服务,探索如何更好地为生态合作伙伴打造系统解决方案,这一战略方向不会改变。”



还没有评论,来说两句吧...