《电子技术应用》
您所在的位置:首页 > 人工智能 > 业界动态 > 未来10年前沿模型门槛或达千亿美元

未来10年前沿模型门槛或达千亿美元

AI训练难以全部转向推理阶段
2024-09-18
来源:钛媒体

“(算力)这场竞赛将永远进行下去,以建立一个更好的神经网络。训练 AI模型的成本是天文数字。当我谈到建立千兆瓦或数千兆瓦的数据中心时,将是一个真正的前沿 AI 模型入门价格,如果有人想在该领域竞争,大约1000亿美元。”全球数据库巨头甲骨文(oracle)公司联合创始人、董事长埃里森( Larry Ellison)于9月初财报电话会议上表示,未来4到5年内,任何想参与这场大模型竞赛的企业,前沿模型门槛或高达1000亿美金,而且这场算力军备竞赛将永远进行下去。

0.png

今年80岁的埃里森,是甲骨文公司的开拓者。47年前,他和鲍勃·迈纳 (Bob Miner) 、艾德·奥茨 (Ed Oates) 成立了软件开发实验室 (SDL),并受美国中央情报局委托开发代号为“Oracle”的数据库程序,该公司后来更名为Oracle Corporation,并于1986年成功完成IPO上市。

2014年9月,埃里森宣布辞去甲骨文CEO一职,并被任命为甲骨文董事会执行主席兼首席技术官。2024年4月,埃里森被美国《时代》杂志列入2024年全球100位最具影响力人物名单。

近期埃里森的一则“真实故事”引发关注。他在投资者会议上承认,他不得不恳求英伟达(NVIDIA)CEO黄仁勋 (Jensen Huang) 为公司提供最新的 GPU,被认为是当前 AI 算力短缺的一个重要印证。

“在帕洛阿尔托的 Nobu,我和埃隆·马斯克 (Elon Musk) 、黄仁勋共进晚餐,我可以形容那顿晚餐,就是我和马斯克恳求黄仁勋提供 GPU。请收下我们的钱;不,多收点。你拿的还不够;我们需要你多收点钱,拜托,”埃里森在电话会议上说,最后,“一切顺利,成功了。”

从结果来看,这笔钱花得值得。甲骨文最近宣布,将打造一个由131072个英伟达GB200 NVL72 Blackwell GPU 组成的Zettascale AI 超级集群 ,可提供 2.4 ZettaFLOPS 的 AI 性能,比马斯克的 xAI 算力集群更强大,后者目前拥有100,000个英伟达 H100 GPU显卡。

同时,甲骨文的AI计划还需要大量电力,该公司已经获得建造三座模块化核反应堆的许可,以满足其设施电力需求。然而,构建核反应堆部署到数据中心可能需要数年时间,因此,当前甲骨文可能会在必要时使用大型移动发电机来增加本地电力供应。

今年9月9日,甲骨文公布截至今年8月的2025财年第一财季业务,甲骨文营收同比超预期增长7%,至133亿美元。其中,备受瞩目的云基础设施(OCI)营收也比华尔街预期的强劲,同比增长45%至22亿美元。甲骨文提供的第二财季营收指引增长区间为8%到10%,中位值高于分析师预期的增速8.72%。

埃里森在财报会议上表示,未来会有很多专业模型,比如他自己就参与类似的模型——使用计算机查看活检切片或CT扫描以发现癌症,以及用血液检测来发现癌症。“这些往往是非常专业的模型。它们不一定使用基础的Groks、ChatGPT、Llama和Gemini,它们往往是高度专业化的模型……我们将看到越来越多像这样的应用。”

不过,埃里森对分析师强调,如果以未来5年甚至10年的眼光来看,我们还没有进入已经训练完所有需要的模型,转向推理的阶段。

“这是一场争夺技术霸主地位的持续战斗,这场战斗将在未来五年,可能更像是10年内,由少数几家公司和一个国家来进行。所以这个业务正在变得越来越大。没有放缓或转变的迹象。”埃里森强调,“事情变得多么疯狂,但这就是正在发生的事情。”

摩根士丹利分析师 Keith Weiss 随后发文表示,今年迄今为止,甲骨文的股价表现已远超过软件业同行。他将这一强劲的表现归结为,甲骨文被投资者视为AI硬件稀缺的主要受益者,这推动了其 OCI 业务的发展。

年初至今,甲骨文股价大涨了63.68%,增速高于标普500和纳斯达克综合指数。

受甲骨文利好消息影响,埃里森身价大涨。截至北京时间9月17日,《福布斯》全球亿万富豪排行榜实时数据显示,埃里森的个人净资产增至2065亿美元,排名第二,高于亚马逊创始人贝佐斯、股神巴菲特、Meta创始人扎克伯格等人,仅次于特斯拉CEO马斯克(Elon Musk)。有趣的是,埃里森还是特斯拉董事会独立董事。

9月14日,甲骨文在年度金融分析师会议上透露,预计2026财年,公司营收将至少达到660亿美元,上调知音并超出分析师预期。预计到2029财年,甲骨文营收至少高达1040亿美元,相当于三年内收入增长近58%。

以下是甲骨文Q1财报会上的部分问答实录:

分析师:谢谢。我想问一个关于利润率的问题。你不断提供强大的云服务收入数字,尤其是 OCI 数字,当你给他们(竞争对手)提供指导,看看你必须做什么才能打击他们时,至少可以说,他们看起来真的很难做到。

埃里森(Larry Ellison):让我们从员工开始,然后进入自治数据库(Oracle Autonomous Database)。我们获得了巨大的效率,就在我们说话的时候,我们正在将融合和下周转移到自治数据库。我们已经决定一切都需要转移到自主,因为两个原因,真的。第一个原因是,当您拥有一个完全自治的数据库时,没有DBA,数据库管理员是一个机器人。没有与管理Oracle自治数据库相关的人力。

现在,这显然是一种成本节约。但更重要的是,没有人力,就没有人为错误。与竞争对手相比,我们拥有巨大的安全优势。不会犯任何错误。没有人力,全是自动化的。当你把一切都完全自动化时,它的潜力也是非常有弹性的。我不会详细说明这意味着什么,但它意味着你的工作运行突然需要500个微处理器。你在3分钟内得到了500美元,你需要它。然后你把它们放回游泳池。所以这与其他数据库的工作方式非常不同,他们可能会调用。云本身可能在某些地方是有弹性的,但它们的数据库通常没有弹性。自主是我们使用更少的硬件,速度更快,效率更高,完全自动化,没有人力,更安全。基于自主数据库的业务的利润率远远高于传统的Oracle业务。

我认为这些利润是惊人的高,与SaaS的利润差不多,SaaS也是惊人的硬市场,因为Sass主要在自主数据库上运行。我们非常高效地使用硬件。我们很少使用劳动力,因为劳动力是一个安全风险。当人们实际手动操作时,安全风险会降低我们的扩展能力。从最大到最小的每个Oracle数据中心在特性和功能上都是相同的。它们仅随以下因素而变化。

这意味着我们有一套自动化软件,可以自动完成所有这些工作。没有其他人这样做。没有人有那种程度的自动化,那种程度的自主性。它使我们能够在数据库业务、SaaS业务和其他云业务中获得更高的利润。我们的云更加自动化。我们的劳动力成本很低。我们的网络更加高效。它们是运行速度快得多的域网络。如果你的运行速度快一倍,我们的成本就会下降一半,而且我们的网络比其他云快得多。因此,我们认为我们的潜力,随着我们规模的扩大,我们提供比目前更好的利润的潜力,这是非常真实的。

我相信是这样。例如,我认为当我们将 Fusion 迁移到自治数据库时,您会发现不同工程师的不同观点。我认为成本节省——我们的成本——我们的云成本节省将达到 50% 左右。这就是我所相信的。现在可能是 40%,也可能是 35%,但与现在相比,我们将节省大量成本,而且这涉及整个 Fusion 客户群。所以这只是我们如何使用更快的网络、更快的数据库、更多的自动化来使我们的产品更安全的一个例子。我一直强调安全确实是主要目标。但作为次要效应,我们最终也会花费更少的钱来运营这些数据中心。

分析师:我是摩根大通的马克·墨菲。Larry,你如何看待市场从AI训练阶段向AI推理阶段过渡?有一些争论认为,在曲线的前端我们可能存在不平衡或泡沫,因为训练是计算密集型的,然后也许它会在推理阶段以某种方式重新校准,而推理阶段可能不那么密集?或者你认为在这两个阶段都有高增长的潜力?

埃里森:很多人认为,我送孩子上大学然后就完成了。他们的训练结束了。我有四年的训练,然后我可以让孩子去工作,他们会做推理。这是不对的。这场竞赛永远不会结束,要建立更好的神经网络。这种训练的成本变得天文数字般高昂。当我谈到建造吉瓦级或多吉瓦级数据中心时,我的意思是这些AI模型,这些前沿模型将要 - 对于任何想要在这个领域竞争的人来说,一个真正的前沿模型的入场价格大约是1000亿美元。

让我重复一下,在未来4到5年内,对于任何想参与这场游戏的人来说,这将是大约1000亿美元。这是一大笔钱,而且不会变得更容易。所以他们不会有很多这样的人。这不是列出谁能真正建立这些前沿模型的地方。

但除此之外,还会有很多非常专业的模型。我可以告诉你,我个人参与的一些事情,比如使用计算机查看活检切片或CT扫描来发现癌症,还有发现癌症的血液测试。这些往往是非常专业的模型。它们不一定使用基础的Grok、ChatGPT、Llama和Gemini,它们往往是高度专业化的模型。在某些数据上训练图像识别,我的意思是,比如数百万张活检切片,其他训练数据并不太有帮助。

所以这还在继续,我们将看到越来越多像这样的应用。所以,如果你的视野是未来 5 年,甚至可能是未来10年,我不会担心,我们现在已经训练了所有需要的模型,我们需要做的就是推理。

我认为这是一场持续的技术优势之战,将由少数公司和也许一个国家,在未来至少五年内进行,但可能更像是10年。所以这个业务只会越来越大。没有放缓或转变即将到来。

我说一些听起来可能真的很奇怪的话。你可能会说,他一直在说奇怪的话。那么为什么他要说这个呢?这一定非常奇怪。我们正在设计一个功率超过1吉瓦的数据中心,但我们找到了地点和电力设施。我们看了看,他们已经获得了三个核反应堆的建设许可。这些是小型模块化核反应堆,专为数据中心提供电力。事情变得多么疯狂,但这就是正在发生的事情。

分析师:我是巴克莱银行(Barclays)的Raimo Lenschow。关于数据库方面的问题,您今天刚刚宣布的协议,或者您已经与 AWS 达成的协议。现在我们已经达成了所有超大规模协议,您如何看待从目前在本地或云客户上运行的数据库工作负载向公共云的迁移?我的意思是我们应该如何看待这种势头?谢谢。

埃里森:嗯,有两件事。公共云非常有趣,也非常重要。

我的意思是,Oracle 很久以前在数据库业务上就非常成功,因为我们的口号之一就是可移植性。我们在 IBM 主机上运行。我们在 Microsoft PC 上运行。我们在 Hewlett Packard 机器上运行。如果你还记得的话,数字设备机器和各种计算机,我们在任何地方运行。这非常重要,这样我们的客户就可以在任何环境中运行 Oracle 数据库。很明显,我们必须找到一种方法来真正使我们数据库的最佳版本、Exadata、Exascale 版本的数据库在其他人的云中可用。

我们能够做的基本上就是让 OCI 足够小,这样我们就可以在 Microsoft Azure 中嵌入一个 OCI 数据中心,或者在 Google 或 AWS 中嵌入一个 OCI 数据中心,或者我们可以将它放在任何可以完全自主的地方,在那里我们可以使用 Exadata 和 Exascale 集群。我们实际上能够做到这一点。这在技术上并不容易,但我们做到了。

在这样做并缩小我们的 Oracle 数据中心时,我之前提到过,我们所有的数据中心除了规模之外都是相同的。目前最大的数据中心是 800 千兆瓦,接近 800 兆瓦,对不起,我们接近 1 千兆瓦。最小的数据中心大约是 150 千瓦,我们将降至 50 千瓦。这意味着,我们将有许多公司,中大型公司将决定拥有 Oracle 私有云。我的意思是,我们的私有云和公共云之间仍然没有区别。它们是相同的。它们完全相同。许多人拥有 Oracle 私有云,许多工业公司,例如沃达丰拥有六个 Oracle 私有云来运行他们的工作负载。但它们变得如此便宜,以至于任何人都可以决定,好吧,我想转移到云端。我想享受云的所有优势,但我想确保我是云中唯一的人。我不想有任何邻居,或者我只想要经过批准的邻居。我不希望有人带着信用卡搬进来。我只是对安全感到偏执,因为我必须遵守政府法规。

因此,我们认为,显然,在 AWS、Microsoft 和 Google 上使用 Oracle 数据库非常重要。Safra 说得对,我的意思是,这绝对会加速公共云中的数据库增长。但我们预计,私有云的数量将大大超过公共云,因为公司决定将 Oracle 云放在数据中心的防火墙后面,没有邻居。而且,由于我们已经拥有自己的数据中心,我们的数据中心非常自动化,而且可扩展,功能完全相同,我们组织有序。因此,实际上,我们现在有 162 个数据中心。我预计我们将拥有 1,000 个或 2,000 个或更多数据中心,即遍布全球的 Oracle 数据中心,其中许多将专用于个人银行、电信公司或科技公司,或者您有什么国家、主权云,所有这些其他东西。因此,我们认为,我很难预测私有云和公共云哪个会更大?我不知道。

但好消息是,无论哪种方式,我们都会获胜。

分析师:你好,我是伯恩斯坦的 Mark Moerdler。非常感谢,祝贺本季度。本季度和本指南都非常令人印象深刻。我们看到很多关注点都集中在模型训练方面,但在其他方面对应用程序和推理的关注较少。你们在市场和行业方面拥有丰富的专业知识。你们已经在所有 Oracle 产品和功能中融入了传统 AI。但是,您认为 GenAI 在应用方面的可货币化价值在哪里?您认为生成式 AI 需要多长时间才能成为一项有意义的收入,不仅仅是对 Oracle,而是对一般软件,在应用程序方面,而不是在培训方面?谢谢

埃里森:让我先从医疗保健开始,我们帮助医生诊断不同的疾病。当有人去做超声波检查时,我看到护士、技术人员和医生实际上测量婴儿的头骨,测量婴儿的脊髓,看看——这太荒谬了。计算机应该做所有这些。如果胎儿周围缠着脐带,计算机应该发现所有这些,现在应该全部记录下来。医生可以得到计算机的帮助来完成所有这些工作。检查斑块和冠状动脉,所有这些都应该以这种方式完成。

我们已经实现了当医生看病时——准备看病时,我们会为医生准备一份总结。我们使用人工智能查看电子健康记录,查看几个小时前的最新实验室检查结果。并让医生知道病情是否稳定或病情是否进展,或者医生在会诊前需要知道的任何信息。该总结由人工智能创建,是人类可读的总结。然后人工智能会听取医生和患者之间的会诊。这已经交付了。这已经存在了。他们会交付——他们会听取医生与患者的会诊。如果医生开具处方,人工智能会检查以确保处方准确无误并输入处方。人工智能会更新电子健康记录。人工智能会转录和分发医生的医嘱,所有这些都是通过听取对话完成的。然后医生在谈话结束时会得到一份草稿,医生可以快速审查和批准。然后配药、执行医嘱并更新电子健康记录。我们已经在做所有这些事情了。但我还可以继续说下去。在医疗保健领域,我们需要很多东西,从读取 X 光片到用户界面。

我们的用户界面与 Epic 的用户界面截然不同。我曾经带儿子去斯坦福大学,需要三个人,三个不同的姿势才能找到他的 X 光片。这就是你找到 Larry Ellison 的 X 光片的方法。你说,Oracle,请给我看看 Larry Ellison 的最新 X 光片。这是一个语音界面。你只要要求他们就可以了。你如何登录?嗯,你看着电脑,它就能识别你的脸。它能识别你的声音,知道你是医生,你有权查看它,所有的授权都是通过人工智能完成的。

这些都是人工智能,我知道人们认为这是一个独立的东西,我听到很多人都说,我们现在有了人工智能代理(AI Agent),将单独收费。但我认为,我们的应用程序将主要是 AI 应用,你如何单独收取所有费用?我真的不知道。当我听他们说话时,我感到很困惑。我不明白他们在说什么。我会想知道什么,我就到此为止。

分析师:我是TD Cowen 的 Derrick Wood。我也要向你们表示祝贺,你们在过去几个季度增长中取得巨大的进步。您能否向我们介绍一下您对供应可用性的看法,以及您以高效的方式建立数据中心基础设施的能力,以便从签订合同转向消费并将积压转化为收入?我想,您今天所做的与一年前相比有什么不同,能尝试帮助我提供这些加速时间点吗?

埃里森:我们的私有云与公共云完全相同,只是它们可能只有一个租户,并且可能位于您拥有的建筑物中。除此之外,它们是完全相同的。我们拥有硬件。我们为您管理硬件。它恰好位于您拥有的建筑物中,只有您才能进入。因此,这与我们所有竞争对手的情况截然不同,而且它是完全自动化的。

因此,我们准备管理数千个数据中心。顺便说一句,我会将其与伊隆·马斯克的 Starlink 进行比较,我认为他现在在天空中拥有近 7,000 颗卫星,6,800 颗。你如何管理——这些卫星不断机动。它们不是地球同步卫星。它们是低地球轨道卫星。所以它们不断飞行并改变位置。你如何管理 7,000 个飞行的航天器?好吧,让我告诉你,计算机,它必须完全自动化,否则它就无法工作。

我想说,你不可能拥有数千甚至数百个数据中心,但你当然可以拥有数千个数据中心,除非它们完全自动化。而你实现自动化的唯一方法就是让它们都一样。你不可能自动化 25 种不同的事物。所以这是一方面。

我要指出的另一件事,我认为甲骨文的一个有趣之处是,我们管理团队中一些最资深的人是建筑、发电厂和电力传输系统的专家。因为建设这些数据中心就是这样。你不能只建一个数据中心。你还必须考虑能源以及从能源产生地到数据中心的能源传输。

当然,最有效的方法实际上是在数据中心旁边建造发电厂。这样你就可以在最短的距离内传输数据。我们实际上有非常资深的人员,他们实际上来自公用事业行业,虽然这听起来很奇怪,但他们是这方面的专家,并帮助我们建造这些庞大的项目。

再次,我要听听伊隆·马斯克的话。他在建造特斯拉时遇到的最艰难的工作之一是建造奥斯汀工厂,他必须建造人类在任何时候建造的最大建筑。你想知道有史以来最大的建筑吗?当然不是五角大楼。也不是 NASA 的航天飞机大楼。最大的建筑是特斯拉工厂。所以你必须是该工厂的承包商。你必须能够建造这些东西,然后用机器人来制造你的汽车。

因此,你必须建造大楼、接通电源、建立所有自动化系统,这是构建云或楼宇自动化系统最困难的部分,建立所有自动化系统,以便高效、可靠且经济高效地运行。也就是说——我们这里有一些非常有趣的人,他们的经验基础与我们五年前相比有很大不同。


Magazine.Subscription.jpg

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。