跳至正文
← 返回首页

2026年1月8日 · 播客 · 1h 16min

黄仁勋谈推理突破、AI分层架构以及为何不存在泡沫

#推理模型#机器人技术#人工智能基础设施#开源人工智能#加速计算

世界上市值最高的半导体公司的 CEO 认为,当你问“人工智能是否存在泡沫?”时,你问错了问题。他坚持认为,真正的问题是世界能否以足够快的速度建造足够的工厂。

背景介绍

在 2026 年 CES 之后,黄仁勋加入了 No Priors 播客的 Sarah Guo 和 Elad Gil,回顾了在他看来验证了英伟达几乎所有赌注的一年。对话持续了 76 分钟,涵盖了推理模型、机器人技术、开源战略、能源限制、美中关系,以及为什么企业采用速度是衡量人工智能影响的错误指标。呈现出来的与其说是一位为公司辩护的 CEO,不如说是一位阐述世界观的实业家,在这个世界观中,计算是文明的新型商品投入。

推理成为现实的一年

黄仁勋从 2025 年获得的最大收获不是任何单一模型,而是一种融合:推理、接地、搜索集成和模型路由都同时成熟。他称之为行业最大信誉问题的幻觉,在从语言到视觉到机器人技术到自动驾驶的每种模式中都得到了有意义的解决。

他对推理的经济性印象尤其深刻。测试时计算,即模型花费更多周期来思考问题,结果证明它有自己的扩展规律:推理时更多的计算能够可靠地产生更好的答案。这使得推理 token 变得有利可图,黄仁勋称之为“一个美妙的惊喜”,因为这意味着英伟达的 GPU 不再仅仅用于训练。安装的基础设施在推理过程中也成为产生收入的资产。

“The thing that surprised me probably the most is this notion of test-time compute and reasoning. For the very first time we realized that inference could be very compute-intensive, and because it’s very valuable, the tokens are worth more.” 可能让我最惊讶的是测试时计算和推理的概念。我们第一次意识到推理可能是计算密集型的,而且因为它非常有价值,所以 token 的价值更高。

这对英伟达的商业模式意义重大:训练需求创造了最初的 GPU 购买,但推理密集型推理创造了持续的需求。这不是一次性的建设,而是持续的基础设施消耗。

任务 vs. 目的:重新定义人工智能和工作

黄仁勋引入了任务目的之间的区别,他用它来转移“人工智能将取代所有工作”的说法。农业的目的是养活人类,但农业的任务几乎完全自动化。结果不是农民的大规模失业,而是生产力提高了 300 倍,食品供应链中出现了大量新角色。

他将这个框架直接应用于软件工程:软件工程的目的(构建有用的工具)将持续存在,但任务(编写单个代码行)将越来越自动化。他的预测:编码将变得更容易,软件的数量将急剧增加,并且“IT 预算将飙升”,因为那些负担不起定制软件的公司现在可以生成它。

更具挑衅性的说法是:劳动力短缺,而不是工作岗位流失,将成为主要问题。黄仁勋指出,护理、教学和制造业等领域根本没有足够的人愿意从事这项工作,并认为机器人技术将填补仅靠移民政策无法解决的缺口。

蛋糕分层:人工智能不是聊天机器人

这是黄仁勋的核心隐喻,也可以说是他在对话中最重要的概念性贡献。他将人工智能描述为“多层蛋糕”技术:

基础层:芯片设计、加速计算硬件 训练层:大规模模型预训练 后训练层:RLHF、微调、接地 推理层:服务模型、路由、测试时计算 应用层:特定领域的工具(医疗、法律、工程、机器人技术)

他的观点:大多数公众讨论将人工智能视为聊天机器人的同义词(可见的顶端),这导致了关于泡沫、护城河和竞争的扭曲叙事。实际上,下面有一个庞大的工业堆栈,而英伟达在多个层面上运营。

“When you think about wanting to win, that America should win AI, it should not just be America should have this company win AI, but we should try to win across the board, and across domains.” 当你想到想要获胜时,美国应该赢得人工智能,不应该仅仅是美国应该让这家公司赢得人工智能,而是我们应该努力全面获胜,并在各个领域获胜。

这个框架也塑造了他对开源的看法。他是一位直言不讳的开源人工智能倡导者,因为在多层蛋糕中,基础层变成了商品基础设施。如果美国想保持人工智能的领导地位,它需要任何美国公司、初创公司或研究人员都可以构建的开源模型,而不是将能力集中在少数封闭的提供商手中。

为什么开源是国家安全战略

黄仁勋将开源定义为根本上是关于竞争力的,而不是利他主义。他的论点:

  1. 现在有 30,000-40,000 家人工智能初创公司正在构建应用程序
  2. 他们中的大多数都负担不起从头开始训练基础模型
  3. 开源模型(如 Llama)为这些初创公司提供了一个有竞争力的基础
  4. 另一种选择是每个美国公司都依赖于一两个封闭的 API 提供商,这是一个脆弱性风险
  5. 中国有自己的封闭模型;美国需要广泛的能力基础,而不是狭窄的能力基础

他强烈反对开源模型对对手的帮助大于对美国的帮助的观点:“如果你认为开源技术只会帮助对手,那是一个愚蠢的概念。”他认为,美国的优势在于其生态系统的广度和活力,而开源为其提供了动力。

“上帝人工智能”神话以及为什么单片模型不会获胜

黄仁勋对所谓的“上帝人工智能”框架提出了尖锐的论点:即将会有一个超级智能模型可以完成所有事情。他的反论点:

  • 不同的领域需要不同类型的推理(医疗诊断 vs. 芯片设计 vs. 法律分析)
  • 未来是专业模型的集合,路由器将查询定向到正确的系统
  • 代理人工智能,即模型分解任务、验证工作和迭代,比单次通过的答案更有希望
  • 通过系统级设计(护栏、路由、接地)而不是通过限制模型本身,可以更好地实现安全性

这与他的监管立场有关:他认为在模型层面监管人工智能就像监管钢铁或电力。你监管应用程序(汽车、医疗设备、金融产品),而不是底层技术。

计算和 Token 经济学成本的暴跌

黄仁勋提出了关于计算成本的详细经济论证:

  • 在过去的十年中,英伟达的 GPU 性能大约提高了 1,000 倍
  • 这意味着每个 token 的成本大约下降了 1,000 倍
  • 与此同时,人工智能基础设施的收入从接近零增长到数千亿美元
  • 这种明显的悖论(价格下降 1,000 倍但收入大幅增长)可以用需求弹性来解释:更便宜的 token 创造了全新的用例

他用这个来直接攻击“人工智能泡沫”的说法。他认为,泡沫的特征是价格上涨,但没有相应的价值创造。在人工智能中,情况恰恰相反:价格正在崩溃,而效用正在扩大。他所做的比较是摩尔定律时代的半导体,每一代芯片的制造成本大致相同,但提供的功能却大大提高。

“We reduced the cost of computing for inference and training by a factor of 1,000 in the last 10 years. During this time, the revenue of this industry went from essentially nothing to hundreds of billions of dollars.” 在过去的 10 年里,我们将推理和训练的计算成本降低了 1,000 倍。在此期间,这个行业的收入从几乎为零增长到数千亿美元。

重返研究

黄仁勋提出的一个更为细致的观点是关于当前人工智能开发的性质。他描述了从纯粹的扩展(只是使模型更大)到真正的研究和工程的转变:

  • 模型架构创新(专家混合、稀疏注意力)
  • 训练方法改进(课程学习、合成数据)
  • 后训练技术(RLHF、DPO、宪法人工智能)
  • 推理优化(推测解码、量化、路由)

他的框架:该行业经历了一个“扩展很容易赚钱”的阶段,只需添加更多计算并观察指标上升。现在,收益需要真正的计算机科学和工程创新。他认为这是健康和可持续的,不像仅扩展的范例那样具有明显的物理限制。

即将迎来“ChatGPT 时刻”的行业

黄仁勋确定了几个他认为即将经历变革性人工智能采用的行业:

医疗保健:已经在使用 OpenEvidence 等工具发生。医生不想做研究;他们想要答案。将医学查询建立在当前文献中的人工智能对于一个难以跟上加速生物医学知识的行业来说是“不可抗拒的”。

机器人技术和物理人工智能:黄仁勋认为基础模型与模拟(英伟达的 Omniverse/Cosmos)的融合将实现机器人能力的突破。他描述了一个管道:在数字孪生中模拟机器人的行为,在合成数据上训练模型,然后部署到物理硬件。

自动驾驶:他区分了自动驾驶汽车(由于与不可预测的人类共享道路而面临“长尾”安全挑战)和仓库/工厂机器人(在受控环境中运行,因此更容易安全部署)。他预测自动驾驶卡车运输和仓库物流的规模将比城市自动驾驶更快。

软件工程本身:他看到了一个未来,通过自然语言界面,“公司里的每个人都是程序员”,他认为这将增加 IT 预算,而不是减少 IT 预算。

能源:真正的瓶颈

黄仁勋坦率地表示,能源是人工智能增长的约束性因素:

  • 每个人工智能工厂都需要电力
  • 美国需要建造“数百个”新的数据中心
  • 核能、天然气和可再生能源都需要同时扩大规模
  • 许可和电网基础设施是真正的瓶颈,而不是技术

他将此视为一个经济机会,而不仅仅是一个成本。解决能源基础设施最快的国家将在人工智能领域处于领先地位,他认为人工智能是下个世纪的核心生产技术。

美中关系:来自令人惊讶的来源的乐观情绪

在地缘政治方面,黄仁勋明显比大多数科技高管更乐观。他认为:

  • 中国是英伟达的第三大市场,也是重要的客户
  • 完全脱钩将损害美国公司并加速中国的自给自足
  • 正确的方法是对最先进的芯片进行“小院高墙”出口管制,同时保持其他所有方面的商业关系
  • 他认为新政府的做法更加务实和对商业友好

最引人注目的说法:黄仁勋认为双方都对升级“感到厌倦”,并且 2026 年将看到贸易紧张局势的缓和。这是否是真正的分析还是英伟达中国业务的希望定位,留给听众判断。

是否存在人工智能泡沫?

黄仁勋对泡沫问题的完整回答综合了他之前的论点:

  1. 价格动态不适合泡沫:计算成本下降 1,000 倍,而效用却在上升。泡沫显示出相反的模式。
  2. 安装的基础设施产生持续的收入:与互联网时代不同,互联网时代的基础设施是为没有实现的的需求而建造的,人工智能 GPU 从第一天起就产生推理收入。
  3. 企业缓慢具有误导性:最快的采用发生在初创公司和最终用户工具中,而不是企业销售周期中。通过企业采用来衡量是“去找新技术最慢的采用者”来获取你的信号。
  4. TAM 是基础设施级别的:黄仁勋将人工智能计算与电力进行比较:总潜在市场不是“聊天机器人订阅”,而是“每个使用信息做出决策的行业”,即所有行业。

他的临别赠言:“没有人想开第一批汽车的汽车。” 2025 年的人工智能相当于早期的汽车。这项技术是真实的,改进是复合的,几年之内,这些疑虑将显得古怪。

一些想法

当然,黄仁勋是人工智能基础设施建设中最有动力的叙述者。售出的每块 GPU 都验证了他的论点。“蛋糕分层”框架对于消除关于人工智能赢家和输家的过于简化的叙述非常有用。

一些值得思考的观察结果:

  • 任务与目的的区别很优雅,但可能过于令人放心。历史确实表明自动化在宏观层面创造了新的工作岗位,但对于特定社区和职业来说,过渡时期可能是残酷的。黄仁勋掩盖了这一点。
  • 他的开源论点是芯片公司应该倡导模型商品化的最有力理由:如果模型便宜且丰富,那么瓶颈(和利润)就会转移到硬件上。开源是好的战略,而不仅仅是好的公民意识。
  • 能源框架可能是最重要的收获。如果人工智能计算需求真的遵循黄仁勋描述的轨迹,那么赢得能源基础设施竞赛的国家将赢得人工智能竞赛。其他一切都是下游。
  • 鉴于英伟达的直接财务风险,他对中国的乐观情绪值得注意。将其视为关于激励措施的数据,而不是作为公正的分析。
观看原视频 →