← 返回

CES 2026 主题演讲:两场平台变革同时发生,NVIDIA 全栈押注 Physical AI

Speech · Jensen Huang · 1h 50min
观看原视频 →
#NVIDIA#Physical AI#自动驾驶#Vera Rubin#算力基础设施

核心观点

Jensen Huang 在 CES 2026 开场即抛出核心论题:计算产业正经历两场同时发生的平台变革——不仅应用层从传统软件转向 AI 应用,整个计算堆栈本身也在被重新发明。软件不再被编程而是被训练,不再运行在 CPU 而是 GPU,不再是预编译的静态程序而是实时生成每一个 token 和像素。

这意味着过去十年约 10 万亿美元的计算基础设施正在被现代化,每年数千亿美元的 VC 资金和全球百万亿美元产业的研发预算正在向 AI 转移。Huang 用这个宏观框架解释了 NVIDIA 为什么要同时重新设计六款芯片、构建全栈 Physical AI 平台、并以每年一代的节奏推进架构迭代。

关键要点

1. 2025 年 AI 进展的四大里程碑

  • Scaling Laws 持续有效:从 2015 年 BERT → 2017 年 Transformer → 2022 年 ChatGPT → 2023 年 o1 推理模型,每一代都需要量级增长的算力
  • Agentic AI 爆发:具备推理、研究、工具使用、规划能力的 Agent 系统在 2025 年全面铺开,Huang 提到 Cursor 革命了 NVIDIA 内部的软件开发方式
  • Physical AI 起步:理解物理世界常识(物体永恒性、因果关系、惯性、摩擦力)的 AI 开始落地
  • 开源模型达到前沿:DeepSeek R1 作为首个开源推理模型”震惊了世界,激活了整个运动”,开源模型虽落后闭源约 6 个月,但正在快速追赶

2. Physical AI:三台计算机架构

Huang 将 Physical AI 的核心基础设施归纳为三台计算机的协作:

计算机功能对应产品
训练计算机训练 AI 模型DGX 超级计算机
推理计算机部署在车、机器人、工厂边缘Orin / Thor 处理器
仿真计算机模拟物理世界反馈,生成合成数据Omniverse + Cosmos
  • Cosmos 世界基础模型:从交通模拟器输出生成物理合理的环绕视频,用于训练自动驾驶;支持语言对齐,理解物理交互
  • Alpamo:NVIDIA 首款推理型自动驾驶 AI,端到端训练(摄像头输入 → 方向盘/刹车输出),能推理并解释自己的驾驶决策
  • 采用双 AV 堆栈冗余安全架构:Alpamo + 传统可追溯 AV 堆栈并行运行,策略安全评估器决定切换

3. Mercedes-Benz CLA:首款 NVIDIA 全栈自动驾驶车

  • 2026 年 Q1 美国上路,Q2 欧洲,Q3-Q4 亚洲
  • NCAP 评为”世界最安全汽车”
  • 芯片到系统到每行代码全部通过安全认证
  • 传感器多元冗余,软件堆栈双重冗余
  • Huang 预测未来 10 年内”非常大比例的全球汽车将实现自动或高度自动驾驶”

4. Vera Rubin 架构:极限协同设计

核心挑战:摩尔定律放缓,晶体管数量仅增长 1.6 倍/年,但 AI 模型以 10 倍/年增长、token 生成量以 5 倍/年增长、token 成本以 10 倍/年下降。解法是”极限协同设计”——同时重新设计全部 6 款芯片:

  • Vera CPU:88 核 176 线程,空间多线程技术,功耗受限下性能翻倍
  • Rubin GPU:浮点性能 5 倍于 Blackwell,晶体管仅 1.6 倍。关键突破是 MVFP4 Tensor Core——动态自适应精度的 Transformer 引擎,非简单的 FP4 数据格式
  • NVLink 6 交换机:400 Gbps SerDes,单机柜内 240 TB/s 带宽(全球互联网带宽的 2 倍)
  • Spectrum X Photonics:TSMC CoUPE 工艺,全球首款硅光子集成以太网交换机
  • Bluefield 4:革命性 KV Cache 上下文存储方案,每 GPU 额外提供 16 TB 上下文记忆
指标Blackwell → Vera Rubin
峰值推理性能5 倍
峰值训练性能3.5 倍
晶体管数量1.6 倍
液冷温度45°C(无需水冷机)
组装时间2 小时 → 5 分钟

5. 企业 AI 与工业合作

  • 企业 AI:与 Palantir、ServiceNow、Snowflake、CrowdStrike 等集成,Agentic 系统将成为企业平台的新界面,取代 Excel 和命令行
  • 工业 AI:与 Siemens 深度集成 CUDA-X、Physical AI、Omniverse 进入工业全生命周期(设计→仿真→生产→运营);与 Cadence、Synopsis 合作将 AI 引入芯片设计

金句

“You no longer program the software, you train the software. You don’t run it on CPUs, you run it on GPUs.”

“Some $10 trillion of the last decade of computing is now being modernized to this new way of doing computing.”

“DeepSeek R1, the first open model that’s a reasoning system. It caught the world by surprise and it activated literally this entire movement.”

“In the next 10 years, I’m fairly certain a very large percentage of the world’s cars will be autonomous or highly autonomous.”

“It is impossible to keep up with those kind of rates unless we deploy aggressive extreme co-design — basically innovating across all of the chips across the entire stack all at the same time.”

思考

这是一场典型的 Jensen Huang 式 keynote——信息密度极高,技术细节与产业叙事交织。最值得关注的不是某个单一产品发布,而是 NVIDIA 战略定位的明确化:从芯片公司到 AI 全栈基础设施公司。六款芯片同时重新设计的决策本身就说明了 NVIDIA 的判断——摩尔定律已无法独立支撑 AI 算力需求的增长曲线,唯有系统级协同创新才能维持领先。Alpamo 自动驾驶和 Siemens 工业 AI 合作则标志着 Physical AI 从概念走向规模化部署的起点。