CES 2026 主题演讲:两场平台变革同时发生,NVIDIA 全栈押注 Physical AI
观看原视频 →核心观点
Jensen Huang 在 CES 2026 开场即抛出核心论题:计算产业正经历两场同时发生的平台变革——不仅应用层从传统软件转向 AI 应用,整个计算堆栈本身也在被重新发明。软件不再被编程而是被训练,不再运行在 CPU 而是 GPU,不再是预编译的静态程序而是实时生成每一个 token 和像素。
这意味着过去十年约 10 万亿美元的计算基础设施正在被现代化,每年数千亿美元的 VC 资金和全球百万亿美元产业的研发预算正在向 AI 转移。Huang 用这个宏观框架解释了 NVIDIA 为什么要同时重新设计六款芯片、构建全栈 Physical AI 平台、并以每年一代的节奏推进架构迭代。
关键要点
1. 2025 年 AI 进展的四大里程碑
- Scaling Laws 持续有效:从 2015 年 BERT → 2017 年 Transformer → 2022 年 ChatGPT → 2023 年 o1 推理模型,每一代都需要量级增长的算力
- Agentic AI 爆发:具备推理、研究、工具使用、规划能力的 Agent 系统在 2025 年全面铺开,Huang 提到 Cursor 革命了 NVIDIA 内部的软件开发方式
- Physical AI 起步:理解物理世界常识(物体永恒性、因果关系、惯性、摩擦力)的 AI 开始落地
- 开源模型达到前沿:DeepSeek R1 作为首个开源推理模型”震惊了世界,激活了整个运动”,开源模型虽落后闭源约 6 个月,但正在快速追赶
2. Physical AI:三台计算机架构
Huang 将 Physical AI 的核心基础设施归纳为三台计算机的协作:
| 计算机 | 功能 | 对应产品 |
|---|---|---|
| 训练计算机 | 训练 AI 模型 | DGX 超级计算机 |
| 推理计算机 | 部署在车、机器人、工厂边缘 | Orin / Thor 处理器 |
| 仿真计算机 | 模拟物理世界反馈,生成合成数据 | Omniverse + Cosmos |
- Cosmos 世界基础模型:从交通模拟器输出生成物理合理的环绕视频,用于训练自动驾驶;支持语言对齐,理解物理交互
- Alpamo:NVIDIA 首款推理型自动驾驶 AI,端到端训练(摄像头输入 → 方向盘/刹车输出),能推理并解释自己的驾驶决策
- 采用双 AV 堆栈冗余安全架构:Alpamo + 传统可追溯 AV 堆栈并行运行,策略安全评估器决定切换
3. Mercedes-Benz CLA:首款 NVIDIA 全栈自动驾驶车
- 2026 年 Q1 美国上路,Q2 欧洲,Q3-Q4 亚洲
- NCAP 评为”世界最安全汽车”
- 芯片到系统到每行代码全部通过安全认证
- 传感器多元冗余,软件堆栈双重冗余
- Huang 预测未来 10 年内”非常大比例的全球汽车将实现自动或高度自动驾驶”
4. Vera Rubin 架构:极限协同设计
核心挑战:摩尔定律放缓,晶体管数量仅增长 1.6 倍/年,但 AI 模型以 10 倍/年增长、token 生成量以 5 倍/年增长、token 成本以 10 倍/年下降。解法是”极限协同设计”——同时重新设计全部 6 款芯片:
- Vera CPU:88 核 176 线程,空间多线程技术,功耗受限下性能翻倍
- Rubin GPU:浮点性能 5 倍于 Blackwell,晶体管仅 1.6 倍。关键突破是 MVFP4 Tensor Core——动态自适应精度的 Transformer 引擎,非简单的 FP4 数据格式
- NVLink 6 交换机:400 Gbps SerDes,单机柜内 240 TB/s 带宽(全球互联网带宽的 2 倍)
- Spectrum X Photonics:TSMC CoUPE 工艺,全球首款硅光子集成以太网交换机
- Bluefield 4:革命性 KV Cache 上下文存储方案,每 GPU 额外提供 16 TB 上下文记忆
| 指标 | Blackwell → Vera Rubin |
|---|---|
| 峰值推理性能 | 5 倍 |
| 峰值训练性能 | 3.5 倍 |
| 晶体管数量 | 1.6 倍 |
| 液冷温度 | 45°C(无需水冷机) |
| 组装时间 | 2 小时 → 5 分钟 |
5. 企业 AI 与工业合作
- 企业 AI:与 Palantir、ServiceNow、Snowflake、CrowdStrike 等集成,Agentic 系统将成为企业平台的新界面,取代 Excel 和命令行
- 工业 AI:与 Siemens 深度集成 CUDA-X、Physical AI、Omniverse 进入工业全生命周期(设计→仿真→生产→运营);与 Cadence、Synopsis 合作将 AI 引入芯片设计
金句
“You no longer program the software, you train the software. You don’t run it on CPUs, you run it on GPUs.”
“Some $10 trillion of the last decade of computing is now being modernized to this new way of doing computing.”
“DeepSeek R1, the first open model that’s a reasoning system. It caught the world by surprise and it activated literally this entire movement.”
“In the next 10 years, I’m fairly certain a very large percentage of the world’s cars will be autonomous or highly autonomous.”
“It is impossible to keep up with those kind of rates unless we deploy aggressive extreme co-design — basically innovating across all of the chips across the entire stack all at the same time.”
思考
这是一场典型的 Jensen Huang 式 keynote——信息密度极高,技术细节与产业叙事交织。最值得关注的不是某个单一产品发布,而是 NVIDIA 战略定位的明确化:从芯片公司到 AI 全栈基础设施公司。六款芯片同时重新设计的决策本身就说明了 NVIDIA 的判断——摩尔定律已无法独立支撑 AI 算力需求的增长曲线,唯有系统级协同创新才能维持领先。Alpamo 自动驾驶和 Siemens 工业 AI 合作则标志着 Physical AI 从概念走向规模化部署的起点。