2026年1月15日 · 访谈 · “53min”
德米斯·哈萨比斯:谷歌的AI引擎室与通往AGI的竞赛
Google DeepMind 的 CEO 认为,我们正在进入人类历史上最具变革的时期,而他的团队正是推动这一变革的引擎。但这次采访的独特之处不在于他对 AGI 的乐观态度,而在于他对竞争态势、中国 AI 野心的局限性,以及谷歌雄厚的财务实力为何可能成为这场可能让竞争对手破产的竞赛中的决定性优势的坦诚表述。
采访内容
CNBC 首播的 The Tech Download 节目中,Demis Hassabis 在伦敦与 Arjun Kharpal 和 Steve Kovach 进行了专访。对话内容涵盖了 DeepMind 的研究方向、谷歌围绕 AI 进行的内部重组、竞争格局、中国的追赶以及 Hassabis 对 AI 驱动科学发现的愿景。主持人将采访与他们自己的分析片段穿插在一起,增加了市场和地缘政治背景。
“工业革命的 10 倍,速度快 10 倍”
Hassabis 对 AGI 时间表和影响的描述非常具体,引人注目。他认为 AGI 将在 5-10 年内实现,并将即将到来的变革描述为“就像工业革命,但可能规模大 10 倍,速度快 10 倍”。
他区分了当前 AI 可以做什么和缺少什么。今天的大型语言模型擅长语言和推理,但缺乏对物理世界的理解。下一个前沿是他所谓的“世界模型”,即理解物理学、可以进行规划并可以与物理现实互动的系统。这是通往机器人技术和可以在现实世界中自主运行的 AI 的桥梁。
“I think there it’s going to be like the industrial revolution, but maybe 10 times bigger, 10 times faster.” 我认为这将像工业革命一样,但可能规模大 10 倍,速度快 10 倍。将会发生令人难以置信的变革,同时也伴随着颠覆。
在风险方面,Hassabis 提出了两个具体的担忧:不良行为者将通用 AI 重新用于有害目的,以及如何将日益自主的基于代理的系统保持在预期的护栏内。他对 DeepMind 的安全工作表示有信心,并指出他们自 2010 年实验室成立以来一直在思考这些问题,当时“几乎没有人从事 AI 工作”。
AI 如何学习物理现实
采访中最具技术实质性的部分讨论了 AI 系统如何理解物理世界。Hassabis 通过他们的视频生成工作 (Veo) 解释了 DeepMind 的方法,将其作为垫脚石。通过数百万小时的视频训练,系统可以学习到隐含的物理学:物体会掉落,液体会流动,光线的行为具有一致性。
但 Hassabis 明确表示这还不够。视频生成捕获了表面层面的模式,而没有更深入的理解。目标是开发真正的世界模型,该模型可以模拟和预测物理交互,其水平足以用于机器人技术和科学模拟。他认为这是当今基于语言的 AI 与能够在现实世界中运行的系统之间的关键缺失部分。
他对使世界模型足够高效以进行实际规划特别感兴趣:这些模型不仅需要生成视频,还需要足够快,以便在机器人的决策循环或科学模拟管道中运行。
谷歌的资产负债表是超级力量
也许最具战略意义的时刻是 Hassabis 回答 AI 泡沫问题时。他的回答非常坦率:谷歌有能力承担错误的后果。
主持人尖锐地扩展了这一分析。如果 AI 投资周期收缩,OpenAI 和 Anthropic 将面临生存风险,因为它们依赖于持续的融资。谷歌、微软和 Meta 拥有高利润的现有业务,可以无限期地吸收 AI 损失。Meta 已经通过元宇宙展示了这种转型能力。
这不仅仅是姿态。Hassabis 将谷歌的财务状况定位为能够进行纯 AI 公司无法承受的长期投资。谷歌可以资助像 AlphaFold 和 Gemini 机器人这样的登月研究,而无需立即证明收入的合理性,而初创公司必须不断展示收入增长才能获得下一轮融资。
“I don’t really worry about bubbles. My point of view is I’ve got to make sure that whichever way it goes, we’re in the right position to win either way.” 我并不真正担心泡沫。我的观点是,我必须确保无论情况如何发展,我们都处于正确的位置,无论哪种方式都能获胜。
中国:落后几个月,而不是几年
Hassabis 对中国 AI 能力的评估比典型的西方叙事更为细致。他承认中国 AI 模型“仅比”美国的前沿模型“落后几个月”,这与最近盛行的“落后几年”的共识相比有了显着修正。
但他做出了一个关键的区分:中国已经证明了能够快速赶上并执行世界一流的工程,但尚未展示出超越前沿的根本创新能力。DeepSeek 和阿里巴巴的 Qwen 模型证明中国可以复制和优化现有方法。悬而未决的问题是中国实验室是否可以发明真正新的东西,例如 Transformer 架构。
“To invent something is about 100 times harder than it is to copy it.” 发明某样东西比复制它难 100 倍。
Hassabis 将此部分归因于“心态问题”,而不是硬件限制。他将 DeepMind 定位为“现代贝尔实验室”,培养探索性创新,这表明这种基础研究文化比工程能力更难建立。值得注意的是,鉴于 DeepSeek 已经证明了在没有尖端 Nvidia 硬件的情况下也能取得接近前沿的结果,因此他并不认为芯片出口管制是中国 AI 的主要瓶颈。
DeepMind 作为谷歌的发动机室
这次采访揭示了自 2023 年重组以来,DeepMind 在谷歌内部的融合程度,该重组将 Google Brain、Google Research 和 DeepMind 合并在 Hassabis 的领导下。
他描述了每天与 Sundar Pichai 讨论战略方向和路线图。新的 Gemini 模型现在同时在谷歌的产品界面(搜索、Android、Chrome、Gmail)上发布。使用 Gemini 2.5 世代,该过程变得“非常顺利”,这与谷歌之前多个 AI 团队相互竞争的声誉形成鲜明对比。
在硬件方面,Hassabis 解释了 TPU 与 GPU 的分工:TPU 专为将已知模型架构扩展到最大效率而构建,而 GPU 为 AlphaFold 等探索性研究提供了灵活性。谷歌的优势在于两者兼而有之,而竞争对手必须完全依赖 Nvidia。
三星的合作也值得注意。三星已将 Gemini 作为其默认 AI,而不是构建自己的 AI,预计苹果将使用 Gemini 来支持下一版本的 Siri。加上 Android 占全球 70% 的市场份额,谷歌在将 AI 推向边缘设备方面具有分销优势,这是任何纯 AI 公司都无法比拟的。
科学发现的黄金时代
Hassabis 对 AI 在科学领域的潜力保留了最深的热情。解决了 50 年蛋白质折叠问题的 AlphaFold 是他的概念验证。全球现在有超过 300 万研究人员使用它。
他的愿景很明确:在未来十年内,材料科学、物理学、数学和天气预测领域将出现十几个 AlphaFold 级别的突破。DeepMind 目前有“六个”这样的项目正在进行中。通过 Isomorphic Labs(他的药物发现衍生公司),他正在寻求将这些能力直接应用于药物开发。
具体来说,对于 2026 年,Hassabis 强调了三个优先事项:代理系统变得足够可靠以供实际使用,Gemini 驱动的机器人技术在 12-18 个月内取得重大进展,以及边缘设备(智能眼镜、手机)上的 AI 变得真正有用。
回顾 DeepMind 的收购
一个具有启发性的个人时刻:Hassabis 回忆起告诉 Alan Eustace(当时谷歌的搜索主管),DeepMind 将成为“谷歌有史以来最重要的收购”,考虑到 YouTube 和 AdWords,这是一个大胆的说法。他指出,此次收购现在的价值可能是其原始价格的“100 倍、1000 倍”。
他还提到了与黄仁勋的关系。他们最常讨论用于科学的 AI,Hassabis 指出,具有讽刺意味的是,他在 20 世纪 90 年代首次使用 Nvidia GPU 进行游戏开发,编写图形和物理引擎。该游戏硬件管道现在正在为 AI 研究提供动力。
结束语
-
“资产负债表作为超级力量”的框架是这里最具战略意义的见解。它将 AI 竞争重新定义为不是一场技术竞赛,而是一场财务耐力赛,谷歌的在位优势是一种优势,而不是一种劣势。
-
Hassabis 对中国的评估非常具体,令人耳目一新。“落后几个月,而不是几年”加上“发明比复制难 100 倍”给出了一个精确的思维模型:中国是一个强大的快速追随者,但尚未证明它可以设定前沿。
-
贝尔实验室的比较揭示了 Hassabis 对 DeepMind 的自我形象:一个在公司庇护下蓬勃发展基础研究的地方。谷歌的产品压力是否允许这种文化持续存在是一个未言明的紧张关系。
-
他对世界模型作为下一个前沿(超越语言)的关注与日益增长的共识相一致,但他强调使它们足够高效以供实时使用比大多数人更具体。“理解物理学”和“可以足够快地为机器人进行规划”之间的差距是真正的工程挑战所在。
-
与 Pichai 的日常对话表明谷歌最终致力于统一的 AI 战略。这种集中化是否会有助于或最终扼杀 Hassabis 所珍视的探索文化还有待观察。