跳至正文
← 返回首页

2026年2月5日 · 访谈 · 37min

萨姆·奥特曼谈 GPT-5.3 Codex、能力过剩,以及为什么 Anthropic 的攻击性广告无关紧要

#OpenAI#AI 智能体#Codex#SaaS 颠覆#AI 广告

在这次访谈中,Sam Altman 最有趣的观点并非关于 GPT-5.3 Codex 或 Anthropic 的攻击性广告,而是一个不经意的承认:智能不再是瓶颈。当前的模型已经具备了相当大的能力储备,因此,至少在一段时间内,更好的工具比更智能的模型更为重要。

访谈内容

在 OpenAI 最新编码模型 GPT-5.3 Codex 发布当天,Sam Altman 参加了 TBPN 主持人 John Coogan 和 Jordi Hays 的访谈。对话内容涵盖了新模型的功能、SaaS 行业的颠覆、Anthropic 的超级碗广告以及算力瓶颈的现状。Altman 显得轻松自在,坦诚地谈论了竞争对手,并且显然对 Codex 桌面应用程序最感兴趣。

能力储备

Altman 用一个核心概念来概括当前的情况:能力储备。这些模型的能力已经远远超过了大多数用户的认知或利用程度。真正的制约因素是工具和用户教育。

“I think tools to make that easy to do will matter more than intelligence for a little while because there’s such an intelligence overhang already.” 我认为,在短期内,使这些能力易于使用的工具比智能本身更重要,因为现在已经存在大量智能储备。

这一观点影响了他对几乎所有事情的看法。前沿部署工程师的存在,是因为公司不知道如何使用现有资源。Codex 桌面应用程序之所以重要,是因为 10% 的改进就能释放出巨大的价值。甚至 OpenAI 的广告策略也是为了减少能力储备:教人们能做什么,而不是模型能做什么。

他所描述的轨迹是,人们管理着能力越来越强的智能体团队,在越来越高的抽象层面上工作,始终处于认知带宽的边缘。需要的不是更智能的模型,而是对现有智能模型的更好编排。

GPT-5.3 Codex 和中期互动

新模型为长时间运行的任务引入了中期互动。用户无需为长达数小时的编码会话进行一次性提示,而是可以在模型工作时对其进行指导,纠正方向而无需重新开始。

Altman 将其比作培训新同事:你不会让他们工作几个小时而没有反馈,然后才对最终结果进行评判。目前的模型正是如此。中期互动打破了这种模式。

“It is incredible what these models can do without any feedback… but they can do much more amazing things if you steer them along the way.” 这些模型在没有任何反馈的情况下所能做的事情令人难以置信……但如果你在过程中引导它们,它们可以做得更出色。

专家用户在发布之前就注意到了模型的改进,称其与 GPT-5.2 Codex “真的不一样”。

基准测试正在消亡,GDP 影响紧随其后

当被问及长期任务基准测试时,Altman 提出了两个观点。首先,人工智能领域的任何基准测试图表都不会持续超过几年。其次,通过子智能体和并行化进行智能体编排已经被证明比蛮力长上下文方法更有效,这与人类团队如何细分工作相呼应。

OpenAI 内部的笑话是:很快唯一重要的图表将是 GDP 影响。但 Altman 补充了一个转折。随着人工智能驱动大规模通货紧缩,GDP 本身可能会成为错误的指标。生活质量可能会大幅提高,而测量的 GDP 却会下降,我们还没有应对这种情况的框架。

软件已死?

Altman 的回答:不同了,但没有死。

SaaS 市场将保持波动。随着模型的改进,大规模抛售将继续发生,但大规模繁荣也会出现。一些拥有强大记录系统的 SaaS 公司将在转型中幸存下来。Altman 表示,与他交谈的 SaaS 公司并没有气馁;他们认识到人工智能也让他们能够更快地重建。

最近让他印象最深刻的观点是:

“Every company is an API company now whether they want to be or not.” 现在每家公司都是 API 公司,无论他们是否愿意。

智能体将直接与服务交互,这威胁到广告支持的商业模式(正如 Uber 的 CEO 在同一节目中承认的那样),但也创造了新的分销渠道。商业模式和收入分成将会演变。

据 Altman 所知,没有一家上市公司与 OpenAI 接洽过收购或“软着陆”事宜。

Codex 桌面版:意外的成功

Codex 桌面应用程序让 Altman 感到惊讶,因为它受到了人们的喜爱,包括他自己。他称其为他自己工作流程中的“深刻转变”,从编码扩展到一般知识工作。

他的个人用例:一个自动完成的待办事项列表。你添加任务,人工智能会尝试完成它们。如果可以,它会完成。如果需要澄清,它会提问。如果你需要手动处理某些事情,你仍然可以。一个统一的界面,你可以在其中描述你想要完成的事情,系统会尝试完成它。

愿景是在设备之间实现统一的人工智能后端:桌面用于深度工作,移动设备用于添加任务和快速交互,所有设备共享上下文、记忆和数据。对于非技术用户来说仍然过于技术性,但这将会改变。

OpenClaw 和开源精神

Altman 对 Peter Steinberger 构建的开源 AI 编码智能体 OpenClaw 表现出公开的热情。他承认是什么使之成为可能:一个单独的开源开发者可以快速行动,而无需担心诉讼、数据隐私或会使大型公司瘫痪的超大规模合作伙伴关系。

“Letting the builders build the equivalent of the homebrew computer club spirit go here is so important.” 让建设者们在这里发挥类似 Homebrew Computer Club 的精神非常重要。

他将其视为自然的创新周期:某些东西从开源开始,被证明非常出色,然后有人找到一种方法来制造大众市场版本。

Anthropic 的攻击性广告

Anthropic 在超级碗上投放了多个广告,批评在 AI 聊天机器人中投放广告的前景。Altman 的回应是谨慎但尖锐的。

OpenAI 关于广告的第一原则:没有任何东西会进入 LLM 流。将广告放入模型响应中会让人感觉“疯狂的反乌托邦”,并且会理所当然地赶走用户。Altman 认为,具有欺骗性的部分是使用具有欺骗性的广告来批评具有欺骗性的广告。

他承认这个广告“玩得很好”,并且准确地捕捉到了 ChatGPT 的个性中最让他恼火的地方,他说这个问题很快就会得到解决。但他也指出,Anthropic 的博客文章中包含保留稍后修改其无广告立场的权利的措辞。

他的底线:这只是个花絮。Codex 的发布以及围绕编码智能体的巨大热情更为重要。

芯片、能源和扩展曲线

当前的瓶颈是芯片,尽管它与能源交替出现。Altman 倡导一项增加全球晶圆产能的社会决策,尽管他承认正常的资本主义可能会解决这个问题。

关于模型是否存在智商上限:“似乎可以肯定”它们可以变得更聪明。但是 2,000 智商或 10,000 个人类年的思考实际上意味着什么,没有人能够推理出来。他的直觉是:它不会像听起来那么奇怪,因为人类太专注于自己的生活,以至于运行公司和发明科学的超智能人工智能只会“非常奇怪”,而不是“不可能的奇怪”。

关于更广泛的人工智能轨迹,扩展曲线在过去六到八年中“非常平滑”。每一个关于它会达到顶峰的预测都是错误的。神奇的关系是:投入更多的计算、数据和新想法,大约会以其对数的形式产生改进。

“Compute power is the new oil is the statement that feels closest to true to me.” 计算能力是新的石油,这种说法对我来说最接近事实。

太空数据中心为 OpenAI 提供有意义的计算能力?“不。”在两三年或五年内都不会。

一些观察

这是一次发布日访谈,Altman 处于产品推广模式。但有几个线索比公关更深入:

  • 能力储备论点是最具战略意义的主张。如果这是真的,这意味着竞争护城河从模型智能转向产品工艺和分销,至少是暂时的。这解释了 OpenAI 在桌面应用程序、企业平台和前沿部署工程师方面的大量投资。
  • “每家公司都是 API 公司”的框架具有真正的意义。如果智能体可以直接调用任何服务,那么互联网的整个广告和发现层都将变得具有竞争性。抵制智能体访问的公司将被绕过。
  • Altman 对 Anthropic 广告的反应揭示了一种有趣的紧张关系。他对此不屑一顾(“花絮”),但又足够投入,以至于向 Claude 询问了“玩阴的”的定义。他发现对个性的批评是准确的,并承诺进行修复,这表明 Anthropic 至少打了一拳。
  • GDP 作为错误指标的观察值得更多关注。如果人工智能驱动的通货紧缩非常严重,以至于 GDP 下降而生活质量提高,我们将需要根本上新的经济衡量框架,并且建立在 GDP 增长目标之上的政策可能会适得其反。
  • Altman 正在准备一篇关于未来五年预测的博客文章(十年感觉太遥远)。鉴于他在 2016 年对聊天机器人依恋的预测非常准确,因此值得关注。
观看原视频 →