2026年3月15日 · 播客 · 1h 3min
ChatGPT 的下一步:从聊天机器人到超级助手
ChatGPT 本来只是个演示品。计划上线一个月就关闭。三年半之后,它却拥有了每周 9 亿的活跃用户,并且正在被重塑成一种完全不同的东西:一个超级助手,它无需等待你的提问,而是主动为你工作。
意外走红的产品
Nick Turley 是 OpenAI 的产品副总裁,他加入这家公司的方式堪称科技史上最有效的招聘渠道:他请求跳过 DALL-E 2 的等候名单,结果直接获得了一次面试机会。三年半之后,他正在负责有史以来增长最快的消费级产品之一。
ChatGPT 作为一项业务的起源故事,出人意料地充满草根气息。这款产品最初只是一个免费演示,计划寿命仅为一个月。当它爆火时,团队意识到他们手上确实有一个真正的产品,但这个产品却一直因为容量问题而崩溃。订阅服务并非一种盈利策略,而是一种需求调节工具,一种在服务器无法承受负载时优雅地拒绝用户的方式。
“ChatGPT 最初完全是免费的,原因是它原本只是一个演示品,我们计划在一个月后就关闭它。”
GPT-4 也重复了同样的模式:服务于所有人过于昂贵,因此它被放到了 Plus 付费墙之后。OpenAI 是通过解决基础设施问题而偶然发现了其订阅模式,而不是通过执行定价策略。
北极星:长期留存率
当被要求在所有可能的指标中分配 100 分时,Turley 将所有分数都放在了一个指标上:长期留存率。
“我非常关心长期留存率,我会把所有的分数都放在那里。因为最终,持久价值的标志是人们是否会在三个月后再次回来。”
ChatGPT 的留存曲线是“微笑”型的,这是一种罕见的现象,即最初流失的用户会在几个月后重新回来。Turley 将此归因于 AI 代理的本质:人们需要花费数月的时间才能发现 ChatGPT 可以融入他们生活的各种方式。搜索和个性化是推动这一增长的两大产品投资,它们将 ChatGPT 从一个“工作型”的平日工具转变为一个移动优先的个人助理,在周末也有稳定的使用量。
增长大致分为三个部分,各占三分之一:
- 经典的摩擦消除:移除登录墙,改进用户引导(据说 Sam Altman 从一开始就推动免身份验证)
- 核心产品投资:搜索、个性化、写作模块,所有这些都是研究团队和产品团队共同构建的
- 纯粹的模型改进:像 GPT-3.5 → GPT-4 → o-series 这样的阶跃式变化,以及不太引人注目的迭代更新(5.3、5.4),这些更新系统地解决了用户反馈
为什么下一个十亿用户需要不同的产品
ChatGPT 已经覆盖了全球约 10% 的人口。剩下的 90% 不会通过同样的途径而来。Turley 发现了两个根本性的障碍:
代理问题。 ChatGPT 是一个“原始电器”,一个不会告诉你它有什么用的电动工具。用户必须自己发现用例。对于下一波更忙碌、对技术不太感兴趣的用户来说,这款产品需要更多的示能性,更多的软件式结构,而不是一个空白的终端。
主动性差距。 大多数人太忙了,没空去想该委托什么。解决方案不是让提示变得更容易,而是要颠覆模型:不是用户提示 AI,而是 AI 提示用户。Pulse 是第一步,但它有局限性,因为它只能产生信息,而不能采取行动或与你的生活联系起来。
愿景是这些因素会相互叠加:行动 + 主动性 = 超级助手。想象一下,一个 AI 注意到你的指标下降,并主动运行分析,或者检测到你已到达目的地并呼叫出租车。不是因为你要求它这样做,而是因为它了解你的目标。
将编码代理作为试验场
特定领域的代理已经在工作。在编码方面,他们已经实现了 Turley 所谓的“逃逸速度”:许多 OpenAI 工程师不再打开他们的 IDE,一次也不打开。
“我们有很多工程师,他们一次也不打开他们的 IDE。”
关键的洞察力在于为什么编码代理会首先出现:代码是可测试的(你知道它是否有效),对强化学习友好,并且失败模式清晰可见。这创造了一个使产品变得伟大的爬山循环:人们尝试它,获得部分认可,这会生成真实的任务数据,团队使用这些数据来改进产品。
通用代理是下一个前沿。之前的 ChatGPT Agent 尝试“稍微早了一点”,模型不够好,无法达到逃逸速度,因此用户从未学会信任它。剩下的用例过于小众(将文件服务器迁移到云端),无法推动广泛采用。Turley 认为,他们正在接近一个阈值,即通用代理在有意义的现实生活任务中表现得足够好,可以获得部分认可,然后改进的飞轮就开始转动。
无限智能时代的价格
当前的订阅模式是历史基础设施限制的产物,而不是一种深思熟虑的定价理念。随着测试时计算能力允许智能几乎无限地扩展,这种比喻发生了转变:
“在当前时代,拥有无限流量套餐可能就像拥有无限电力套餐一样。这根本没有意义。”
高级用户正在提取巨大的价值,每个用户的 Token 消耗量正在急剧攀升(Turley 将内部图表描述为“令人难以置信”),并且 GPU 消耗量与交付的价值相关。Uber/Lyft 在 2015 年的比较是恰当的:在增长阶段进行补贴使用,随着产品成熟,定价必然会发生变化。
对于不常使用信用卡的用户和新兴市场,广告成为一种访问工具,而不是一种盈利手段。关于他们的广告试点的最常见支持咨询不是“如何禁用广告”,而是“如何投放广告”,生态系统想要参与进来。
GPU 零和博弈
GPU 是 OpenAI 最难权衡的因素。与传统软件不同,他们面临着真正的零和资源约束:每个服务于 ChatGPT 的 GPU 都意味着少了一个用于训练模型或运行 Codex 的 GPU。
一种简单的方法是优化每个 GPU 的增量收入。但这会扼杀从零到一的赌注。例如,Deep Research 无法以每个 GPU 的收入为基础来证明其合理性,但不发布它意味着永远无法发现消费者是否想要一款研究产品(他们确实想要)。
Turley 的启发式方法:从最受约束的资源(GPU)开始规划,首先优先考虑现有用户体验(快速、可靠),然后在已验证的用例和探索性赌注之间取得平衡。他看不到这种权衡消失的世界;即使单位成本下降,需求也在不断上升。
将 Code Red 作为一种管理工具
当谷歌的 Gemini 获得动力,并且 Marc Benioff 公开切换到它时,OpenAI 宣布进入“Code Red”状态,暂停了广告、健康代理和购物方面的工作,完全专注于改进 ChatGPT。
Code Red 不是危机信号,而是一种聚焦机制。它允许公司放弃其他项目,并专注于重要的事情:延迟、可靠性、模型质量、个性化。最终成果是 GPT-5.3(非常适合日常用户)和 5.4(知识工作的主力)。
持久的成果不是任何具体的产品改进,而是专注本身。在一家像 OpenAI 这样拥有众多机会的公司,接近通用人工智能的风险是分心。
“如果你要对 OpenAI 这样的公司未能实现其使命的原因进行事前分析,那很可能是因为注意力分散。”
Peter Steinberger 和 OpenClaw 的启发
Turley 对 Peter Steinberger(以 OpenClaw 闻名)加入 OpenAI 感到非常兴奋。OpenClaw 展示了一种 ChatGPT 团队一直在以各种形式追求的愿景:一个完全具身的人工智能,它存在于不同的 UI 中,保持状态,采取行动,并以简短、自然的短消息形式进行交互,而不是正式的提示。
ChatGPT 服务器的代码库名称是什么?“SA Server”,是 Super Assistant Server(超级助手服务器)的缩写。Turley 说,这证明这始终是他们的愿景。
结束语
以下是一些值得思考的观察结果:
-
最好的指标是无形的。 Turley 开玩笑说,“增加睡眠时间”才是真正的北极星,但他并非完全在开玩笑。产品团队确实在讨论如何衡量自我实现。当你的指标是某人的生活是否变得更好时,你最终会做出与优化参与度不同的决策。
-
Mac OS 的心智模型。 Turley 渴望渐进式披露:为普通用户提供神奇的简单性,为高级用户提供终端级别的强大功能。这两种极端情况都能教会团队不同的东西。普通用户迫使你完善界面;高级用户则为你进行产品发现。
-
好奇心是永久的技能。 当被问及学生应该关注什么时,Turley 没有说是编码或数学。他说的是好奇心,因为“如果机器可以回答你所有的问题,你最好有好的问题。”还有写作,因为向机器表达你想要的东西需要精确的思考。
-
时机是最难预测的。 Turley 可以看到未来的形态,但无法预测何时到来。他的规划范围是:“三个月到永远之间的任何时间都很难预测。”