2026年3月15日 · 播客 · 1h 3min

ChatGPT 的下一步：从聊天机器人到超级助手

#消费级人工智能#人工智能产品战略#ChatGPT#人工智能代理#OpenAI

ChatGPT 本来只是个演示品。计划上线一个月就关闭。三年半之后，它却拥有了每周 9 亿的活跃用户，并且正在被重塑成一种完全不同的东西：一个超级助手，它无需等待你的提问，而是主动为你工作。

意外走红的产品

Nick Turley 是 OpenAI 的产品副总裁，他加入这家公司的方式堪称科技史上最有效的招聘渠道：他请求跳过 DALL-E 2 的等候名单，结果直接获得了一次面试机会。三年半之后，他正在负责有史以来增长最快的消费级产品之一。

ChatGPT 作为一项业务的起源故事，出人意料地充满草根气息。这款产品最初只是一个免费演示，计划寿命仅为一个月。当它爆火时，团队意识到他们手上确实有一个真正的产品，但这个产品却一直因为容量问题而崩溃。订阅服务并非一种盈利策略，而是一种需求调节工具，一种在服务器无法承受负载时优雅地拒绝用户的方式。

“ChatGPT 最初完全是免费的，原因是它原本只是一个演示品，我们计划在一个月后就关闭它。”

GPT-4 也重复了同样的模式：服务于所有人过于昂贵，因此它被放到了 Plus 付费墙之后。OpenAI 是通过解决基础设施问题而偶然发现了其订阅模式，而不是通过执行定价策略。

北极星：长期留存率

当被要求在所有可能的指标中分配 100 分时，Turley 将所有分数都放在了一个指标上：长期留存率。

“我非常关心长期留存率，我会把所有的分数都放在那里。因为最终，持久价值的标志是人们是否会在三个月后再次回来。”

ChatGPT 的留存曲线是“微笑”型的，这是一种罕见的现象，即最初流失的用户会在几个月后重新回来。Turley 将此归因于 AI 代理的本质：人们需要花费数月的时间才能发现 ChatGPT 可以融入他们生活的各种方式。搜索和个性化是推动这一增长的两大产品投资，它们将 ChatGPT 从一个“工作型”的平日工具转变为一个移动优先的个人助理，在周末也有稳定的使用量。

增长大致分为三个部分，各占三分之一：

经典的摩擦消除：移除登录墙，改进用户引导（据说 Sam Altman 从一开始就推动免身份验证）
核心产品投资：搜索、个性化、写作模块，所有这些都是研究团队和产品团队共同构建的
纯粹的模型改进：像 GPT-3.5 → GPT-4 → o-series 这样的阶跃式变化，以及不太引人注目的迭代更新（5.3、5.4），这些更新系统地解决了用户反馈

为什么下一个十亿用户需要不同的产品

ChatGPT 已经覆盖了全球约 10% 的人口。剩下的 90% 不会通过同样的途径而来。Turley 发现了两个根本性的障碍：

代理问题。 ChatGPT 是一个“原始电器”，一个不会告诉你它有什么用的电动工具。用户必须自己发现用例。对于下一波更忙碌、对技术不太感兴趣的用户来说，这款产品需要更多的示能性，更多的软件式结构，而不是一个空白的终端。

主动性差距。 大多数人太忙了，没空去想该委托什么。解决方案不是让提示变得更容易，而是要颠覆模型：不是用户提示 AI，而是 AI 提示用户。Pulse 是第一步，但它有局限性，因为它只能产生信息，而不能采取行动或与你的生活联系起来。

愿景是这些因素会相互叠加：行动 + 主动性 = 超级助手。想象一下，一个 AI 注意到你的指标下降，并主动运行分析，或者检测到你已到达目的地并呼叫出租车。不是因为你要求它这样做，而是因为它了解你的目标。

将编码代理作为试验场

特定领域的代理已经在工作。在编码方面，他们已经实现了 Turley 所谓的“逃逸速度”：许多 OpenAI 工程师不再打开他们的 IDE，一次也不打开。

“我们有很多工程师，他们一次也不打开他们的 IDE。”

关键的洞察力在于为什么编码代理会首先出现：代码是可测试的（你知道它是否有效），对强化学习友好，并且失败模式清晰可见。这创造了一个使产品变得伟大的爬山循环：人们尝试它，获得部分认可，这会生成真实的任务数据，团队使用这些数据来改进产品。

通用代理是下一个前沿。之前的 ChatGPT Agent 尝试“稍微早了一点”，模型不够好，无法达到逃逸速度，因此用户从未学会信任它。剩下的用例过于小众（将文件服务器迁移到云端），无法推动广泛采用。Turley 认为，他们正在接近一个阈值，即通用代理在有意义的现实生活任务中表现得足够好，可以获得部分认可，然后改进的飞轮就开始转动。

无限智能时代的价格

当前的订阅模式是历史基础设施限制的产物，而不是一种深思熟虑的定价理念。随着测试时计算能力允许智能几乎无限地扩展，这种比喻发生了转变：

“在当前时代，拥有无限流量套餐可能就像拥有无限电力套餐一样。这根本没有意义。”

高级用户正在提取巨大的价值，每个用户的 Token 消耗量正在急剧攀升（Turley 将内部图表描述为“令人难以置信”），并且 GPU 消耗量与交付的价值相关。Uber/Lyft 在 2015 年的比较是恰当的：在增长阶段进行补贴使用，随着产品成熟，定价必然会发生变化。

对于不常使用信用卡的用户和新兴市场，广告成为一种访问工具，而不是一种盈利手段。关于他们的广告试点的最常见支持咨询不是“如何禁用广告”，而是“如何投放广告”，生态系统想要参与进来。

GPU 零和博弈

GPU 是 OpenAI 最难权衡的因素。与传统软件不同，他们面临着真正的零和资源约束：每个服务于 ChatGPT 的 GPU 都意味着少了一个用于训练模型或运行 Codex 的 GPU。

一种简单的方法是优化每个 GPU 的增量收入。但这会扼杀从零到一的赌注。例如，Deep Research 无法以每个 GPU 的收入为基础来证明其合理性，但不发布它意味着永远无法发现消费者是否想要一款研究产品（他们确实想要）。

Turley 的启发式方法：从最受约束的资源（GPU）开始规划，首先优先考虑现有用户体验（快速、可靠），然后在已验证的用例和探索性赌注之间取得平衡。他看不到这种权衡消失的世界；即使单位成本下降，需求也在不断上升。

将 Code Red 作为一种管理工具

当谷歌的 Gemini 获得动力，并且 Marc Benioff 公开切换到它时，OpenAI 宣布进入“Code Red”状态，暂停了广告、健康代理和购物方面的工作，完全专注于改进 ChatGPT。

Code Red 不是危机信号，而是一种聚焦机制。它允许公司放弃其他项目，并专注于重要的事情：延迟、可靠性、模型质量、个性化。最终成果是 GPT-5.3（非常适合日常用户）和 5.4（知识工作的主力）。

持久的成果不是任何具体的产品改进，而是专注本身。在一家像 OpenAI 这样拥有众多机会的公司，接近通用人工智能的风险是分心。

“如果你要对 OpenAI 这样的公司未能实现其使命的原因进行事前分析，那很可能是因为注意力分散。”

Peter Steinberger 和 OpenClaw 的启发

Turley 对 Peter Steinberger（以 OpenClaw 闻名）加入 OpenAI 感到非常兴奋。OpenClaw 展示了一种 ChatGPT 团队一直在以各种形式追求的愿景：一个完全具身的人工智能，它存在于不同的 UI 中，保持状态，采取行动，并以简短、自然的短消息形式进行交互，而不是正式的提示。

ChatGPT 服务器的代码库名称是什么？“SA Server”，是 Super Assistant Server（超级助手服务器）的缩写。Turley 说，这证明这始终是他们的愿景。

结束语

以下是一些值得思考的观察结果：

最好的指标是无形的。 Turley 开玩笑说，“增加睡眠时间”才是真正的北极星，但他并非完全在开玩笑。产品团队确实在讨论如何衡量自我实现。当你的指标是某人的生活是否变得更好时，你最终会做出与优化参与度不同的决策。
Mac OS 的心智模型。 Turley 渴望渐进式披露：为普通用户提供神奇的简单性，为高级用户提供终端级别的强大功能。这两种极端情况都能教会团队不同的东西。普通用户迫使你完善界面；高级用户则为你进行产品发现。
好奇心是永久的技能。 当被问及学生应该关注什么时，Turley 没有说是编码或数学。他说的是好奇心，因为“如果机器可以回答你所有的问题，你最好有好的问题。”还有写作，因为向机器表达你想要的东西需要精确的思考。
时机是最难预测的。 Turley 可以看到未来的形态，但无法预测何时到来。他的规划范围是：“三个月到永远之间的任何时间都很难预测。”

观看原视频 →