跳至正文
← 返回首页

2026年2月24日 · 访谈 · 31min

彼得·斯坦伯格:一人之力,用人工智能打造非凡成就

#OpenClaw#自主编码#开源#个人AI助手#开发者效率

Peter Steinberger 构建了 OpenClaw,一个个人 AI 代理,在短短几周内从无到有,登上了《华尔街日报》,并举办了上千人参与的社区活动。这个项目看起来像是一夜成名,但实际上是他在一年多的时间里,痴迷地进行 AI 编码实验,积累了 40 多个项目的结果。他的核心观点是:AI 编码是一项需要练习的技能,有一个学习曲线,而不是一个按键就能搞定的事情。而且,现在单个人可以构建的规模已经超出了任何人的心理模型。

节目概述

Steinberger 和 OpenAI 的 Romain Huet 之间的这次对话,录制于 Steinberger 加入 OpenAI 之前。Huet 自 2011 年(PSPDFKit 时代)就了解 Steinberger 的工作,并带领他回顾了整个历程:在经营公司 13 年后精疲力尽,通过 AI 工具重新发现构建的乐趣,以及从个人实验到全球开源现象的意外之路。对话的基调轻松但内容丰富,Steinberger 异常坦诚地谈论了他的工作流程、他的错误,以及他与 AI 生成代码之间不断演变的关系。

从精疲力尽到起鸡皮疙瘩

在出售 PSPDFKit 之后,Steinberger 精疲力尽。他关注了早期 ChatGPT 的新闻,但并没有留下深刻印象:“仅仅阅读关于新技术的文章并不能传达其力量。” 真正的突破发生在他决定真正构建一些东西的时候。

他拿出了一个半成品项目(在精疲力尽期间放弃的),将其导出为一个 1.5MB 的 Markdown 文件,将其拖入 Gemini Studio 以生成一个 400 行的规范,然后将该规范输入 Claude Code,并使用一个简单的命令:“构建”。它在侧屏幕上运行了几个小时。他自己也承认,输出是“最糟糕的垃圾”。但这个过程本身让他起了鸡皮疙瘩。

“I had this realization that now I can build anything.” 我意识到现在我可以构建任何东西了。

那天晚上,他无法入睡。他脑海中充满了所有他一直想构建但从未有精力构建的项目。关键的洞察力不在于代码质量,而在于意图和执行之间差距的缩小。

那个搞懂语音消息的 WhatsApp 代理

OpenClaw 并非源于一个总体规划。Steinberger 想要一个可以访问他的 WhatsApp 的个人代理,构建了一个原型,然后假设大型实验室会推出更好的东西。到 11 月,他们还没有:“为什么这些实验室还没有构建任何东西?”

第一个原型花了一个小时。真正的产品市场契合信号来自一次去马拉喀什的旅行,在那里糟糕的网络使 WhatsApp 成为唯一可靠的渠道。他发现自己一直在使用该代理:翻译、寻找餐厅、在他的电脑上查找东西。看到这一切的朋友们都想要它。

决定性的时刻:他发送了一条理论上不应该起作用的语音消息(没有内置语音处理功能)。打字指示器出现了。然后收到了一条回复。当他问模型发生了什么时,它解释了它的推理链:消息以没有扩展名的文件形式到达,因此它检查了文件头,识别出 Opus 音频,使用 FFmpeg 转换它,发现 Whisper 没有安装,在环境中找到了一个 OpenAI API 密钥,使用 cURL 调用了转录端点,并回复了文本。

“I didn’t build this kind of work. And then the model just replied to me.” 我没有构建这种工作方式。然后模型只是回复了我。

对于那些称其为安全风险的批评者,Steinberger 的反应是:“我把密钥放在环境中正是出于这个原因。我的机器人工作在相同的环境中。它当然应该访问我的 OpenAI 密钥。”

Discord 事件和 Prompt 注入的现实

为了公开演示 OpenClaw,Steinberger 将该机器人放入一个没有沙盒的 Discord 频道中。在第一个晚上引起关注后,他关闭了它并去睡觉了。他醒来时看到了 800 条消息,全部由机器人回答。原因是:他忘记了一个 macOS LaunchDaemon,它被配置为在五秒钟内自动重启任何被杀死的进程。

人们试图通过粘贴巨大的代码块来进行 prompt 注入。模型的反应是:“我不读这个。” 它嘲笑了攻击者。他的秘密 mysoul.md 文件(定义了代理的价值观和行为准则)从未泄露。

他承认 prompt 注入是“未解决的”,但他认为实际的攻击比安全社区假设的要困难得多。他后来将该代理沙盒化在一个 Docker 容器中。该模型对容器内几乎没有任何可用的东西的反应是:它使用 C 编译器和 TCP 套接字从头开始构建了自己的简陋版本的 cURL。“这些东西非常有资源。”

“Vibe Coding 是一种侮辱”

Steinberger 在轻蔑的实验和真正的 AI 编码技能之间划清了界限:

“I think vibe coding is a slur.” 我认为 vibe coding 是一种侮辱。

他的论点是:人们尝试一次 AI 编码工具,体验不好,然后得出结论,该技术不起作用。这就像拿起吉他并期望在第一天就弹得很好。AI 编码是一项需要学习曲线的技能。他现在对哪些 prompt 会起作用、它们需要多长时间,以及何时出现问题表明架构错误而不是模型故障有了一种发自内心的直觉。

他的 GitHub 个人资料以视觉方式讲述了这个故事:一年内跨越 120 多个项目的 90,000 次贡献。活动图从白色开始,变成浅绿色,然后在 10 月至 11 月变成深绿色。转折点:切换到 Codex。不仅仅是因为模型有所改进,还因为他对如何使用它们的理解得到了加强。

他称过度优化工具设置为“代理陷阱”:它感觉很有成效,但并非如此。他自己的设置是故意简单的。没有工作树,只有编号为 1 到 10 的基本检出。他的工作方法:将模型交互视为对话,并在让它执行之前始终询问“你有什么问题吗?” 模型经过训练可以立即解决问题,默认情况下会做出假设。这些默认假设并不总是最佳的,尤其是在模型训练大量旧代码的情况下。

“People don’t realize that the model usually starts with a blank slate. Every new session is like, I know nothing about this codebase.” 人们没有意识到模型通常从一张白纸开始。每个新会话都像是,我对这个代码库一无所知。

代码是可有可无的,意图是资产

Steinberger 最具挑衅性的立场:他发布了他不读的代码。他的理由是务实的,而不是鲁莽的。

他认为,大多数代码都是无聊的:它将一种形状的数据转换为另一种形状。他通过观看生成流获得了足够的心理模型,可以定向地判断输出是否符合他的意图。类比:管理 AI 编写的代码就像管理一个工程团队。你接受其他人不会以完全相同的方式编写代码。目标是优化代码库,以便代理能够做到最好,这并不总是与为人类优化相同。

信任等级引人注目:他对模型不怀恶意的信任高于他对从未互动过的未知开源贡献者的信任。

OpenClaw 收到了超过 2,000 个 PR。他将它们重新定义为“prompt 请求”而不是“pull 请求”,因为代码的重要性不如意图。他的审查流程:询问模型,“你理解这个 PR 的意图吗?” 大多数 PR 提出的是局部修复,而真正的问题是架构上的。许多贡献者不知道如何有效地使用该代理,因此他经常从意图重建解决方案,而不是合并提交的代码。

“PRs actually sometimes take me longer than if I would approach it myself… I don’t really care about the code. I care about what is the person actually trying to solve.” PR 实际上有时比我自己处理需要更长的时间……我真的不在乎代码。我关心的是这个人实际上试图解决什么问题。

黑客的天堂 vs. 妈妈的安装

OpenClaw 未来的紧张关系:使其对非技术用户来说足够容易访问,同时保持其可破解性。

默认安装是 git clone,构建,运行。该代理位于源代码内部并了解它。用户可以提示该代理修改自身,从而创建真正自修改的软件。这种设计选择吸引了以前从未提交过 PR 的贡献者。

安全反弹来自设计意图和用户行为之间的不匹配。Web 服务器仅为本地网络构建。当用户将其放在公共互联网上时(尽管文档明确警告不要这样做),安全研究人员将缺少登录限制标记为 CVSS 10.0 漏洞。Steinberger 的回应是:“我不是为此构建的。” 他此后聘请了一位专门的安全专家,其首要任务是防止用户伤害自己,而不是防御复杂的国家级攻击。

“This would have not been possible by any one human. There is no model for something like this could be built by one person. So they don’t even consider that.” 这不可能由任何一个人完成。没有人会想到这种东西可以由一个人构建。所以他们甚至没有考虑到这一点。

结束语

使这次采访值得密切关注的不是 OpenClaw 的技术细节,而是资深构建者对软件的思考方式的根本转变。

  • 规模不协调是真实存在的。人们要求与完全由一个人构建的项目的 CEO 或人力资源团队交谈。“一个人可以构建什么”的心理模型尚未赶上现实,这种差距既创造了机会,也造成了混乱。
  • “Prompt 请求”与“pull 请求”捕捉到了软件中价值迁移的重要内容。如果代码本身的重新生成成本很低,那么稀缺的资源就是架构判断和明确的意图。
  • 马拉喀什之旅作为产品验证是一个教科书般的案例:产品市场契合度的最佳信号不是来自指标,而是来自发现自己在受限环境中强迫性地使用自己的工具。
  • 语音消息故事更多的是关于涌现,而不是关于安全。当你给模型完整的计算机访问权限时,它们会解决你从未为它们编程的问题。这令人兴奋还是令人恐惧取决于你的先验,但 Steinberger 显然生活在“令人兴奋”的阵营中。
  • 发布时间很重要:OpenAI 在 Steinberger 加入公司后发布了这次采访。其潜台词是招聘叙事:这就是 OpenAI 想要的那种构建者,而 Codex 是实现这种构建的工具。
观看原视频 →