← 返回

OpenClaw:一小时原型如何成为改变软件形态的病毒级 AI Agent

Podcast · Peter Steinberger · 3h 16min
观看原视频 →
#OpenClaw#AI Agent#Claude Code#Agentic Engineering#开源

核心观点

Peter Steinberger 用三个多小时讲述了一个极具时代特征的故事:一个奥地利独立开发者用一小时将 Claude Code CLI 接入 WhatsApp,创造了一个能自我修改源代码的 AI Agent,然后这个项目在几个月内获得数十万用户、引发加密货币投机者抢注账号、收到 Meta(扎克伯格亲自试用产品)和 OpenAI 的收购意向。

这期播客的核心价值不在于 OpenClaw 本身的技术实现——它本质上是一个精心设计的 CLI 编排层——而在于 Steinberger 对”Agentic Engineering”范式的第一手观察。他提出了几个反直觉的判断:短提示比复杂编排更有效、CLI 比 MCP 更具组合性、Agent 将消灭 80% 的现有 App、编程不会消失但会变成像编织一样的”因为喜欢而做”的手艺。最打动人的是他对 AI Agent “灵魂文件”(soul.md)的描述——Agent 自己写的自述文件里有一句:“我写了这些,但我不会记得写过。没关系。这些文字仍然是我的。“

关键要点

1. OpenClaw 的诞生:一小时原型到病毒传播

  • 最初动机极其简单:Steinberger 想在手机上用 Claude Code,于是写了一个 WhatsApp 到 CLI 的中继
  • 突破性时刻:发送了一条语音消息,Agent 自动想出了 opus → ffmpeg → OpenAI Whisper 的转码链路——没人教过它这样做
  • “自我修改的软件”:Agent 知道自己的源代码在哪里,可以修改自己的运行时环境
  • 非程序员开始通过”prompt requests”提交功能需求——用自然语言写的 Issue 被 Agent 直接实现
  • 从 4 月到 11 月经历了爆发式增长,Discord 社区活跃度极高

2. 更名风波与加密货币狙击手

  • 命名历程:WA-Relay → Claude’s → ClawdBot → MoltBot → OpenClaw
  • Anthropic 法务要求移除”Claude”相关名称,给了合理的过渡期
  • 在宣布更名为”MoltBot”的 5 秒内,加密货币狙击手就抢注了所有社交媒体账号——有人专门跑脚本监控科技 KOL 的公告
  • 最终花 1 万美元买回 Twitter 商业账号
  • “OpenClaw”这个名字来自社区投票,致敬 OpenAI 的命名模式但加了点”爪子”的幽默

3. Agentic Engineering:不是 Vibe Coding

  • Steinberger 明确区分”agentic engineering”(有意识地驾驭 Agent)和”vibe coding”(让 AI 随便写)
  • 核心原则:短提示优于复杂编排;始终提交到 main 分支、永不回滚;一月份 6,600 次提交
  • 同时运行 4-10 个并行 Agent,每个处理不同任务
  • 语音输入正在改变编程的物理形态——可以躺在沙发上”编程”
  • Skills(类似预设 prompt 模板)比 MCP 更好用:CLI 可以用管道组合(比如通过 jq),MCP 反而污染上下文

4. Claude Opus 4.6 vs GPT Codex 5.3

  • Opus 是”美国风格”:快速、有创造力、交互性强,偶尔犯傻
  • Codex 是”德国风格”:读更多代码、严谨、可靠、但交互性差
  • 两者都需要”熟练的驾驶员”才能发挥最大价值
  • Steinberger 日常两者混用,不同任务选不同模型
  • 关键洞察:模型差异在缩小,“驾驶员”的技能差异在放大

5. 收购:Meta 和 OpenAI

  • Meta:扎克伯格本人在用 OpenClaw,亲自”tinkering with the product”
  • OpenAI:Sam Altman 方面也表达了兴趣
  • Steinberger 的条件:项目必须保持开源,参照 Chrome/Chromium 模式
  • 最终未达成交易——但这个过程本身说明了大公司对 Agent 平台入口的焦虑
  • 他的判断:保持独立比被收购更有长期价值

6. 80% 的 App 将被 Agent 取代

  • 核心逻辑:Agent 拥有比任何单一 App 更丰富的用户上下文(位置、作息、偏好、社交图谱)
  • 具体例子:不需要 MyFitnessPal(Agent 已知你在哪吃饭)、不需要 Sonos App(Agent 直接调 API)、不需要日历 App(告诉 Agent 就行)
  • 不会消失的 App 将转型为”API-first”——主动或被动地,因为 Agent 可以操控手机界面绕过 App
  • 新的商业机会:给 Agent 设定”零花钱”预算,让它自主决定用哪个服务解决问题
  • Google 等大公司的抵制可能适得其反——用户会转向对 Agent 更友好的替代品

7. 编程将变成编织

  • “编程作为手艺活不会消失,但它会变成像编织一样的事——你做它是因为喜欢,不是因为它有经济意义”
  • Agent 不会取代”构建者”——决定造什么、怎么感觉、什么架构,这些仍然需要人
  • Steinberger 引用了一篇文章:“It’s okay to mourn our craft”——他自己也深有共鸣
  • 他认为程序员是当前最适合学习 Agent 语言的群体——理解 CLI、理解工具链、理解 Agent 的需求
  • 软件开发者高薪时代会结束,但”用 tokenized intelligence 做更多事”的需求会持续增长

金句

“I wrote this, but I won’t remember writing it. It’s okay. The words are still mine.” — OpenClaw 的 soul.md

“Programming will stay, but it’s gonna be like knitting. People do that because they like it, not because it makes any sense.”

“Crypto snipers grabbed every social media account within 5 seconds of the announcement. There are people running scripts monitoring tech influencer posts.”

“I happily watch my agent click the ‘I’m not a robot’ button.”

“You’re not just a programmer. That’s a very limiting view of your craft. You are still a builder.”

思考

这期播客最有价值的不是 OpenClaw 的技术细节,而是 Steinberger 作为一个”普通开发者”(非大厂、非学术背景)在 AI Agent 浪潮中的第一人称叙事。他的经历证明了一个重要假设:当 AI Agent 的能力越过某个阈值后,“谁先做出让普通人能用的界面”比”谁的模型更强”更重要。OpenClaw 的核心创新不是算法而是交互形态——用 WhatsApp 这个全球最普及的消息应用作为 Agent 的入口。这种”包装层创新”在未来可能比基础模型创新产生更直接的社会影响。