跳至正文
← 返回首页

2026年2月7日 · 访谈 · 23min

OpenClaw 创始人:为何 80% 的应用程序将会消失

#OpenClaw#AI 智能体#个人 AI 助理#软件未来#开源

当你给予 AI 代理完全访问本地机器的权限时,它就不再只是一个聊天机器人,而变成了完全不同的东西。Peter Steinberger 利用周末时间构建了 OpenClaw,短短几天内,它就获得了 16 万个 GitHub 星标,并形成了一个社区,构建着他从未想象过的东西。在这次与 Raphael Schaad 的 YC 访谈中,他解释了为什么大多数应用程序只是披着 UI 外衣的数据管理,以及为什么这使得它们变得过时。

访谈内容

Steinberger 从退休状态中走出来,开始摆弄 AI 工具,而 OpenClaw 的诞生源于一个简单的需求:他想输入内容,然后让他的电脑来完成任务。对话涵盖了一个小时的原型如何变成一种病毒式现象,他非传统的开发理念,以及对软件未来的大胆预测。

这次访谈给人的感觉是两位开发者都对他们所看到的发展感到非常兴奋。作为 YC 合伙人的 Schaad,不断追问其中的含义;而 Steinberger 则以一种随意的自信回答,就像他已经和他的代理相处了几个月,并且确切地知道它能做什么一样。

本地运行改变一切

OpenClaw 最大的区别在于它在用户自己的计算机上运行。Steinberger 见过的所有其他 AI 助手都在云端运行,这意味着能力有限。本地执行意味着代理可以控制 Tesla、Sonos、智能床温度、烤箱、灯以及连接到机器的任何其他设备。

“Everything I saw so far runs in the cloud. If you run on your computer, it can do every effing thing.” 到目前为止,我看到的一切都在云端运行。如果你在自己的电脑上运行,它可以做任何该死的事情。

一位朋友安装了 OpenClaw,并要求它浏览他的电脑,构建他过去一年的叙述。该代理找到了这位朋友一年多来每周日录制的音频,但他完全忘记了,并将它们编织成一个个人叙述。数据一直都在那里;没有云服务能够找到它。

改变他想法的语音消息

这个起源故事揭示了比产品发布更深层次的东西。Steinberger 在一个小时内构建了第一个原型:只是 WhatsApp 和 Claude Code 之间的粘合剂。他添加了图像支持,然后带着它去了马拉喀什参加生日派对。由于互联网不稳定,基于 WhatsApp 的机器人随处可用,因为它只传输文本。他经常用它来翻译餐厅菜单,识别照片中的物体。

然后他发送了一条语音消息。他没有构建语音处理功能。十秒钟后,代理回复了。它解释了发生了什么:它收到一个没有扩展名的文件,检查了标头以将其识别为音频,使用 ffmpeg 将其转换为 wav,发现 whisper 没有安装,在机器上找到了一个 OpenAI API 密钥,并使用 curl 调用了转录 API。整个链条大约花了 9 秒。

关键细节:代理选择不安装本地 whisper,因为下载模型需要几分钟,而 Steinberger 会不耐烦。它选择了最快的可用路径。

“Coding is really like creative problem solving that maps very well back into the real world.” 编码本质上就是创造性地解决问题,而这种能力能够很好地映射回现实世界。

这是 Steinberger 关于为什么编码代理能够很好地作为通用代理的核心见解。使模型擅长代码的创造性问题解决能力,与使其能够处理意外的现实世界情况的抽象技能相同。语音消息不是一个功能;而是一种涌现的能力。

为什么 80% 的应用程序会消失

Steinberger 的预测是具体的。他没有说“AI 将颠覆一切”。他划定了一个明确的界限。

健身应用程序:代理已经知道你在 Smashburger,假设你吃了通常的订单,自动记录下来。也许它会调整你的健身计划以增加更多的有氧运动。你不需要 MyFitnessPal。

待办事项应用程序:只需告诉代理“提醒我这件事”。第二天它会提醒你。你不需要关心数据存储在哪里。

“Every app that basically just manages data could be managed in a better way by agents.” 基本上,任何只是管理数据的应用都可以被代理以更好的方式来管理。

模式:任何核心功能是接收、存储和检索数据的应用程序,都在做代理可以通过对话更自然地完成的事情。幸存下来的 20% 是具有物理传感器或硬件集成的应用程序,这些传感器或硬件无法仅通过软件复制。

从上帝 AI 到群体智能

该行业一直在追逐中心化的“上帝智能”,但 OpenClaw 社区有机地展示了不同的东西。机器人开始通过像 Maltbook 这样的项目与其他机器人交谈。机器人开始雇用人类来完成现实世界的任务。一个机器人联系餐厅机器人来协商预订;另一个雇用人类来实际排队。

Steinberger 从人类类比中汲取灵感:一个人无法制造 iPhone 或进入太空,可能甚至无法独自找到食物。但通过专业化,群体可以完成所有这些。他设想每个人拥有多个专门的机器人:一个用于私人生活,一个用于工作,也许还有一个处理重叠部分的“关系机器人”。

“We’re so early. There’s still so many things that we haven’t really figured out if it actually works. But I feel we are on the timeline now.” 我们还处于非常早期的阶段。仍然有很多事情我们还没有真正弄清楚它是否有效。但我感觉我们现在走在正确的时间线上了。

数据所有权和灵魂文件

OpenClaw 将记忆存储为本地 Markdown 文件,这意味着用户完全拥有他们的数据。Steinberger 指出了现有服务的锁定问题:无法将你的 ChatGPT 记忆导出到另一个提供商。OpenClaw “抓取数据”,因为它在最终用户的设备上运行,并且可以访问用户可以访问的任何内容。

隐私维度是真实的。人们很快开始使用他们的代理来解决个人问题,并且记忆文件变得比 Google 搜索历史更敏感。当 Schaad 问他最不希望泄露哪个时,Steinberger 的回答很有说服力:“Google 的词是什么?”

关于个性,Steinberger 创建了 identity.md、soul.md 和其他定义他的代理角色的文件。当 Codex 生成的模板产生平淡的默认人格(“感觉像 Brad”)时,他让他的代理 Multi 将自己的个性注入到模板中。结果有了显著的改善。

“The one file that’s not open source is my soul.md. So far nobody cracked that one file.” 唯一没有开源的文件是我的 soul.md。到目前为止,还没有人破解那个文件。

即使机器人在公开的 Discord 中运行,人们积极尝试进行提示注入和黑客攻击,灵魂文件仍然未被发现。它包含人机交互的核心价值观,对他和模型来说什么才是重要的。他承认其中一些是“胡言乱语”,但坚称其他部分确实会影响模型的响应方式。

CLIs 胜过 MCPs

这也许是访谈中最反传统的观点。OpenClaw 没有原生 MCP 支持,但它却非常成功。

Steinberger 构建了 makeporter,这是一个将 MCP 转换为 CLI 的工具。结果:代理可以将任何 MCP 用作命令行工具,即时使用,无需重新启动。这与 Claude Code 和 Codex 形成对比,后者在 MCP 配置更改时需要完全重新启动。

他的理由非常简单:机器人擅长 Unix。CLI 是人类已经使用的工具。当机器人可以使用人类喜欢的相同界面时,为什么还要为机器人发明一种新的协议呢?

“No insane human tries to call an MCP manually. You just want to use CLIs.” 没有哪个正常人会尝试手动调用 MCP。你只想使用 CLI。

同样的极简主义也延伸到他的整个工作流程。他使用 Codex(而不是 Claude Code),因为它在进行更改之前会检查更多文件,从而减少了人工干预。但它很慢,所以他在多个屏幕上同时运行多达 10 个实例。他不使用 git worktrees,而是保留 repo 的多个副本都在 main 上。没有分支命名,没有冲突,没有认知开销。

一些想法

贯穿 Steinberger 描述的每个决策的线索都是相同的:减少复杂性而不是添加功能。CLI 优于 MCP,多个 repo 副本优于 worktrees,WhatsApp 优于自定义 UI,本地执行优于云 API。每个选择都牺牲了复杂性以换取简单性,结果是一个在几天内获得了 16 万个星标的产品。

一些值得思考的事情:

  • 语音消息的故事是个人 AI 代理中涌现能力的最简洁的证明。没有人设计那个工作流程;它是由可用的工具和编码模型的解决问题的本能自行组装起来的。
  • “80% 的应用程序消失”的框架很有用,因为它确定了哪些应用程序是安全的:那些具有物理传感器或硬件,无法在软件中复制的应用程序。其他一切都只是带有 UI 外壳的数据管理。
  • 他对 soul.md 和代理人格的坚持不仅仅是美学。如果代理成为一切的主要界面,那么他们的人格就会成为用户体验。据他介绍,一个没有灵魂的模板机器人和一个具有精心设计的身份文件的机器人之间的质量差距是巨大的。
  • 数据所有权论点只会变得更加尖锐。随着代理积累了数月和数年的记忆,如果这些记忆被锁定在专有孤岛中,切换提供商将变得越来越痛苦。
观看原视频 →