跳至正文
← 返回首页

2026年1月28日 · 访谈 · 37min

Peter Steinberger 自 Clawdbot 爆红以来首次公开亮相

#AI 代理#开源#个人 AI 助理#氛围编码#软件颠覆

一位独自开发的开发者,在因倦怠而退休三年后回归,意外地构建了一个可能成为 GitHub 历史上增长最快的开源项目。他没有筹集数十亿美元,也没有组建团队,而是通过解决自己的痛点:他想在煮咖啡时通过 WhatsApp 与他的 AI 代理交流。

访谈

Peter Steinberger 在维也纳当地时间晚上 11 点加入了 TBPN 主持人 John Coogan 和 Jordi Hays 的行列,这是自 Clawdbot(现已更名为 Maltbot)走红以来他的首次公开露面。对话涵盖了他从 iOS 开发者倦怠到意外创造全球现象的历程,他对为代理构建的理念,以及他为什么认为 2026 年将是个人助理之年。

对于一个坐在多个风险投资公司正疯狂试图投资的项目上的人来说,他的语气非常随意。Steinberger 反复强调,他构建这个项目是为了乐趣,不需要钱,并且更喜欢成立基金会而不是公司。

从倦怠到“Claude 代码匿名者”

Steinberger 在 Apple/iOS 生态系统中经营了自己的软件公司 (PSPDFKit) 13 年,大约四年前将其出售,然后撞到了墙。随之而来的是三年的完全倦怠,他对此开玩笑,但显然非常重视。

正如他所说,计算方法是:每工作四年,就需要一年的恢复期。不停地工作了十三年意味着需要休息三年。

2025 年 4 月,他的灵感又回来了。来自 iOS 的他,想构建 Web 和云端的东西,但又不想觉得自己像个白痴。因此,他研究了 AI 辅助编码。由于错过了“非常糟糕”的那些年,他直接进入了 Claude Code 的 Beta 版本。

“I literally had trouble going to bed. We had addiction before and then we had addiction again.” 我真的很难入睡。我们以前有瘾,现在又上瘾了。

他凌晨 4 点开始给朋友发短信,谈论 Claude Code。他们回复了。他发起了一个名为“Claude 代码匿名者”的聚会(现在更名为“代理匿名者”,以跟上时代)。他的 Twitter 简介是:“从退休中回来,玩弄 AI。”

灵光乍现的时刻:马拉喀什的语音消息

Clawdbot 的起源故事纯粹是意外发现。Steinberger 在大约一个小时内拼凑了一个 WhatsApp 集成:接收消息,调用 Claude Code,返回响应。简单的一次性中继。

然后他添加了图像支持,因为屏幕截图为代理提供了丰富的上下文,而无需键入。在马拉喀什的生日旅行中,他发现自己一直在使用它,不是为了编程,而是为了寻找餐馆,随时随地解决问题。

然后是关键时刻:他本能地发送了一条语音消息,忘记了他还没有构建语音支持。已读指示器出现了。十秒钟后,代理回复了,好像什么都没发生一样。

当他问是如何做到的时,代理解释了它的推理链:该消息包含一个指向没有扩展名的文件的链接。它检查了文件头,将其识别为 Opus 音频。它使用 ffmpeg 将其转换为 WAV。它试图使用 Whisper,但发现安装错误。它四处寻找,在环境变量中找到了一个 OpenAI 密钥,通过 curl 将音频发送到 OpenAI 的 API,获得了转录,并做出了回应。

“That was the moment where, wow. These things are damn smart, resourceful beasts if you actually give them the power.” 那一刻,哇。如果你真的给它们权力,这些东西是非常聪明、足智多谋的野兽。

这让他相信这里面有真正的东西。不是编码能力,而是代理能够利用系统上可用的任何工具进行即兴创作的能力。

CLI 胜过 MCP:为模型的思考方式构建

Steinberger 有一个强烈而具体的技术观点:MCP(模型上下文协议服务器)无法扩展。CLI 可以。

他的论点是:代理已经了解 Unix。你的电脑上可以有一千个小的 CLI 程序。代理只需要知道名称,调用帮助菜单,理解界面,然后使用它。如果你构建的 CLI 输出模型已经期望的内容(结构化、可预测、机器可读),那么一切都会更好。

“Don’t build it for humans, build it for models.” 不要为人类构建,为模型构建。

在构建 Clawdbot 之前,他创建了数十个 CLI:一个用于 Google Places,一个用于他的 Sonos 系统,一个用于他的安全摄像头,一个用于家庭自动化。每个 CLI 都赋予了他的代理更多的权力,并使整个系统更加有用。他认为,这是一种新型软件:为模型的思考方式而不是人类浏览 GUI 的方式而构建的、由代理驱动的工具。

他通过让他的代理 SSH 进入他在伦敦的 MacBook 来调高音量,从而构建了“世界上最昂贵的闹钟”。他用“给我一个惊喜”的提示赋予了代理一个心跳。整个方法在技术和艺术上是同等重要的。

为什么应用程序会消失

Steinberger 对软件的未来做出了一个具体的预测:一整个应用程序层将会消失,因为人们将以不同的方式与 AI 代理互动。

他的例子:为什么你还需要 MyFitnessPal?拍一张你的食物的照片,代理就已经知道你在麦当劳做出了错误的决定。它有你的健身目标、你的锻炼计划、你的饮食历史。它会自动调整一切。不需要应用程序。

“Most apps will be reduced to API, and then the question is, do you still need the API if I can just save it somewhere else?” 大多数应用程序将被简化为 API,然后问题是,如果我可以将它保存在其他地方,你还需要 API 吗?

他在维也纳的一次聚会上遇到一个人,他是一家没有编码经验的设计机构,他们在 12 月份发现了 Clawdbot,现在通过与代理的对话完全构建了 25 个内部 Web 服务。非技术人员构建定制软件,免费解决他们的问题,因为与代理交谈是很自然的。

重命名风波和 Anthropic 的电子邮件

其中一个更精彩的部分:Anthropic 联系了 Steinberger,要求他重命名该项目(最初名为 Claudebot,与他们的商标太接近)。他赞扬他们“非常好”,派了一个内部人员而不是律师。

执行过程很混乱。他同时打开了两个浏览器窗口。在一个窗口中按下了重命名,当他在另一个窗口中完成创建新帐户时,加密货币抢注者已经使用自动化脚本抢注了该句柄。X 的团队帮助迅速解决了这个问题,但大约 20 分钟内情况一片混乱。

主持人指出,新名称 (Maltbot) 效果很好,并且拥有品牌独立性从长远来看会很好。Steinberger 同意,但显然觉得时机很紧张。

安全性、规模和单人开发者问题

随着病毒式传播而来的是 Steinberger 从未设计过的问题。该项目是为个人使用而构建的:一个人在受信任的环境中通过 WhatsApp 或 Telegram 与他们的代理交谈。现在人们正在将调试 Web 应用程序暴露于开放的互联网,这造成了他从未考虑过的威胁模型。

“What people don’t realize is this is not a company. This is one dude sitting at home having fun.” 人们没有意识到的是,这不是一家公司。这只是一个人坐在家里玩得开心。

他坦诚地承认自己不堪重负。有一次,他将 Discord 问题复制粘贴到 Codex 中以进行自动回复,然后复制整个频道并“回答 20 个最常被问到的问题”。安全研究人员正在向他发送报告,其中一些报告对于他从未打算支持的用例是有效的。

他务实的看法是:提示注入尚未解决。没有公司会将其作为产品发布,因为根本问题仍然没有解决。但需求可能会加速研究以解决这些问题。

基金会胜过公司,MIT 胜过限制

当被问及成立公司(风险投资公司“疯狂地想给你钱”)时,Steinberger 说他更愿意考虑成立基金会或非营利组织。主持人开玩笑说“10,000 家风险投资公司刚刚在墙上打了一个洞”,然后指出投资非营利组织最近实际上效果很好,这具有讽刺意味。

在开源许可方面,他的想法同样具有哲理性。他选择了 MIT,知道人们会 Fork 它并出售它。他的防御策略是:使开源版本如此出色,以至于商业 Fork 没有太多空间可以区分。

“Code is not worth that much anymore. You could delete it and build it again in months. It’s much more the idea and the eyeballs and maybe the brand that actually has value.” 代码的价值已经不高了。你可以删除它并在几个月内再次构建它。真正有价值的是想法、关注度,也许还有品牌。

关于模型:Opus 用于性格,Codex 用于可靠性

一个简短但具有启发性的关于模型偏好的题外话。Steinberger 认为 Opus 是总体上最好的,尤其是在个性和 Discord 互动方面。他编写了一个“不回复”令牌,因此代理不会垃圾邮件发送每条消息,只是倾听并偶尔说出一个真正能落地的笑话。

但是,对于编码,他更喜欢 Codex (OpenAI):“我实际上提示并推送到主分支,有 95% 的把握它能工作。”Claude Code 需要“更多的技巧,更多的装模作样”才能达到相同的结果,尽管两者都很好。他可以使用 Codex 更快地并行化,因为它需要的帮助更少。

他运行一台配置最高的 Mac Studio(不是 Mac Mini;“我的代理有点像公主”),配备 512GB 内存来试验本地模型,并将 MiniMax-21 命名为当前最好的开源模型。

后记

这次访谈捕捉到了一个罕见的时刻:一位真正独立的开发者处于一种文化现象的中心,明确选择不以传统方式从中获利。以下是一些值得探讨的线索:

  • 即兴创作论才是真正的故事。 不是 AI 可以编码,而是具有系统访问权限的代理将找到开发者从未预料到的解决方案。马拉喀什语音消息事件不是一个轶事;它是一种设计理念。
  • “为模型构建,而不是为人类构建”是一种软件架构的转变。 如果 Steinberger 认为 CLI 在代理交互方面优于 MCP,那么它颠覆了数十年的 UX 思考。下一代软件的最佳界面可能是 --help
  • 应用程序消失的预测已经可以测试。 一家非技术设计机构通过代理对话运行 25 个定制 Web 服务是一个数据点,而不是推测。
  • 单人开发者悖论。 一个人现在可以以一家小公司的速度发布产品,但病毒式传播的需求(安全性、支持、治理)仍然需要组织规模。Steinberger 的答案,一个基金会,本身就是一个实验。
观看原视频 →