2026年1月22日 · 访谈 · 20min
亚瑟·门施谈AI的真正价值:在于定制化,而非模型
Mistral AI 的 Arthur Mensch 提出了一个与我们通常从 AI 公司 CEO 那里听到的论点截然不同的观点:模型的价值不在于其本身,而在于定制化、部署控制以及深入垂直化以满足企业需求的能力。在达沃斯 Axios House 举行的 20 分钟访谈中,他阐述了为什么这一信念的验证速度甚至比他预期的还要快。
访谈内容
Axios 的 Ina Fried 于 2026 年 1 月在达沃斯采访了 Mensch。与去年 2 月相比,Mistral 的收入增长了 20 倍。对话涵盖了 Mistral 的开源战略、企业 AI 实际产生投资回报率的领域、AI 主权的地缘政治,以及我们是否正处于 AI 泡沫之中。Mensch 的言论经过深思熟虑,技术上精准,并且对大多数竞争对手视为其皇冠上的明珠的模型层,表现出明显的不带感情色彩的态度。
模型层是免费的
Mensch 的核心论点引人注目:模型本质上是对知识的压缩,并且正逐渐成为堆栈中的一个免费层。重要的是谁能够训练、定制和部署它们。
Mistral 在西方的开源模型现在大约落后于最佳闭源模型两到三个月。这种竞争压力很大程度上来自中国公司发布的极其强大的开源模型。最终结果验证了 Mensch 自 Mistral 成立以来一直在强调的观点:开源和闭源之间的差距正在缩小,以至于模型层本身不再是护城河。
“What we’ve essentially been saying from the very beginning, which is that the model layer is a free layer, is turning out to be true, and that what matters is customization.” 从一开始我们就一直在说,模型层是一个免费层,而重要的是定制化,事实证明这是正确的。
但这并不意味着训练能力无关紧要。拥有训练堆栈至关重要,因为深入的企业垂直化需要连接到公共训练数据中不存在的专有模式(图像、时间序列、特定领域的文本)。而且存在信任维度:模型是对知识的压缩,你可以在其中嵌入任何东西,包括安全漏洞。当企业使用 AI 进行编码时,他们需要信任模型的生产者以及生产方式。
企业 AI 真正发挥作用的领域
Mistral 95% 的业务来自企业。Mensch 坦率地谈到了实际采用情况与宣传情况之间的差异。
编码辅助和客户支持已经很成熟。但即使是客户服务,在实践中也“仍然有点早”。如果你深入到工程团队内部,你会发现摩擦比公开的说法要多。
Mensch 看到的真正突破在于供应链管理。当公司致力于完全自动化某个特定功能,而不是运行试点项目时,结果是显著的:集装箱调度效率提高了 80%,物料清单管理也取得了显著进展。之所以有效,是因为供应链涉及多个参与者、遗留软件和持久流程,这正是 AI 生成的代码与 LLM 处理动态输入相结合,创造复合价值的复杂工作流程。
第二个前沿领域是加速工程密集型公司的研发周期。通过与 ASML(半导体光刻公司)合作,Mistral 正在帮助将 AI 应用于机械和物理工程问题,而不仅仅是软件工程。这需要深度模型定制,因为通用模型中无法获得垂直领域的专业知识和专有数据。
80/20 问题
为什么企业在从试点到生产的过渡中会遇到困难?Mensch 的诊断很精准:他们没有将 AI 应用视为具有生命周期。
80% 的顺利路径自动化是有效的。原型看起来令人印象深刻。高管们感到兴奋。但 20% 的边缘情况才是所有问题爆发的地方。解决这些边缘情况需要一种迭代的、数据科学家式的思维模式:观察一切,识别失败模式,弄清楚你需要哪些数据来处理每个边缘情况,并逐步闭环。
这也意味着部署不完全准确的 Beta 系统,并围绕它们设计正确的人机交互模式。大多数企业在组织上并没有为这种迭代部署做好准备。
世界模型 vs. 上下文引擎
当被问及两个热门技术方向,即世界模型和自我改进模型时,Mensch 表明了明确的立场。
不投资世界模型。 但 Mistral 正在大力投资于机器人技术的感知模型:在资源和延迟受限的情况下快速推理,并且在没有持续互联网连接的情况下可靠工作的模型。Mensch 引用了他所谓的“无模型方法”,作为过去十年的惨痛教训:不要试图构建内部世界模型,只需更好地处理你收到的原始数据。
自我改进模型是一个系统问题,而不是一个模型问题。 Mensch 认为,关键不是改变模型架构,而是构建一个“记忆层次结构”,这些记忆逐渐变得更冷、更大。核心限制是 GPU 内存:你一次只能将这么多上下文输入到模型中。解决方案是一个不断更新的上下文层,它连接到企业数据源并在夜间处理它们,从而更新模型的工作表示。
“This is what you do when you sleep as a human. You update your memory and your representation, and that’s what you use in the day that follows.” 这就是你作为人类在睡觉时所做的事情。你更新你的记忆和你的表征,这就是你在接下来的一天中使用的东西。
他的元原则是:采用一个 Transformer,然后处理数据和编排。改进就来自于此。你可以调整 Transformer 的内部结构,但“大部分 Alpha 实际上在于你如何编排事物。”
主权优势
Mistral 25% 的业务与主权和战略自主权直接相关。这可以分为两类。
政府和公共部门。 Mistral 与大约 10 个欧盟成员国合作,其中一些合同规模非常大且雄心勃勃。关键卖点是完全控制:本地部署以及即将推出的完全由 Mistral 托管的完整云 AI 服务,与美国超大规模企业脱钩。
国防。 Mensch 直言不讳:国防系统现在到处都在使用 AI,从控制中心到无人机。如果你的威慑力量依赖于一个外国提供的 AI,而该外国的利益可能并不总是与你的利益一致,那么这就不再是威慑力量。这不仅适用于欧洲,也适用于美国和中国以外的每个国家。Mistral 在新加坡、摩洛哥和其他寻求替代美国和中国 AI 供应商的国家/地区拥有不断增长的业务。
“If you have a deterrence that is depending on a foreign country that may not always be aligned with what you want to achieve, then that’s a problem. That’s no longer deterrent.” 如果你的威慑力量依赖于一个外国,而该外国的利益可能并不总是与你想要实现的目标一致,那么这就是一个问题。这不再是威慑力量。
过去一年的地缘政治变化加速了这一趋势。当 Mistral 在 2023 年首次筹集资金时,谈论的是 AI 主权,人们对此不屑一顾,称欧洲已经输掉了云战争。但 AI 正在改变云的构建方式,并且最近的地缘政治紧张局势已经具体验证了主权论点。
欧洲被低估的优势:能源
欧洲资本的问题比预期的要小。资本流向机会。Mistral 的最新一轮融资包括 ASML 作为主要投资者,Mensch 认为这对于将价值创造留在欧洲经济体内非常重要。
欧洲真正的挑战是高级管理人员储备不足。生态系统还比较年轻,因此没有经验丰富的 CMO 或其他已经扩大了类似公司规模的高管。
但欧洲有一个被低估的显著优势:它的电网比美国电网好得多。未来几年可用的能源容量可能成为欧洲 AI 基础设施的真正竞争优势。Mistral 正在专门投资,将这种能源盈余转化为“过剩的智能”和收入,这些收入可以再投资于研发。
是否存在泡沫?
Mensch 的回答很微妙。机会是真实的:很大一部分 GDP 最终将在 AI 系统上运行。但时间线比宣传的要长。
“What I know is that the viscosity of the enterprise adoption is higher than what is advertised.” 我知道的是,企业采用的粘性高于宣传的。
围绕 AI 进行企业重组确实很困难,即使在最先进的公司也是如此。大多数企业缺乏自己部署 AI 的内部能力,并且需要一个服务层来提供帮助。这将比预期的需要更多年。
在投资方面,Mensch 质疑大规模训练运行的经济性。如果你花费 100 亿美元进行前沿训练运行,但三个月后一个开源模型以更高的可定制性和控制性达到其性能,你能证明这笔支出是合理的吗?这就是推动模型层走向商品化的动力。
Mistral 正在积极投资,但效率高于美国实验室,专注于在欧洲建立物理计算能力,并努力加快企业采用速度,Mensch 认为这是确保 AI 不是泡沫的真正关键。
后记
这是一次 20 分钟的访谈,它悄然颠覆了大多数 AI 公司围绕其构建战略的几个假设:
- 模型护城河正在消失。开源落后于闭源 2-3 个月,并且差距正在缩小。如果你正在建立一个依赖于模型本身成为价值的企业,那么你的窗口正在缩小。
- 企业 AI 采用确实很困难,不是因为技术不起作用,而是因为组织没有为 AI 应用所需的迭代的、数据科学家思维模式的部署过程做好准备。
- 工作流程自动化中的 80/20 分割是核心洞察:原型总是有效的,边缘情况才是公司死亡的地方。这是一个生命周期问题,而不是一个技术问题。
- 欧洲的能源网优势是一个值得关注的逆向押注。当美国在数据中心的电力可用性方面苦苦挣扎时,欧洲可能拥有剩余容量,这可能会改变计算经济学。
- Mensch 将自我改进模型定义为一个系统问题(上下文层次结构、内存管理、数据编排),而不是一个架构问题,这是一种独特的、值得更多关注的技术视角。