跳至正文
← 返回首页

2026年2月1日 · 播客 · 1h 4min

人工智能生物中心:马克·扎克伯格和普莉希拉·陈押注虚拟细胞

#人工智能生物学#虚拟细胞#精准医疗#陈-扎克伯格计划 (CZI)#前沿科学

如果将前沿人工智能实验室与前沿生物学实验室结合,专门设计实验来生成模型所需的数据,会发生什么?这就是 Chan Zuckerberg Initiative(简称 CZI)未来十年的核心理念,它代表了一种与 DeepMind 利用其他科学家 30 年来收集的数据开发 AlphaFold 的根本不同的方法。

对话内容

这期串场节目来自 Latent Space 播客(由 Swyx 和 Alessio 主持),邀请了马克·扎克伯格和普莉希拉·陈在 CZI 的成像研究所,纪念 Chan Zuckerberg Initiative 成立 10 周年。这次对话对于扎克伯格的露面来说,显得格外“书呆子气”:没有谈论 Meta、社交媒体或 VR。相反,它深入探讨了他们为何将科学,特别是人工智能驱动的生物学,作为他们未来慈善事业的唯一重点。

两人之间的互动颇具启发性。马克以系统和抽象的方式思考(“就像建立不同层次的模式匹配”)。普莉希拉则带来了临床的紧迫性(“我是一名儿科医生,我想到的是婴儿,以及发生在非常年幼的人身上的非常悲伤的事情”)。他们共同提出了一个既有技术基础,又具有情感吸引力的论点。

为何选择工具,而非疗法

CZI 的战略押注是违反直觉的:他们不是资助针对特定疾病的研究,而是构建科学基础设施。马克从历史的角度来解释这一点:重大的科学进步几乎总是以新的仪器为先导。望远镜使天文学成为可能。显微镜使微生物学成为可能。CZI 的押注是,新的计算和成像工具将推动下一波生物学突破。

这与盖茨基金会的运作方式(专注于转化工作和公共卫生服务)以及 NIH 资助研究的方式(向个体研究人员提供小额资助)刻意不同。CZI 建立机构,直接聘用科学家和工程师,并运营实验室。第一个生物中心连接了斯坦福大学、加州大学旧金山分校和伯克利分校,实现了跨机构合作,这听起来很明显,但实际上是科学研究组织方式的一项重大创新。

“Our mission is to cure, prevent all diseases, and that’s not going to happen just in our four walls. So the strategy has to be: how do we make every single scientist better and more effective?” 我们的使命是治愈、预防所有疾病,而这不可能仅靠我们自己的力量来实现。因此,战略必须是:我们如何让每一位科学家变得更好、更有效?

关于时间表的问题引出了本期节目中最精彩的笑点。当他们最初将目标设定为“在本世纪末之前”时,生物学家认为这非常雄心勃勃。人工智能研究人员则认为这简直是毫无雄心壮志。马克指出,实际的时间表可能更多地取决于人工智能的进步速度,而不是生物学研究的步伐。

人类细胞图谱和十亿细胞项目

CZI 的第一个十年产生了人类细胞图谱:已编目 1.25 亿个细胞,其中 CZI 负责约 25% 的数据,更广泛的科学界通过 Cell by Gene 贡献了其余部分。普莉希拉强调了一个惊人的事实:直到最近,科学家们甚至不知道人体内存在多少种细胞类型。他们知道有数十亿种,但他们只描述了一小部分,而且主要是在健康状态下。

排列组合的数量是惊人的:物种、祖先、年龄、性别、环境暴露、健康与疾病状态。每个维度都增加了复杂性。

最初花费十年时间完成的 1.25 亿个细胞,现在正在以更快的速度加速。十亿细胞项目正在几个月内以更低的成本进行。但是,单细胞转录组学只是一个维度。CZI 现在正在增加空间成像(通过定制的显微镜,而不是现成的设备),而下一个前沿是时间数据:对活细胞进行随时间推移的成像,而不仅仅是冷冻切片。他们甚至对透明的斑马鱼进行成像,作为活体模型,然后使用人工智能将研究结果转化为人类生物学。

前沿生物学与前沿人工智能的结合

马克介绍了一个框架,概括了核心理念:一个“前沿生物学实验室”与一个“前沿人工智能实验室”同步工作。与 AlphaFold 的区别很重要。DeepMind 将前沿人工智能应用于几十年积累的现有生物学数据。CZI 的方法是设计生物学实验和仪器,专门用于生成能够使人工智能模型更智能的数据类型。

这是对传统科学思维的颠覆。传统上,科学家生成数据集以供查看并进行发现。CZI 的方法:生成数据来训练模型,这些模型将进行您无法通过直接查看数据进行的发现。

“I’m now going to do this so I can help train this other thing to be better and create more advances. That is a little bit of an inversion in the thinking.” 我现在要做这件事,以便帮助训练另一个东西变得更好,从而创造更多进步。这在思维上有点颠覆。

具体的实例化是虚拟细胞,以分层方式构建:

  • 分子到蛋白质:理解分子相互作用
  • 蛋白质到细胞:模拟蛋白质在细胞内的相互作用(由 ESM3 和冷冻电镜空间模型实现)
  • 细胞到系统:模拟多细胞相互作用(例如,虚拟免疫系统)
  • 系统到生物体:最终的“生物学全模型”

马克明确地类比了语言模型的演变方式:单独开发不同的模态(文本、图像、音频),然后合并,积极的转移使一切都更强大。同样的合并过程应该发生在跨尺度的生物学模型中。

进化尺度和人工智能领导力押注

本期节目恰逢 Evolutionary Scale(ESM3 的创建者,ESM3 是领先的蛋白质模型之一)加入生物中心的公告,首席执行官 Alex Rivas 将领导合并后的人工智能-生物学项目。马克将任命一位人工智能人士负责整个项目的决定,视为他们认为人工智能将发挥核心作用的信号。

CZI“可能是第一个为生物学研究构建大规模计算集群的机构”,并计划发布前沿模型。他们现有的建模团队与 Evolutionary Scale 的蛋白质专业知识相结合,旨在涵盖从分子到细胞的完整层次结构。

验证问题

最有趣的线索之一是模型和湿实验室之间的反馈循环。在语言模型中,您可以廉价地运行数万次测试。在生物学中,验证需要物理实验。

普莉希拉坦率地谈到了挑战:通过并行实验,已建立的湿实验室指标的吞吐量正在加快,但它远未达到人工智能模型通常需要的数万次验证。他们需要“聪明地进行验证”。

马克反驳了虚拟模型将完全消除湿实验室工作的观点,称其为“生物学版本的‘人工智能将自动化社会中的一切’”。更现实的近期价值:模型生成假设,科学家运用品味来选择要测试的假设,结果反馈到模型中。

“Right now, because the wet lab is so expensive and relatively slow, people are going for hypotheses that are singles or doubles. But if we have a model that can help de-risk some of the bigger, riskier ideas, that’s going to move science faster.” 目前,由于湿实验室非常昂贵且相对缓慢,人们只敢追求安全的假设。但如果我们有一个模型可以帮助降低那些更大、更冒险的想法的风险,那将使科学发展得更快。

N=1:精准医学愿景

普莉希拉最热情的部分是关于“意义不明的变异”。当某人接受基因检测以解决诊断难题时,他们通常会了解到一些不寻常的基因变异,但有一个令人沮丧的警告:“我们不知道它们意味着什么。”您应该惊慌吗?您应该不惊慌吗?

虚拟细胞模型可以通过模拟每个变异在细胞水平上的实际作用来改变这一点,无论它是否影响疾病途径或是否是良性的。目前,在实验室中对每个人进行建模既昂贵又困难。但是,计算模型使之成为可能。

她以抑郁症为例。目前的治疗方法纯粹是经验性的:尝试一种抗抑郁药(通常是医生最熟悉的一种),等待几个月才能看到它是否有效,如果无效,则尝试另一种。与此同时,患者遭受痛苦。愿景:可以根据个体的生物学预测哪种药物对特定个体有效的模型。

“That’s the future I want to live in, where we can actually understand individuals as individuals and use the biology and science very directly to keep them well.” 这就是我想要生活的未来:我们可以真正地将个体理解为个体,并直接利用生物学和科学来维护他们的健康。

最终目标是 N=1 医学:为每个人的独特生物学设计的治疗方法,而不是人口水平的统计数据。马克设想这将采取“生物学全模型”的形式,该模型将跨所有维度合并虚拟细胞模型,并在 5-10 年内建立起来。

虚拟免疫系统

免疫系统是 CZI 系统级建模的第一个目标,普莉希拉提出了一个令人信服的理由。它是一个个体细胞相互作用的系统,包括 B 细胞、T 细胞和 NK 细胞等尚未完全了解的细胞类型。它是一个可以到达身体任何部位的“特权系统”。它在两个方向上都具有巨大的临床杠杆作用:当它起作用时,它会使您保持健康;当它出现故障时,您会患上自身免疫性疾病(多发性硬化症、狼疮,甚至可能是痴呆症)。

纽约生物中心已经在这些方面进行细胞工程:对免疫细胞进行编程,使其进入患者的心脏,检查是否有问题的斑块,将结果编码到其 DNA 中,自身裂解,并释放信号作为无细胞 DNA,以进行二元是/否诊断读取。然后,从理论上讲,其他经过工程改造的免疫细胞可以进入并清除斑块。

“I know it sounds sci-fi. It is realistic. It is happening.” 我知道这听起来像科幻小说。但这是现实的。它正在发生。

医生和主动医疗保健的角色

当被问及在这种未来中医生会发生什么时,普莉希拉重新定义了这个问题。人工智能已经非常擅长检测皮肤病变和视网膜问题。未来医生的角色将转向关怀、同情和引导患者理解,回归医生作为使用伟大工具的治疗师的最初使命。

马克进一步放大:整个医疗保健系统需要从被动(在您生病时出现)转变为主动。精准医学并不意味着消除所有细菌或预防每次感染。它意味着在突变变成癌细胞之前将其捕获,在症状出现之前了解疾病风险,并持续管理健康,而不是在危机模式下。

一些想法

主持人 Nathan Labenz 的介绍增加了一些重要的背景信息,而对话本身并未涵盖:这是一个美国联邦政府削减研究预算,并且著名的人工智能研究人员(Jeff Dean、Dario Amodei、Chris Olah)正在公开反对侵犯公民权利的时刻。私人的科学慈善事业不仅仅是锦上添花;它正在成为对抗制度功能失调的关键制衡力量。

  • 马克关于治愈所有疾病的时间表更多地取决于人工智能的进步而不是生物学的进步的见解,是一个悄然激进的说法。这意味着最大的变量不是我们制造显微镜或进行实验的速度有多快;而是模型变得足够好以推理生物学复杂性的速度有多快。

  • “前沿生物学 + 前沿人工智能同步”框架确实是新颖的。大多数人工智能促进科学的举措都将人工智能应用于现有数据。围绕模型需求设计数据收集是一种未被充分认识的战略优势,它解释了为什么 CZI 选择建立机构而不是发放赠款。

  • 普莉希拉将细胞图谱工作描述为“不迷人”且不太可能让任何人获得终身教职论文,这揭示了学术科学中的一个结构性问题:激励系统奖励新颖性而不是基础设施,即使基础设施正在加速整个领域。

  • 关于寿命的问题产生了一次有启发性的交流。马克对此感兴趣;普莉希拉明确表示不感兴趣,更喜欢专注于儿科疾病。他们决定不垂直化于任何特定疾病,而是构建水平工具,这意味着寿命问题留给其他人用他们的工具来回答。这是一个罕见的科技亿万富翁行使真正战略克制的情况。

  • 即使是最聪明的人工智能也无法通过从第一性原理进行推理来解决数据瓶颈。“很多人类知识来自经验,而不是来自第一性原理的推理。”在一个痴迷于扩展计算能力的领域中,这是一个有用的纠正:对于生物学,您也需要扩展数据收集,这需要实际的仪器、实际的实验和实际的科学家坐在一起。

观看原视频 →