AlphaFold 与 AI for Science 的未来:对话 John Jumper
AlphaFold 与 AI for Science 的未来:对话 John Jumper
AlphaFold 在结构生物学中的作用
AlphaFold 是一个专门的机器学习系统,旨在根据氨基酸序列预测蛋白质的三维结构。虽然它经常被描述为“蛋白质折叠问题”的解决方案,但更准确地说,它是一个针对特定类别结构生物学测量值的的高精度预测器。
几十年来,确定蛋白质结构需要昂贵且耗时的实验方法,如 X-ray crystallography,每个结构可能耗资约 100,000 美元并耗时一年。AlphaFold 将这一时间缩短至几分钟,实现了对超过 2 亿个蛋白质结构的预测。这种能力为生物学研究提供了一个起点,允许科学家生成假设,然后通过针对性实验进行验证。
架构与技术演进
AlphaFold 的成功并非源于单一的架构突破,而是生物学假设、几何约束和严苛的经验测试相结合的结果。
AlphaFold 2: Evoformer 与几何学
AlphaFold 2 放弃了 AlphaFold 1 中使用的通用型 CNNs,转向了一种定制架构。关键组件包括:
- Evoformer: 一个使用轴向注意力机制(axial attention)的骨干架构,旨在促进进化数据(Multiple Sequence Alignments 或 MSAs)与几何表示之间的“对话”。
- Invariant Point Attention (IPA): 一种机制,允许模型在与蛋白质主链对齐的局部参考系内的点上进行操作。
- FAPE (Frame Aligned Point Error): 一个关键的损失函数,用于测量每个残基参考系中点之间的距离,相比于全局坐标,它能为训练提供更有效的信号。
消融实验见解与“等变性故事”
John Jumper 指出,虽然几何深度学习和 SE(3) equivariance 经常被归功于 AlphaFold 2 的成功,但消融研究显示它们的影响相对较小。移除等变性会导致 GDT 标度上约 2.5 分的损失,而相比 AlphaFold 1 的总提升约为 30 分。性能的主要驱动力是 Evoformer 和整体系统的集成。
AlphaFold 3 与扩散模型
AlphaFold 3 将“蛋白质电影宇宙”扩展到了包含配体(ligands)、DNA、RNA 和小分子(药物)。虽然在技术上利用了扩散模型(diffusion model)进行最终输出,但 Jumper 认为它并不是一种生成式图像风格的模型。相反,扩散过程之前的庞大网络决定了整体结构,而扩散机制充起到了“几何化引擎”的作用,用于细化局部细节并处理键距。
局限性与“窄预测器”哲学
AlphaFold 并不是细胞的模型,也不是蛋白质折叠生物学过程的模拟。它是一个最终实验结果的预测器。
- 缺乏动力学: 它无法捕捉蛋白质如何随时间移动或改变形状。
- 实验差距: Jumper 表示,在给定的药物靶点上,该模型可能会“十次中有九次出错”。它的价值在于其能够缩小搜索空间,通过“快速失败”让科学家变得“极其高效”。
- 预测 vs. 控制 vs. 理解: Jumper 区分了这三种能力。AlphaFold 提供预测(结果会是什么?)并实现控制(我们如何改变结果?),但理解(推导出一套可传达的紧凑事实集)的行为仍然是一个由人类主导的过程。
挑战“苦涩的教训”
“The Bitter Lesson” 是指利用计算能力(如 scaling laws)的通用型方法最终总会超越人类设计的启发式方法这一理论。Jumper 认为 AlphaFold 2 是相反的例子:一个深度领域特定工程和生物学假设至关重要的系统。
他断言,架构研究仍然至关重要,因为数据是有限的。AlphaFold 2 相对于 AlphaFold 1 的成功——尽管使用了相同的训练数据——证明了架构改进可以等同于“数据量增加 100 倍”。
现实世界的影响:BioStruct Africa
AlphaFold 的效用不仅限于高资源实验室。BioStruct Africa 的 Emmanuel Nji 强调了该工具如何使结构生物学在缺乏昂贵同步加速器或 cryo-EM 设施的地区实现民主化。通过将 AlphaFold 预测与有限的实验数据相结合,研究人员可以将数年的工作压缩至数月,从而加速针对非洲流行疾病(如疟疾和 HIV)的药物研发。