实证研究助手:通过 AI 驱动的代码编写加速科学发现
实证研究助手:通过 AI 驱动的代码编写加速科学发现
科学发现的速度和范围往往受限于编写、测试和改进计算实验过程中枯燥且重复的迭代过程。为了解决这个问题,Google 推出了 Empirical Research Assistance (ERA),这是一个由 Gemini 驱动的系统,能够自动优化科学代码。最近在 Nature 上发表的一篇论文中详细介绍了 ERA,它代表了向“计算发现”的转变,即 AI 不仅仅是辅助编写代码,而是主动优化代码以实现特定的科学目标。
ERA 如何工作:超越简单的代码生成
与仅根据提示词提供单一建议的标准 AI 编程助手不同,ERA 是为科学研究的实证性质而设计的。给定一个科学问题和定义的成功衡量标准,ERA 执行以下步骤:
- 文献搜索:它扫描科学文献以识别相关的研究方法和技术。
- 代码合成:它编写解决问题的初始计算代码。
- 迭代探索:使用树搜索方法,ERA 会考虑数千种潜在选项,结合不同的技术并探索各种解决方案。
- 评估与优化:它根据目标持续评估结果,不断改进代码,直到达到最佳状态。
这种循环机制使 ERA 能够超越简单的模式匹配,使其能够发现人类研究人员可能会忽略的专家级计算模型。
跨学科的专家级性能
为了验证 ERA 的能力,Google 在多种基准测试中对该系统进行了测试,包括基因组学、公共卫生、卫星图像分析、神经科学预测、时间序列预测和数学。结果表明,ERA 在所有这些领域都达到了专家级性能,这表明为那些可能不是专家级程序员的科学家提供了高端计算建模的民主化机会。
现实世界的科学应用
Google 已将 ERA 应用于几个开放的科学问题,并产生了一系列展示其即时影响力的手稿:
公共卫生与环境
- 流行病学预测:ERA 被用于预测美国流感、COVID-19 和 RSV 的住院人数。生成的预测结果始终位居 CDC 排行榜的前列或接近前列。
- 加利福尼亚州水资源管理:ERA 为加利福尼亚州由雪水补给的河流流域开发了一个季节性径流预测模型。该模型表现优于该州官方的季节性供水展望(Bulletin 120),为这一关键资源提供了更准确的早期预测。
- 大气 CO2 绘图:通过利用地球静止气象卫星数据,ERA 创建了一个模型来绘制 CO2 浓度图,其分辨率达到了前所未有的水平,能够捕捉到人类驱动的城市增强效应以及植物的自然吸收循环。
工程与经济
- 太阳能优化:通过与 Google Antigravity 合作,ERA 优化了太阳能电池板的地形设计。它发现了一种“500-triangle volumetric fan”设计,通过捕捉散射辐射且不产生后向遮挡,从而实现了能量捕获的最大化。
- 零售预测:ERA 将其能力应用于宏观经济零售销售预测,其准确度达到或超过了芝加哥联储的 CARTS 月度零售预测以及其他商业共识预测。
通向计算发现之路
ERA 现在是 Gemini for Science 计划下更广泛工具套件的基础组件。它与其他实验性工具协同工作,例如:
- Computational Discovery:一个结合了 ERA 和 AlphaEvolve 构建的工具,用于自动发现计算模型。
- Hypothesis Generation:由 AI Co-Scientist 驱动,该工具通过提出新假设来辅助科学方法的早期阶段。
- Literature Insights:一个旨在简化现有科学知识综合过程的工具。
通过整合这些工具,Google 旨在支持科学方法的不同阶段——从阅读文献和提出假设,到编写和优化证明这些假设所需的实证代码。