實證研究輔助:透過 AI 驅動編碼加速科學發現

實證研究輔助:透過 AI 驅動編碼加速科學發現

科學發現的速度與範圍通常受限於編寫、測試與完善計算實驗時那種乏味且重複的迭代過程。為了應對這一挑戰,Google 推出了 Empirical Research Assistance (ERA),這是一個由 Gemini 驅動的系統,能自動化科學程式碼的優化過程。近期在 Nature 發表的一篇論文中詳細介紹了 ERA,它代表了向「計算發現」(Computational Discovery) 的轉型,在這種模式下,AI 不僅僅是協助編寫程式碼,而是主動優化程式碼以達成特定的科學目標。

ERA 如何運作:超越簡單的程式碼生成

與僅根據提示提供單一建議的標準 AI 編碼助手不同,ERA 是專為科學研究的實證性質而設計的。給定一個科學問題與定義好的成功衡量標準,ERA 會執行以下步驟:

  1. 文獻搜尋:它會掃描科學文獻以識別相關的方法與技術。
  2. 程式碼合成:它會編寫用於解決問題的初始計算程式碼。
  3. 迭代探索:使用樹狀搜尋 (tree search) 方法,ERA 會考慮數千種潛在選項,結合不同的技術並探索各種解決方案。
  4. 評估與優化:它會根據目標持續評估結果,不斷完善程式碼直到達到最佳狀態。

這種迴圈讓 ERA 能夠超越簡單的模式匹配,使其能夠發現人類研究人員可能會忽略的專家級計算模型。

跨學科的專家級表現

為了驗證 ERA 的能力,Google 在多種不同的基準測試中進行了測試,包括基因組學、公共衛生、衛星影像分析、神經科學預測、時間序列預測以及數學。結果顯示,ERA 在所有這些領域都達到了專家級的表現,這表明對於可能不是專業程式設計師的科學家來說,高端的計算建模能力正趨於民主化。

真實世界的科學應用

Google 已將 ERA 應用於多個開放的科學問題,並產出了一系列展示其即時影響力的論文手稿:

公共衛生與環境

  • 流行病學預測:ERA 被用於預測美國醫院因流感、COVID-19 與 RSV 的入院人數。產出的預測結果始終位居 CDC 排行榜的前列或接近頂尖。
  • 加州水資源管理:ERA 為加州由雪水補給的河流流域開發了一套季節性徑流預測模型。該模型表現優於加州官方的季節性供水展望 (Bulletin 120),為關鍵資源提供了更準確的早期預測。
  • 大氣 CO2 地圖繪製:透過利用地球靜止氣象衛星數據,ERA 建立了一個能以空前的解析度繪製 CO2 濃度地圖的模型,捕捉了人類驅動的城市增強效應以及植物的自然吸收週期。

工程與經濟

  • 太陽能優化:透過與 Google Antigravity 合作,ERA 優化了太陽能板的地形設計。它發現了一種「500-triangle volumetric fan」設計,透過捕捉散射輻射且不產生後向遮蔽,實現了能量捕捉的最大化。
  • 零售預測:ERA 將其能力應用於宏觀經濟零售銷售預測,其準確度達到或超過了芝加哥聯邦儲備銀行 (Chicago Fed) 的 CARTS 每月零售預測以及其他商業共識預測。

通往計算發現之路

ERA 現在是 Gemini for Science 計畫下更廣泛工具套件中的基礎組件。它與其他實驗性工具協同工作,例如:

  • Computational Discovery:一個結合 ERA 與 AlphaEvolve 建立的工具,用於自動化計算模型的發現。
  • Hypothesis Generation:由 AI Co-Scientist 驅動,此工具透過提出新假設來協助科學方法的早期階段。
  • Literature Insights:一個旨在簡化現有科學知識合成過程的工具。

透過整合這些工具,Google 的目標是支持科學方法的不同階段——從閱讀文獻、提出假設,到編寫與優化用於證明這些假設所需的實證程式碼。

Sources