AutoGrad 與貝葉斯大腦:Jeff Beck 博士談 AI 的未來

AutoGrad 與貝葉斯大腦:Jeff Beck 博士談 AI 的未來

核心論點:智慧不是函數近似

真正的人工智慧不能僅靠擴大 transformer 或改進函數近似來實現。智慧必須根植於與人類認知相同的領域:物理的、宏觀的世界。Jeff Beck 博士提出從龐大、單一的神經網路轉向「大量小模型」的方式——模組化、以物件為中心的貝葉斯模型,透過發現的力相互作用,類似生物大腦處理現實的方式。

AutoGrad vs. Transformers:真正改變 AI 的是什麼

雖然業界將當前 AI 熱潮歸功於 transformer 架構,Beck 博士卻認為真正的催化劑是 自動微分 (AutoGrad)

AutoGrad 把 AI 開發從理論數學問題轉變為工程問題。透過自動化梯度計算,研究人員得以快速實驗不同的架構、非線性與記憶結構,而不必手動推導學習規則。這種工程上的轉變使模型得以超大規模擴展,進而帶來 transformer 的成功感。Beck 博士指出,其他架構(例如 Mamba——一種狀態空間模型)在規模化後也能達到類似功能,暗示由 AutoGrad 促成的擴展比特定的 transformer 架構本身更為關鍵。

貝葉斯大腦與主動推理

Beck 博士主張人類大腦是一個貝葉斯推理引擎,持續對世界提出假設並加以測試。這一點得到「最佳線索組合」行為實驗的支持:人類能以驚人的效率結合可靠與不可靠的感官資訊(例如視覺與聽覺線索)。

貝葉斯方法的關鍵原則:

  • 假設檢驗:大腦使用以特定假設為條件的生成模型來描述世界。
  • 資訊過濾:大部分腦活動用於決定什麼資訊可以被忽略,以避免資訊過載。
  • 主動推理:基於 Karl Friston 的工作,該框架將資訊理論與統計物理結合,描述代理如何最小化驚訝(surprisal)以維持自身存在。

落腳問題:物理優於語言

當前大型語言模型(LLM)的一個根本缺陷是它們以語言為落腳點。Beck 博士認為語言是思考的劣質模型,因為心理學中的自我報告資料極不可靠;人們常以與實際決策過程不一致的方式解釋自己的行為。

要打造像人類一樣思考的 AI,必須以 宏觀物理 為基礎。這意味著 AI 應將世界視為具有特定關係與可供性(affordances)的物件,而非像素或詞彙。智慧必須具備身體性,因為物理環境提供了「思考的原子元素」——構建更複雜概念模型的基本構件。

「大量小模型」架構

Beck 博士不主張使用單一龐大的神經網路,而是構想一個類似電玩引擎的系統。在此架構中,AI 維持一個包含數千個小型、模組化模型的庫,每個模型代表一個特定物件或物件類別(例如「書本模型」)。

模組化物件模型的優勢:

  • 計算效率:代理只會實例化與當前環境相關的少量模型,保持稀疏性。
  • 系統工程:透過理解物件及其相互作用的力,AI 能執行「系統工程」——將已知物件以新方式組合,創造新事物(例如將翼型與噴射引擎結合成飛機)。
  • 泛化能力:在一個領域學到的模型(例如房子內部)可以移植到另一個領域(例如公園),因為物件本身是模組化的。

解決泛化:倉庫裡的貓

Beck 博士以「倉庫裡的貓」問題說明當前 AI 的失敗。僅在箱子與叉車上訓練的倉庫機器人,遇到貓時通常會撞上或產生幻覺。

在貝葉斯、以物件為中心的系統中,流程如下:

  1. 驚訝偵測:機器人偵測到高驚訝訊號,因為貓不符合任何既有模型。
  2. 知識獲取:機器人「打電話給朋友」(向中央伺服器查詢),下載可能符合視覺資料的物件模型。
  3. 假設檢驗:機器人測試多個候選模型(例如不同貓種),觀察貓的行為直到確定正確模型。
  4. 整合:將貓模型納入機器人本地的模型庫,以供未來使用。

透過信念交換進行對齊

Beck 博士認為傳統的強化學習(RL)對齊——使用獎勵函數——根本有缺陷,因為獎勵值往往是任意的,可能導致退化行為(「惡意精靈」問題)。

他提出一種基於 信念交換 的對齊策略。人類行為是信念與價值的組合,對齊應該涉及明確的信念交換。透過溝通與協調彼此對世界的內部模型,人類與 AI 能夠分辨分歧是源於事實誤解(信念)還是價值差異(獎勵函數),從而實現更透明且穩定的對齊形式。

Sources